エージェント時代のクラウド基盤刷新——ファーウェイ・クラウドの新インフラ発表から読む「底層の作り直し」
AIエージェントが使いにくい根本原因は、モデルやプロンプトではなくインフラ層にある——ファーウェイ・クラウドの今回の発表は、その診断を正面から引き受けた内容だった。
要点 (事実のみ)
- 2026年6月5日、ファーウェイ・クラウドは上海INSPIREカンファレンスでAgentic AI向けインフラ4製品を発表。AICS霊衢智算クラスター(推論レイテンシ10ms以下、10万カード規模、200 EFLOPS)、AMS Agentic記憶ストレージ(PBスケール、業界比50%性能向上、キャッシュヒット率95%)、CCE Volcano Next(調度エンジン、リソース利用率30%向上)、AgentSphere(カーネルレベルサンドボックス、100ms起動、毎分10万サンドボックス生成・破棄)を発表した。
- ModelArts Nextはモデルルーティング精度95%超、API呼び出しコスト平均20%以上削減、ハードウェアTEEによる機密推論(クラウドベンダーの運用担当者もデータに触れない設計)を含む。
- 行業AIドリームファクトリーとして、医療(上海瑞金医院の病理モデル、従来の1/10のデータ量で訓練可能)、具身知能(CloudRobo、世界初の全工程ロボット開発プラットフォームと主張)、科学計算、スマート製造の4専区を発表。
- 「智果園(ZhiGuoYuan)」はAgentがクラウドリソースを自律購入・設定・管理するための入口として設計されており、人間ではなくAgentを主体ユーザーと位置づけている。
- ハイブリッドクラウド向けに「企業向けエージェント対応混合云構築」白書も同時発表。ファーウェイ・クラウドStackは全世界5500社超の顧客を持つ。
徐 聖博の見解
今回の発表で私が最も注目したのは、「智果園」の設計思想だ。クラウドコンソールの操作主体をAgent(AIエージェント)に置き換えるという発想は、現時点では実験的に聞こえるが、方向性として筋が通っている。
私自身、Xincereでエージェント事業の初期実験を進めるなかで痛感しているのは、「モデルが賢くなっても、その下で動くインフラがエージェントの動作モデルに対応していないと、結局プロダクション投入ができない」という問題だ。メモリの揮発性、長時間タスクのセッション管理、サンドボックスなしのツール実行——これらは全部「エージェントを試したが業務には乗せられなかった」という経験の構造的な原因になる。今回ファーウェイ・クラウドが「算力・記憶・調度・安全」を4本柱として明示した整理は、開発者が問題を言語化するうえで参照しやすいフレームだと思う。
一方で、発表された数値(200 EFLOPS、ヒット率95%、コスト20%削減)はいずれも自社発表値だ。研究者出身の立場として言えば、これらは「制御された条件下でのベンチマーク」である可能性が高く、実際の業務ワークロードでの再現性は別途検証が必要だ。AMS記憶ストレージの「業界比50%性能向上」やVolcano Nextの「リソース利用率30%向上」も、比較対象と測定条件が開示されるまでは割り引いて読むべきだろう。
日本の中小〜中堅企業の観点では、これらのインフラは直接採用するというよりも、「エージェントを本番に乗せるには何が必要か」を考えるための参照点として使うのが現実的だ。算力の問題はAWS/GCPの新世代インスタンス、記憶の問題はベクターDB+セッション永続化、安全の問題はFunctionレベルのサンドボックスで部分的に代替できる。今すぐ万カードクラスターは不要だが、「AgentをPoCで終わらせないための設計」を始める段階に来ていることは、ファーウェイ・クラウドの発表が間接的に示している。
(編集レンズ: 実装・運用視点 / 発注側・中小企業への含意)