はじめに
Microsoft Build 2026 Keynoteのうち、Infrastructureの主要アップデートをいくつかピックアップしてまとめています。
※本記事の一部は、AIによって抽出および要約された情報に基づき作成されています。
はじめに:全体像とInfrastructure
今回のKeynoteでは、「Frontier Intelligence Ecosystem」と呼ばれる5つの階層(スタック)によって構成される新しいコンピューティング・アーキテクチャが提示されました。
Security & observability
Developer tools
Agent runtime
Models • Context • Tools
Infrastructure ← 本記事の焦点
──────────────────────────────────────
Edge | Cloud
基盤の層として上層レイヤーのパフォーマンスと経済性を決定づけるのが「Infrastructure」で、
Edge(端末・OS層)からCloud(Azure)に至るまでの物理的および仮想的な計算資源を指します。
Edgeにおける開発環境とローカル推論では、「Unmetered intelligence on every desk and in every home」ビジョンのもと、
クラウドベースのAPI呼び出しに伴うトークン課金やレイテンシに依存せず、
ローカルインフラを活用してAIエージェントを自律駆動させるビジョンが示されました。
NVIDIA協業による次世代ハードウェアやローカルSLM、更には、自律型AIエージェント向けのセキュアなWindows実行環境等の発表がなされました。
一方クラウド(Azure)側では、Performance = Tokens ∕ ( Watt + $ ) というデータセンター最適化の指標のもと、NVIDIAとの業界先進的なアライアンスに始まり、カスタムシリコンや次世代ネットワークインフラストラクチャについての発表、データ基盤の発表などがなされました。
以下、Edge(端末・OS層)、Cloud(Azure)それぞれのアップデートをピックアップ、整理しています。
参照
- Build 2026 公式ニュースハブ / Book of News: https://news.microsoft.com/build-2026/
第1部:Edge(端末/OS層)発表内容
1-1.NVIDIA協業による次世代SoCとハードウェア
「Unmetered intelligence」やAion 1.0 Planのような高度なローカルモデルを実行するためには、強力な推論能力(FLOPS)と、大規模なコンテキストウィンドウを保持するための広帯域なメモリを備えたローカル・ハードウェア・インフラストラクチャが不可欠。
NVIDIA協業による次世代SoCとハードウェアとしてSurface RTX Spark Dev Boxが発表された。
-
Surface RTX Spark Dev Box:
- NVIDIA RTX Spark superchip搭載 (Blackwell RTX GPU + Grace CPU)
- 128GB ユニファイドメモリ。最大1 PetaflopのAI演算性能
- 120B超パラメータのモデルを100万トークンのコンテキストでローカル実行可能
- 参照URL:
1-2. ローカルSLM
Windows標準のSLMファミリ「Aion」の一員で、従来のWindows OS用SLM Phi Silicaの後継であるSLMモデルが発表された。
一部は 7月にHugging Faceにてオープンウェイトとして公開される方針が示されている。
https://blogs.windows.com/msedgedev/2026/06/02/expanding-on-device-ai-in-microsoft-edge-new-models-and-apis-for-the-web/
-
Aion 1.0 Instruct:
- 日常的なテキストインテリジェンス(要約、リライト、インテント抽出、アクセシビリティ向上)に特化。Windows AI APIsの枠組みを越えてMicrosoft Edgeブラウザにもネイティブ統合
- 従来のモデルと比較してメモリフットプリント縮小、要約速度、レスポンス速度向上
- 参照URL: https://blogs.windows.com/msedgedev/2026/06/02/expanding-on-device-ai-in-microsoft-edge-new-models-and-apis-for-the-web/
-
Aion 1.0 Plan:
- ローカルでのエージェント的推論(Agentic reasoning)およびツール呼び出し(Tool-calling)
- 14B(140億)パラメータ。32Kのコンテキストウィンドウをサポート
- 参照URL: https://blogs.windows.com/msedgedev/2026/06/02/expanding-on-device-ai-in-microsoft-edge-new-models-and-apis-for-the-web/
1-3. Windows上の開発者体験
Windows上のセキュアな自立型エージェント実行環境としてMicrosoft Execution Containers(MXC)が発表された。
なお、NVIDIAからは既に、MXCをベースに統合されたランタイムとして「NVIDIA OpenShell」がWindows向けに提供されている。
https://developer.nvidia.com/blog/build-personal-ai-agents-on-windows-pcs-with-new-tools-from-microsoft-and-nvidia/
- Microsoft Execution Containers(MXC):
- ワークロードに応じてProcess isolation、Session isolation、Virtual machine container / Micro-VM などの分離レベルを提供
- 参照URL: https://blogs.windows.com/windowsdeveloper/2026/06/02/windows-platform-security-for-ai-agents/
第2部:Cloud(Azure)発表内容
データセンター最適化の指標として、Performance = Tokens ∕ ( Watt + $ )が示された。
純粋なピーク性能の追求から、消費電力と投資コストをいかに効率よくトークンという経済的価値に変換できるかへと移行している。
2-1. FairwaterにおけるVera Rubinの実装
- NVIDIAの次世代アーキテクチャである「Vera Rubin NVL72」ラック・スケール・システムを、Azureの「Fairwater」と呼ばれる次世代AIスーパーファクトリー(データセンター)に統合
- Azureは「Vera Rubinシステムを検証用に立ち上げた最初のクラウド」として稼働する
- 1つのラックに72基のRubin GPUと36基のVera CPUを集積し、第6世代NVLinkを通じて超広帯域の通信を実現
- ウィスコンシン州やジョージア州アトランタ等の複数リージョンにまたがるFairwaterにおいて、数十万基の液冷Grace Blackwell GPUシステムもグローバル展開し、単一のAIファクトリーとして稼働させる
- 参照URL:
- NVIDIA GTC関連:
https://blogs.microsoft.com/blog/2026/03/16/microsoft-at-nvidia-gtc-new-solutions-for-microsoft-foundry-azure-ai-infrastructure-and-physical-ai/ - NVIDIA Rubin: https://azure.microsoft.com/en-us/blog/microsofts-strategic-ai-datacenter-planning-enables-seamless-large-scale-nvidia-rubin-deployments/
- Fairwater: https://blogs.microsoft.com/blog/2025/09/18/inside-the-worlds-most-powerful-ai-datacenter/
- NVIDIA GTC関連:
2-2. カスタムシリコン(Maia / Cobalt)
Microsoftのカスタムシリコン(Maia / Cobalt)の第二世代に関する発表がなされた。
-
Maia 200(プレビュー):
- 最新の主要GPUと比較して「トークン単価におけるパフォーマンス(Tokens per dollar)」を30%改善する第2世代AIアクセラレータ
- すでに米国アイオワ州とアリゾナ州で本番稼働しており、GPT-5.5で検証されM365 Copilotを駆動
- 参照URL: https://news.microsoft.com/maia-200/
-
Cobalt 200(プレビュー):
- クラウドネイティブおよびエージェント主導のワークロード(Agentic workloads)向けに設計された市場最高水準のArm64プロセッサ
- 参照URL: https://techcommunity.microsoft.com/blog/AzureInfrastructureBlog/announcing-cobalt-200-azure%E2%80%99s-next-cloud-native-cpu/4469807
2-3. AIネイティブなデータ基盤
HorizonDBのパブリックプレビュー並びに、Fabric DWのGPU統合が発表された。
-
Azure HorizonDB(パブリックプレビュー):
- PostgreSQL互換のフルマネージドDB
- デフォルトでゾーン冗長(マルチゾーン構成)を備え、ストレージは最大128TBまでオートスケール
- プライマリとレプリカにまたがって最大3,072 vCoresまでスケールアウト
- ミリ秒未満のマルチゾーンコミット・レイテンシを実現
- ベクトル検索やAIモデル管理、Foundry/Fabric連携
- 参照URL: https://techcommunity.microsoft.com/blog/adforpostgresql/announcing-azure-horizondb/4469710
-
GPUアクセラレーテッド Fabric DW(近日アーリーアクセス):
- Fabric Data Warehouseの実行エンジンに直接GPUアクセラレーションを統合
- 参照URL: https://community.fabric.microsoft.com/t5/Fabric-Updates-Blog/From-query-acceleration-to-cache-cooldown-Everything-new-in/ba-p/5191621
終わりに
普段の業務の中ではアプリケーション層やモデル層のアップデートに着目することが多いため、改めてMicrosoft Build 2026 Keynoteのうち、Infrastructureの主要アップデートを整理してみました。
主要アップデートのみをピックアップしてまとめていますが、AIの台頭により、インフラのスペックやコスト最適化に対する関心は一層高まっており、トークン生成効率(Tokens / (Watt + $))という経済指標や、ローカル推論との組み合わせによるアプローチには、引き続き注目していきたいと考えています。
また、OpenClawの登場により、エージェント実行を前提としたセキュリティや実行環境の設計についても重要性が増していると感じています。
セキュリティに十分配慮しながら、エージェントやAIワークロードをどのように設計・活用していくべきかも改めてキャッチアップしていきたいと思います。