はじめに
Microsoft Build 2026 Keynoteのうち、主要アップデートをいくつかピックアップしてまとめています。

※本記事の一部は、AIによって抽出および要約された情報に基づき作成されています。
目次
- 第1部:Infrastructure - Edge(端末/OS層)発表内容
- 1-1. NVIDIA協業による次世代SoCとハードウェア
- 第2部:Infrastructure - Cloud(Azure)発表内容
- 2-1. FairwaterにおけるVera Rubinの実装
- 2-2. カスタムシリコン(Maia / Cobalt)
- 2-3. データ基盤
- 第3部:Agent Runtime 発表内容
- 3-1. クラウドにおけるAgent Runtime: Foundry Hosted Agentsアップデート
- 3-2. 常時稼働型Autopilot「Microsoft Scout」の発表
- 3-3. Windows上のAgent実行環境 Microsoft Execution Containers(MXC)
- 第4部:Models 発表内容
- 4-1. MAIファミリーとProject Polaris
- 4-2. ローカルSLM
- 第5部:Context 発表内容
- 5-1. 「Web IQ」発表と「Microsoft IQ」体系化
- 終わりに
はじめに:全体像
今回のKeynoteでは、自律型エージェントを支える5つの階層(スタック)が「Frontier Intelligence Ecosystem」として提示されました。
単一の革新的な技術やモデルを発表することにとどまらず、インフラストラクチャからエージェントの開発・実行基盤、業界特化型のデータガバナンスに至るまで、
フルスタックのインフラストラクチャが垂直統合されています。
Security & observability
Developer tools
Agent runtime
Models • Context • Tools
Infrastructure
──────────────────────────────────────
Edge | Cloud
Infrastructure
基盤の層として上層レイヤーのパフォーマンスと経済性を決定づけるのが「Infrastructure」で、
Edge(端末・OS層)からCloud(Azure)に至るまでの物理的および仮想的な計算資源を指します。
Edgeにおける開発環境とローカル推論では、「Unmetered intelligence on every desk and in every home」ビジョンのもと、
クラウドベースのAPI呼び出しに伴うトークン課金やレイテンシに依存せず、
ローカルインフラを活用してAIエージェントを自律駆動させるビジョンが示されました。
NVIDIA協業による次世代ハードウェアやローカルSLM、更には、自律型AIエージェント向けのセキュアなWindows実行環境等の発表がなされました。
一方クラウド(Azure)側では、Performance = Tokens ∕ ( Watt + $ ) というデータセンター最適化の指標のもと、NVIDIAとの業界先進的なアライアンスに始まり、カスタムシリコンや次世代ネットワークインフラストラクチャについての発表、データ基盤の発表などがなされました。
Models・Context・Tools / Agent Runtime
自律型エージェントの構成要素は、推論基盤のModels、企業の業務プロセスや最新の市場動向に関するContext、そして安全な実行環境であるToolsの3要素として整理され、
セキュアで再現可能なAgent実行環境としてのAgent Runtimeがここに加わっています。
Agentの推論エンジンであるModelsにおいては、Claudeはじめとした3rd Partyモデルの活用や、Fireworks.AIによるOSSモデルのホスティングに加え、
Microsoftフルスタック開発の推論モデル・マルチモーダルモデルから、エッジデバイスで完全にローカル稼働する小規模モデルまで、ワークロードの性質に応じたハイブリッドなマルチモデル展開アーキテクチャが確立されました。
また、Contextにおいては、既存のFoundry IQ(非構造化データ)、Fabric IQ(データレイク及びオントロジー)、Work IQ(Microsoft 365)に、新たにWeb IQが加わり、
ユーザのプロンプトをもとに、決められた拡張データソースからデータを取得する旧来のRAGとは異なり、
ユーザーの明示的なプロンプトがなくとも、必要な複数のデータソースからのグラウンディング計画を立案・実行し、ユーザーの意図に沿った結果を出力することが可能となっています。
参照
- Build 2026 公式ニュースハブ / Book of News: https://news.microsoft.com/build-2026/
第1部:Infrastructure - Edge(端末/OS層)発表内容
1-1.NVIDIA協業による次世代SoCとハードウェア
「Unmetered intelligence」やAion 1.0 Planのような高度なローカルモデルを実行するためには、強力な推論能力(FLOPS)と、大規模なコンテキストウィンドウを保持するための広帯域なメモリを備えたローカル・ハードウェア・インフラストラクチャが不可欠。
NVIDIA協業による次世代SoCとハードウェアとしてSurface RTX Spark Dev Boxが発表された。
-
Surface RTX Spark Dev Box:
- NVIDIA RTX Spark superchip搭載 (Blackwell RTX GPU + Grace CPU)
- 128GB ユニファイドメモリ。最大1 PetaflopのAI演算性能
- 120B超パラメータのモデルを100万トークンのコンテキストでローカル実行可能
- 参照URL:
第2部:Infrastructure - Cloud(Azure)発表内容
データセンター最適化の指標として、Performance = Tokens ∕ ( Watt + $ )が示された。
純粋なピーク性能の追求から、消費電力と投資コストをいかに効率よくトークンという経済的価値に変換できるかへと移行している。
2-1. FairwaterにおけるVera Rubinの実装
- NVIDIAの次世代アーキテクチャである「Vera Rubin NVL72」ラック・スケール・システムを、Azureの「Fairwater」と呼ばれる次世代AIスーパーファクトリー(データセンター)に統合
- Azureは「Vera Rubinシステムを検証用に立ち上げた最初のクラウド」として稼働する
- 1つのラックに72基のRubin GPUと36基のVera CPUを集積し、第6世代NVLinkを通じて超広帯域の通信を実現
- ウィスコンシン州やジョージア州アトランタ等の複数リージョンにまたがるFairwaterにおいて、数十万基の液冷Grace Blackwell GPUシステムもグローバル展開し、単一のAIファクトリーとして稼働させる
- 参照URL:
- NVIDIA GTC関連:
https://blogs.microsoft.com/blog/2026/03/16/microsoft-at-nvidia-gtc-new-solutions-for-microsoft-foundry-azure-ai-infrastructure-and-physical-ai/ - NVIDIA Rubin: https://azure.microsoft.com/en-us/blog/microsofts-strategic-ai-datacenter-planning-enables-seamless-large-scale-nvidia-rubin-deployments/
- Fairwater: https://blogs.microsoft.com/blog/2025/09/18/inside-the-worlds-most-powerful-ai-datacenter/
- NVIDIA GTC関連:
2-2. カスタムシリコン(Maia / Cobalt)
Microsoftのカスタムシリコン(Maia / Cobalt)の第二世代に関する発表がなされた。
-
Maia 200(プレビュー):
- 最新の主要GPUと比較して「トークン単価におけるパフォーマンス(Tokens per dollar)」を30%改善する第2世代AIアクセラレータ
- すでに米国アイオワ州とアリゾナ州で本番稼働しており、GPT-5.2で検証されM365 Copilotを駆動
- 参照URL: https://news.microsoft.com/maia-200/
-
Cobalt 200(プレビュー):
- クラウドネイティブおよびエージェント主導のワークロード(Agentic workloads)向けに設計された市場最高水準のArm64プロセッサ
- 参照URL: https://techcommunity.microsoft.com/blog/AzureInfrastructureBlog/announcing-cobalt-200-azure%E2%80%99s-next-cloud-native-cpu/4469807
2-3. データ基盤
高負荷なマルチエージェント処理に耐えうるスケーラブルなAgent Native DB / DWHとして、HorizonDBのパブリックプレビュー並びに、Fabric DWのGPU統合が発表された。
-
Azure HorizonDB(パブリックプレビュー):
- PostgreSQL互換のフルマネージドDB
- デフォルトでゾーン冗長(マルチゾーン構成)を備え、ストレージは最大128TBまでオートスケール
- プライマリとレプリカにまたがって最大3,072 vCoresまでスケールアウト
- ミリ秒未満のマルチゾーンコミット・レイテンシを実現
- ベクトル検索やAIモデル管理、Foundry/Fabric連携
- 参照URL: https://techcommunity.microsoft.com/blog/adforpostgresql/announcing-azure-horizondb/4469710
-
GPUアクセラレーテッド Fabric DW(近日アーリーアクセス):
- Fabric Data Warehouseの実行エンジンに直接GPUアクセラレーションを統合
- 64ユーザー同時実行時など高負荷なベンチマークにおいて、他社比で最大7倍の高速クエリパフォーマンスを記録
- 基礎となるアーキテクチャ(CoddSpeed)は、国際会議ACM SIGMOD 2026にてBest Industry Paperを受賞。
- 参照URL: https://community.fabric.microsoft.com/t5/Fabric-Updates-Blog/From-query-acceleration-to-cache-cooldown-Everything-new-in/ba-p/5191621
第3部:Agent Runtime 発表内容
3-1クラウドにおけるAgent Runtime: Foundry Hosted Agentsアップデート
-
Hosted Agentsのアップデート:
- Direct Code Deployment:
- 開発者はDockerコンテナを用意することなく、Python(3.13 / 3.14)または.NET 10のプロジェクトをZIP化してアップロードするだけでエージェントを展開
- Azure Developer CLI (azd) を用いることで、わずか2つのコマンドでインフラ構築からアクティブ状態のポーリングまでが完了
- 通信プロトコルの体系化とVoice Live統合:
- テキストやTeams向けの「Responsesプロトコル」、Webhook向けの「Invocations (HTTP)プロトコル」に加え、新たに「Invocations (WebSocket)プロトコル」が追加
- Voice LiveやPipecatといったフレームワークと連携した低遅延のSpeech-to-Speechエージェントの構築が容易に
- Agent Optimizer:
- 本番稼働前のエージェントのプロンプトと挙動を自動的にテスト・最適化する機能。設定した合否基準に基づく評価ループを回し、失敗したタスクから新たな構成候補を生成・評価し、最適な設定を提案
- 参照URL:
- Direct Code Deployment:
3-2 常時稼働型自律エージェント「Autopilot」である「Microsoft Scout」の発表
OSSの自律型エージェント「OpenClaw」のアーキテクチャを基盤とし、
Entra ID並びにMicrosoft 365のナレッジグラフである「Work IQ」と連携された「Microsoft Scout」を発表。
ローカルファイルアクセスやブラウザ自動化ツールとの連携、ローカルShellを活用したコマンド実行やシステム操作が可能に
3-3. Windows上のAgent実行環境 Microsoft Execution Containers(MXC)
Windows上のセキュアな自律型エージェント実行環境としてMicrosoft Execution Containers(MXC)が発表された。
なお、NVIDIAからは既に、MXCをベースに統合されたランタイムとして「NVIDIA OpenShell」がWindows向けに提供されている。
https://developer.nvidia.com/blog/build-personal-ai-agents-on-windows-pcs-with-new-tools-from-microsoft-and-nvidia/
- Microsoft Execution Containers(MXC):
- ワークロードに応じてProcess isolation、Session isolation、Virtual machine container / Micro-VM などの分離レベルを提供
- 参照URL: https://blogs.windows.com/windowsdeveloper/2026/06/02/windows-platform-security-for-ai-agents/
第4部:Models 発表内容
4-1 MAIファミリーとProject Polaris
Microsoft AI(MAI)チームは、他社モデルからの蒸留(ディスティレーション)を一切行わず、独自のクリーンな商用ライセンスデータを用いてフルスクラッチで学習させたファーストパーティモデルを発表。
MAI-Thinking-1、MAI-Code-1-Flash、MAI-Image-2.5、MAI-Image-2.5-Flash、MAI-Transcribe-1.5、MAI-Voice-2、MAI-Voice-2-Flash の7モデルが展開された。
-
MAI-Thinking-1:
- 35Bパラメータ/256KコンテキストウィンドウのMoEアーキテクチャ
- Microsoft初の自社製推論特化モデル。複雑な論理推論および多段的なエージェント・オーケストレーションを担う
- 参照URL:
-
MAI-Code-1-Flash:
- 軽量かつ高速なコーディング特化型の小規模モデル。 GitHub Copilotの各プランにおける軽量なコーディング支援および高速な補完タスク。
-
MAI-Image-2.5:
- 画像生成モデル。特定のベンチマークで既存の最高性能モデル(Nano Banana等)を上回る。マルチモーダルエージェントによる動的UI生成、高精細なメディア処理
-
MAI-Voice-2 / Transcribe-1.5:
- 音声合成および音声認識特化モデル。多言語でのリアルタイム処理に最適化。
- 音声インターフェースを持つ対話型エージェント、および会議のリアルタイム文字起こしと要約。
4-2. ローカルSLM
Windows標準のSLMファミリ「Aion」の一員で、従来のWindows OS用SLM Phi Silicaの後継であるSLMモデルが発表された。
一部は 7月にHugging Faceにてオープンウェイトとして公開される方針が示されている。
https://blogs.windows.com/msedgedev/2026/06/02/expanding-on-device-ai-in-microsoft-edge-new-models-and-apis-for-the-web/
-
Aion 1.0 Instruct:
- 日常的なテキストインテリジェンス(要約、リライト、インテント抽出、アクセシビリティ向上)に特化。Windows AI APIsの枠組みを越えてMicrosoft Edgeブラウザにもネイティブ統合
- 従来のモデルと比較してメモリフットプリント縮小、要約速度、レスポンス速度向上
- 参照URL: https://blogs.windows.com/msedgedev/2026/06/02/expanding-on-device-ai-in-microsoft-edge-new-models-and-apis-for-the-web/
-
Aion 1.0 Plan:
- ローカルでのエージェント的推論(Agentic reasoning)およびツール呼び出し(Tool-calling)
- 14B(140億)パラメータ。32Kのコンテキストウィンドウをサポート
- 参照URL: https://blogs.windows.com/msedgedev/2026/06/02/expanding-on-device-ai-in-microsoft-edge-new-models-and-apis-for-the-web/
第5部:Context 発表内容
5-1 「Web IQ」発表と「Microsoft IQ」体系化
自律型エージェントは、企業の業務プロセスや最新の市場動向に関する「コンテキスト(文脈)」を正確に理解することによって、
ユーザーの明示的なプロンプトがなくとも、必要な複数のデータソースからのグラウンディング計画を立案、実行し、
ユーザの意図に沿った結果を出力することが可能となる。
Microsoftはこれを「Microsoft IQ」という4層のコンテキスト・レイヤーとして体系化した。
-
Microsoft IQ
-
以下4層のコンテキスト・レイヤーが統合されたSLAに裏打ちされた単一のエンドポイントを通じて提供されるため、データサイロの発生を防ぎ、組織全体で一貫した論理的推論を可能にする
-
Web IQ(New):
- AIネイティブに再設計されたWeb検索スタックであり、モデル非依存でリアルタイムの外部情報をエージェントに提供
- Work IQ:
- Microsoft 365のデータグラフから、従業員の働き方、コラボレーションのパターン、およびチーム間のワークフローをリアルタイムで抽出・理解
- Fabric IQ:
- Microsoft Fabric上の構造化データに基づき、ビジネスエンティティのプロパティと関係性を定義する「オントロジー」を提供
- Foundry IQ
- 企業固有のポリシー文書マニュアル、非構造化データに基づく知識検索基盤を提供
-
Web IQ(New):
-
終わりに
Microsoft Build 2026 の Keynote 発表は、単一の目玉機能や新モデルを中心としたものというよりも、自律型エージェントを本番環境で動かすためのフルスタック基盤を提示する内容だったと捉えています。
Infrastructure の観点では、ローカルおよびクラウドの双方でエージェントを実行・開発・制御するための、スケーラブルなコンピュート基盤が示されました。
さらに、Agent の構成要素としては、Microsoft Foundry Hosted Agents、Microsoft Scout、Microsoft IQ、各種モデルファミリーなどを通じて、エージェントを構築し、文脈を与え、安全に実行し、継続的に改善するためのレイヤーが整備されつつあります。
また、OpenClaw の登場以降、エージェントの開発環境・実行環境における分離やセキュリティへの関心が高まる中で、WindowsベースのAgent開発・実行環境に関するアップデートが数多く発表された点も印象的でした。
加えて、Microsoft Scout を通じて、OSS発の自律型エージェント技術をエンタープライズ向けに取り込み、Microsoft 365やEntra ID、ガバナンス機能と統合して提供しようとしている点も、印象に残るアップデートとなりました!