5分で読める · AIシステムアーキテクトが毎日厳選
注力分野: Agentic Infrastructure · AIメモリアーキテクチャ · エンタープライズAI
1. Google、Interactions APIをGeminiモデルのデフォルトインターフェースに昇格
Google DeepMindは、Interactions APIをGeminiモデルとエージェントのデフォルトインターフェースに正式に昇格させ、従来のgenerateContentインターフェースを廃止した。新機能には、LinuxサンドボックスによるManaged Agents、バックグラウンド実行、SearchやMapsとのマルチツール連携、メディア生成機能が含まれる。 — The Decoder
【技術コア】
新たに導入されたFlexモードはレイテンシ許容型ワークロードのコストを50%削減し、Priorityモードは速度を最適化する。この移行は、シングルリクエスト・レスポンスモデルから、マルチターン・ツール拡張・ステートフルな対話パターンへのパラダイムシフトを示している。
【なぜ注目すべきか】
Geminiがエージェントネイティブプラットフォームへと進化していることを意味する。開発者は今後、Interactions APIを標準として採用する必要があり、これまでの実装の見直しが求められる。
2. AnthropicとMicron、AIメモリアーキテクチャの共同設計で提携
MicronとAnthropicは、AIメモリアーキテクチャの共同設計、HBM/DRAM/SSDの複数年供給契約、Micron社内へのClaude導入、そしてAnthropicのSeries HラウンドへのMicron出資を含む戦略的提携を発表した。 — The Decoder · Kersai
【技術コア】
AI推論における最大のボトルネックは演算能力ではなくメモリ帯域と容量になりつつある。今回の提携はこの課題に直接取り組むものである。MicronはAnthropicの学習クラスタにメモリを供給し、AnthropicはMicronの製品設計に知見を提供する循環構造を持つ。
【なぜ注目すべきか】
批判的な見方として、この取引は二つの過熱マーケットを結びつけただけという指摘もある。しかし、メモリアーキテクチャがAIインフラ設計の最優先事項になったことは明確であり、今後のAIチップ戦略に大きな影響を与える。
🔗 The Decoder · Kersai
3. OpenAIとSamsung、過去最大のエンタープライズAI契約—12万人超の従業員に展開
OpenAIは、Samsung ElectronicsがChatGPT EnterpriseとCodexをソフトウェア開発、マーケティング、デザイン、製造部門の12万人以上の従業員に展開する契約を発表した。Codexの「record-and-replay」機能により、非技術系ロールでもAIエージェントの自動化が可能になる。 — The Decoder · xix.ai
【技術コア】
Codexは全世界で週間アクティブユーザー500万人を突破し、韓国では2月以降800%のユーザー増加を記録。SamsungのグローバルDX部門全体が対象となり、半導体マーケティングからスマートフォン設計までをカバーする。
【なぜ注目すべきか】
エンタープライズAIが実験的パイロットから全社展開へと移行したことを示すマイルストーンである。特に、Codexが非技術職にも拡大している点は、AIエージェントの適用範囲が急速に広がっている証拠と言える。
🔗 The Decoder · xix.ai
4. Sakana AIの「Fugu」、複数LLMを orchestration し最先端モデルに匹敵
東京拠点のSakana AIは、複数の小型LLMを統合する新システム「Fugu」を公開した。単一の巨大モデルをスケールする代わりに、サブタスクを専門化された小型モデルに動的にルーティングし、AnthropicのFable 5やMythos 5に匹敵するベンチマーク性能を達成する。 — The Decoder
【技術コア】
Fuguはモデル合成とエージェントルーティングという業界全体のトレンドを体現している。進化生物学や群知能から着想を得たSakana独自のバイオインスパイア設計手法による成果である。
【なぜ注目すべきか】
このアプローチが本番環境でもベンチマーク同等の性能を維持できれば、「最前線の性能には巨大モデルが必須」という前提を覆す可能性がある。1兆パラメータ級クラスタにアクセスできないチームにとって、市販コンポーネントで最前線に迫る現実的な道筋を示している。
5. Microsoft、テキサス州に2ギガワット級データセンターを建設—自家発電所を併設
Microsoftは、テキサス州ペコスに最大2ギガワットの電力を消費する大規模データセンターキャンパスの建設を開始した。 strainedな公共送電網を回避するため、Chevronが供給する天然ガス発電所をオンサイトに建設する。 — The Decoder
【技術コア】
クローズドループ冷却、地域電気料金の値上げなし、正味水使用量プラスを約束。2026年に他のデータセンタープロジェクトが地域の反対で頓挫した教訓を踏まえた対策である。
【なぜ注目すべきか】
AIの学習と推論のエネルギー需要が驚異的な規模に達していることを示す。チップ効率が向上しても、デプロイ規模の拡大がそれを上回っている。送電網の制約がハイパースケールAI拡大の重大リスクとなり、自家発電が戦略的必須事項になりつつある。
6. Five Eyes、先端AIが数ヶ月でサイバー作戦を変革すると警告
ファイブ・アイズ情報同盟(オーストラリア、米国、英国、ニュージーランド、カナダ)は、先端AIモデルが攻防両面のサイバー能力を「数ヶ月以内に、数年ではなく」根本的に変革するとの共同声明を発表した。 — The Decoder
【技術コア】
米国政府がAnthropicのFable 5およびMythos 5モデルへの外国アクセスをブロックしたことを受けての警告。AIによるサイバー作戦(自動脆弱性発見、適応型マルウェア生成、大規模リアルタイムソーシャルエンジニアリング)が実用段階に近づいていることを示唆する。
【なぜ注目すべきか】
通常慎重な情報機関が異例の緊急性をもって警告を発した点が重要。企業のセキュリティチームにとって、AIを活用した防御(シグネチャベース検出ではなく)がもはや選択肢ではなく必須となる脅威環境の激変を意味する。
7. 月之暗面の1兆パラメータKimi K2.6、Mac Studio 4台で動作—WWDC2026
WWDC2026で、LM StudioとAppleは月之暗面(Moonshot AI)の1兆パラメータKimi K2.6(MoEアーキテクチャ、活性化パラメータ32B)を、4台のMac Studioクラスタ(1.5TBユニファイドメモリ)で毎秒約28トークンの速度で動作させるデモを披露した。 — xix.ai
【技術コア】
Appleの新プロトコルLM Linkを使用し、iPhoneやMacBook Neoからクラスタにリモートアクセス可能。すべてのデータ処理はローカルに保持される。4台のMac Studioで約4万ドルと、クラウドGPUクラスタと比較して劇的に低コスト。
【なぜ注目すべきか】
消費者グレードのハードウェアでの1兆パラメータ推論が理論ではなく現実になったことを証明した。AppleのユニファイドメモリアーキテクチャとMoEモデル設計の組み合わせは、オンプレミス展開、プライバシー重視、低遅延要件のユースケースに新たな可能性を開く。
🔗 xix.ai
