Google DeepMindからNobel賞級の研究者2名が48時間で流出。新しいベンチマークAA-Briefcaseは、最先端AIが現実の知識作業の97%で失敗することを明らかに。OpenAIはPythonツール企業Astral(uv, ruff)を買収しCodexを強化。Anthropic Fable 5禁止の全貌も。
1. Google DeepMind、48時間で2人の巨人を失う
前代未聞の人材流出が発生した。Transformer論文「Attention Is All You Need」の共著者でありGemini共同責任者の Noam Shazeer がOpenAIに移籍。Googleは2024年にShazeerをCharacter.AIから呼び戻すのに約27億ドルを投じていた。その24時間後、AlphaFoldチームを率いた2024年ノーベル化学賞受賞者 John Jumper がDeepMindを離れAnthropicに加わると発表した。
Transformer論文の著者8名全員がGoogleを去り、うち2名がOpenAIに在籍している。JumperのAnthropic移籍は、生物学・化学分野のAI研究がAnthropicの戦略的優先事項であることを示す。両者の退社は、フロンティアAI人材がGoogleから競合へと構造的に流出しているシグナルだ。
— VentureBeat · The Decoder · aidailypost.com
🔗 aidailypost: Jumper、DeepMindからAnthropicへ
🔗 ITHome: Shazeer Google離脱の詳細
2. AA-Briefcase:最先端AIでも知識作業は3%しか成功せず
Artificial Analysisが公開した AA-Briefcaseベンチマーク は、複数週間にわたる知識作業タスクにおけるAIの能力に冷水を浴びせた。最良のモデル Claude Fable 5 でも完全解決率はわずか 3% 。タスクあたりのコストは0.04ドルから31ドル超まで幅がある。
この結果は、ベンチマーク性能と実運用価値の間に深刻なギャップがあることを示している。AIがコーディングベンチマークで優れた成績を続ける一方(GPT-5.6、Opus 4.8)、現実の知識作業は基本的に未解決のままだ。中国のGLM-5.2が3位に入ったのは驚きをもって迎えられた。
— The Decoder · Artificial Analysis
3. OpenAI、Pythonツール企業Astral(uv/ruff)を買収
OpenAIは超高速Pythonツール uv(パッケージインストーラー)と ruff(リンター/フォーマッター)を開発する Astral の買収を発表した。Astralのチームと技術はOpenAIの Codex プラットフォームに統合される。Codexは現在 500万超の週間アクティブユーザー を抱える。
PythonとTypeScriptのコード生成がCodexの主要ユースケースであることから、Python開発ツールの高速化・高信頼化は競合(Claude CodeやCursor)に対する優位性を築く。しかし、開発者コミュニティからはuvとruffのオープンソース将来性に対する懸念の声が上がっている。
— The New Stack · ITHome
4. Anthropic Fable 5禁止の全貌
新たな報道が、Anthropicが Claude Fable 5 と Mythos 5 を全世界で無効化するに至った経緯を明らかにした。発端は米中AIセキュリティ問題ではなく、SK Telecom(韓国最大手通信会社、Anthropicに1億ドル投資)がホワイトハウスから「中国との関係が疑われる」と特定されたことだった。
AnthropicのDario Amodei CEOはDavid Sacks(PCAST共同議長)から「脆弱性を修正するか、自主的にモデルを停止するか」の二者択一を突きつけられたが、両方を拒否。これにより問題は韓国限定から全世界規模の禁止へと拡大した。政権は再公開の条件として「ゼロ脱獄」を要求しているが、セキュリティ専門家はこれを技術的に不可能と見ている。
— The New Stack · Korea JoongAng Daily
🔗 Korea JoongAng Daily: ソウル事務所開設
5. OpenAI:「有益特性」訓練でAIが広範に安全に
OpenAIの研究者は、真実性や修正可能性といった望ましい行動特性に対する強化学習が、AIモデルを複数の無関連領域にわたって安全にすることを実証した。53ベンチマーク中44で安全性スコアが向上し、タスク性能の低下は見られなかった。
この研究は、リスクカテゴリごとに個別の安全メカニズムを構築するのではなく、メタ特性の育成によって広範な安全性向上が可能であることを示唆する。健康データでの訓練が欺瞞耐性も向上させるという分野横断的な効果も確認された。
— The Decoder · aidailypost.com
6. NVIDIA、AIコーディングエージェントでロボット自己学習を実現
NVIDIA、カーネギーメロン大学、UCバークレーの研究者らは、AIコーディングエージェントを使ってロボットが自らの訓練プログラムを生成するという画期的成果を発表した。8台のロボット群は実世界の把持タスクで最大 99% の成功率を達成した。
人間が訓練カリキュラムを書いたりデモデータを収集する代わりに、ロボットがLLMコーディングエージェントを活用してタスク分析、訓練コード作成、反復的自己改善を行う。倉庫物流や製造業、家庭用ロボティクスでの応用が期待される。
— The Decoder
7. Google、6年ぶりにスマートスピーカー復活—Gemini AI搭載
Googleが 6年ぶり(Nest Audio以来2020年)のスマートスピーカーを発表。Gemini AI をコアアシスタントとして搭載し、Amazon Alexa(Novaモデル採用)やApple HomePod(iOS 27でGemini搭載Siri)と競合する。
Gemini統合により自然な会話機能、クエリ間の文脈認識、Google検索によるグラウンディングが可能に。価格帯は前世代Nest Audioの$99を踏襲すると見られ、消費者向けAIハードウェア競争が激化する中での重要な投入となる。
— LLMBase · AI News
