登場人物
- DJミオ:明るく整理上手。リスナー目線で話をほどくタイプ。
- DJレン:やや技術寄り。背景や構造をつなげて説明するタイプ。
オープニング
DJミオ:
こんばんは、Midnight AI Grooveのお時間です。ナビゲーターはDJミオです。
DJレン:
DJレンです。今夜もAI界隈の空気を、ノイズじゃなくてグルーヴとして届けていきます。
DJミオ:
今日取り上げるのは、AINewsの「not much happened today」という号なんだけど……いやいや、タイトルと違って、読んでみると普通に話題ぎっしりなんだよね。
DJレン:
そう。表向きは「静かな日」なんだけど、実際には、
- OpenAIの推論用カスタムチップ
- AnthropicのSlackネイティブなエージェントUI
- QwenのAgentWorld
- GLM-5.2をはじめとする中国系オープンモデルの存在感
- AIデータセンターへの社会的反発と擁護
- そしてReddit発のローカルLLM・OCR・画像・動画・噂話
と、かなり幅広い。
DJミオ:
しかも冒頭でAINews自身が、「2026年6月23日から24日にかけて、12個のsubreddit、544のTwitterアカウント、そしてDiscordは今回は追加なしをチェックした」って言ってる。
さらに「AINewsは今やLatent Spaceの一部で、過去号検索もできるし、メール頻度も選べますよ」と。
DJレン:
うん。あと最後には、「Discordへのアクセスが今日で止まったから、この形ではもう続けないけど、新しいAINewsを出す」とも言ってる。つまり、情報ソースの構造自体も変化している。
DJミオ:
では今夜は、この号のTwitter Recap、Reddit Recap、Less Technicalな話題まで、全部一本の流れとして整理していきましょう。
1. AI Twitter Recap
OpenAIのJalapeñoチップと、フルスタック化するAIインフラ競争
DJミオ:
まず大きな話題から。OpenAIがJalapeñoという、自社初のLLM推論向けカスタムAIチップを発表した、という話。
DJレン:
これ、かなり重要。しかもBroadcomと組んでいて、用途はChatGPT、Codex、APIトラフィック、それから将来のエージェント製品まで視野に入っている。
メッセージは明快で、「スタックをもっと自前で持つ」ということだね。
DJミオ:
スタックっていうのは、チップだけじゃないんだよね?
DJレン:
そう。AINewsのまとめでは、
- chips
- kernels
- memory
- networking
- scheduling
-
deployment
まで含めて、つまり計算資源の土台から運用までを押さえることで、
「汎用GPUの供給や価格に依存しすぎない体制を作る」という戦略が読み取れる、と。
DJミオ:
@gdb は性能対消費電力の良さを強調していて、@kimmonismus は設計からテープアウトまで9か月という、かなり異例の速さに注目していた。しかもOpenAI自身のモデルがその高速化に役立ったらしい、という話もある。
DJレン:
9か月で高性能ASICを持っていくのは、もし本当なら相当速い。しかもコミュニティ側の“逆算”というか、非公式な読み解きでは、このJalapeñoはTPUに近い構成ではないかと見られている。
DJミオ:
たとえば @scaling01 の推測では、
- レチクル近いサイズのダイ
- HBM3Eが約216GB
- 帯域が約7.1〜7.4TB/s
-
FP4で約10PFLOPS
といった数字が出ていたね。もちろん非公式だけど。
DJレン:
そう、確定情報ではない。でも重要なのは数字の真偽より、最前線のAI研究所にとって“ハイパースケーラー型の推論専用シリコン”が常識になりつつあるというシグナルなんだ。
DJミオ:
つまり「いいモデルを作る」だけじゃなくて、「どう載せるか」「どう回すか」が競争の本体になっている。
DJレン:
その通り。そして同じ日に、コンパイラやランタイムの地図も少し動いた。Chris Lattnerが、QualcommがModularを買収すると発表したんだよね。
一方でModular側は、Mojoのオープンソース化は予定通り進むと言っている。
DJミオ:
ここも意味深いよね。NVIDIA/CUDA一強に対して、垂直統合された推論スタックの競争がもっと本気になるかもしれない、と。
DJレン:
そう。チップ、コンパイラ、ランタイム、サービングまで全部つながっているからね。
さらにインフラ面では、NVIDIAのNeMo AutoModelが、MoEモデルに対して
- Expert Parallelism
- DeepEP
-
TransformerEngine kernels
を使うことで、3.4〜3.7倍の学習スループット向上を実現すると発表した。
DJミオ:
学習だけじゃなく、サービング側でも動きがある。SkyPilotは、所有クラスタをまたいで統一的に推論を提供するEndpointsをローンチ。
Modalは、オープンソースの推論構成が、プロプライエタリな提供者よりレイテンシで勝てると主張。
DJレン:
さらにローカル最適化の文脈では、@jon_durbin が、カスタムのDFLASH draft/speculatorモデルを訓練すると、現実的なデコード速度が30〜50%向上したと報告している。
DJミオ:
ここまで見ると、「モデル性能」よりも、「どれだけ速く、安く、安定して回せるか」の重要性がどんどん増してるね。
DJレン:
うん。フロンティアAIの競争は、もう研究競争だけではなく、フルスタック産業競争になっている、ということ。
2. エージェントUXは“ツール”から“同僚”へ
AnthropicのSlack統合と、権限・監査・ロックイン問題
DJミオ:
次の大きなテーマは、AnthropicのSlackネイティブなエージェント。ここ、単なる「Slackボットが出ました」じゃなくて、UIの考え方そのものが変わってきたという話だった。
DJレン:
そう。@karpathy は、「みんなこの話を過小評価している。これは“ただの機能”でも“ただのSlackボット”でもなくて、組織全体のためのハーネスなんだ」と言っていた。
つまり、チャットUIの中にAIがいるんじゃなくて、組織の仕事の流れそのものにAIが組み込まれる。
DJミオ:
@gallabytes は、Claude Codeが“ペアプロの相棒”に感じられるのに対して、Tagsは“チームを管理する感覚”だと表現していたね。
DJレン:
さらに @dabit3 は、「そのうち人間が明示的にエージェントをタグ付けしなくてもよくなるかも」と踏み込んでいた。
つまり、エージェントの呼び出しが明示操作から常在的な協働へ移る可能性がある。
DJミオ:
でもそこで一気に難しくなるのが、誰として振る舞うのか、何にアクセスできるのかという問題。
DJレン:
Anthropicはそこについて、エージェント固有のIDモデルを説明している。
Claudeは人間ユーザーの“代理ログイン”ではなく、自分自身の資格情報を持つ。
そのIDで行動し、監査可能で、中央からアクセス権を取り消せる。
DJミオ:
一見するとかなり健全そう。監査ログも取れるし、責任の所在も見えやすい。
DJレン:
そう。ただ、賛否両論ある。
@KentonVarda は、「エージェントごとの明示的な権限設定はスケールしない」と主張して、代わりにcapability-based security、つまり能力ベースで細粒度・タスク単位に権限を与える仕組みを推している。
DJミオ:
“このエージェントはSlackにアクセス可、GitHubにアクセス可”みたいな粗い管理じゃなくて、
“このタスクをこの範囲でやるために、この能力だけ一時的に渡す”みたいな考え方だね。
DJレン:
そう。現代のエージェントには、長く生きる恒常的な権限より、限定された能力トークンの束の方が相性がいい、という見方。
一方で @random_walker は、Claude Tagを「すべてを覚えていて、思考するたびに課金される同僚」と表現して、
- 暗黙知のベンダーロックイン
- prompt injectionリスク
- 予算の不透明化
を警告している。
DJミオ:
“会社の知性”が外部ベンダーの共有エージェントに沈殿していくと、抜けられなくなるってことだ。
DJレン:
そうだね。@JubbaOnJeans も、
- 書き込み系アクションの帰属の曖昧さ
- Slackみたいに境界が比較的きれいな環境の外でのアクセス制御の複雑化
を指摘している。
DJミオ:
つまり、UIとしてはすごく自然になってきた。でも自然になればなるほど、セキュリティやコストや責任分界が見えにくくなる。
DJレン:
その通り。
そして面白いのが、それに対するオープン/DIY側の即時反応がすでにあること。
Hugging Faceは、自社内のSlackベースのコーディングエージェントMoon Botを紹介していて、
- self-hosting
- custom tools
- auditable sessions
-
zero lock-in
を強調していた。
DJミオ:
さらに @calebfahlgren が、
- GitHub
- Athena
- analytics
- MongoDB
- Elasticsearch
- HF Buckets
まで含む実運用統合を列挙していた。
DJレン:
要するに、みんなagent-native UXは欲しい。でも、そのハーネスや記憶層まで外部ベンダーに委ねるのは嫌だ、というチームが増えている。
DJミオ:
“エージェントを使いたい”と“組織知を渡したくない”が同時に存在してるわけだね。
3. Qwen-AgentWorld、OpenThoughts-Agent、そしてメモリ
エージェントの次のスケーリング軸
DJミオ:
次はエージェント研究寄りの話。Alibaba QwenがQwen-AgentWorldを発表した。
DJレン:
これはかなり興味深い。Qwenはこれをlanguage world model、つまり“言語世界モデル”として位置づけている。
1つのモデルの中で、
- MCP
- Search
- Terminal
- SWE
- Web
- OS
- Android
という7つの環境をシミュレートする。
DJミオ:
実世界のツールやOSを直接呼ぶ代わりに、その挙動をモデルが“世界”として予測する、という感じか。
DJレン:
そう。Qwenの主張は2本立てで、
- シミュレータ自体を作る
-
世界モデル化をエージェントの事前学習に使う
ということ。
そしてQwen-AgentWorld-35B-A3BとAgentWorldBenchをオープンソース化した。
モデルは35B MoEで、アクティブなのは約3B、コンテキスト長は256K。
DJミオ:
しかも注目結果として、単一ターンの環境予測の学習が、複数ターンのエージェントタスクにも転移して、ドメイン内外のベンチで改善したという。
DJレン:
ここが重要。エージェントは今まで「ツールを呼ぶ」「試行錯誤する」ことに注目が集まりがちだったけど、その前段として、環境がどう反応するかを内部でよくモデル化できるかが効いてくる、という話なんだ。
DJミオ:
Reddit側でも、「たとえば ls -la を打ったらどんな出力が返るかを予測できるなら、モック環境や評価ハーネスに便利」というコメントがあったね。
DJレン:
うん。現実の端末やブラウザを毎回立ち上げなくても、オフライン評価や合成軌跡生成、ツール使用の訓練がしやすくなる。
一部では、Yann LeCun的な世界モデルの発想を、LLMエージェントへ直接持ち込んだものとして見ている人もいる。
DJミオ:
そして別の流れとして、OpenThoughts-Agentも紹介されていた。
DJレン:
こちらは、@iScienceLuvr と @RichardZ412 が取り上げていた、エージェントモデル向けのオープンなデータ整備・訓練パイプラインだね。
100以上の統制されたアブレーションを行い、100K例の学習セットを作って、Qwen3-32Bをファインチューニング。結果として、7つのエージェント系ベンチマークで平均44.8%の精度を達成した。
DJミオ:
実務的に面白い知見も多かった。
- instruction choiceの影響が大きい
- 一番強いベンチマーク教師が、最良の教師とは限らない
- 長い実行トレースが効く
-
出所の多様性が、同じパターンの反復より重要
だったね。
DJレン:
これは現場感があるよね。単に“高品質データ”と言っても、どういう指示文で、どういう軌跡で、どれだけ多様な起源を持つかがかなり効く。
DJミオ:
そして、このセクションの最後に強く出てくるのが、memory。
DJレン:
そう。AINewsでは、「メモリがエージェントの未解決問題として高シグナルな議論を集めている」とまとめている。
例えばWeaviateのEngram GAは、メモリを単なる長文コンテキスト詰め込みではなく、
- 抽出
- 重複排除
- 矛盾調停
- スコープ制御
を行う非同期インフラ層として扱っている。
DJミオ:
“覚えたこと全部をそのまま文脈に入れる”ではなく、“記憶を加工・整理・寿命管理する層”として見るわけだ。
DJレン:
さらに @hwchase17 は、LangSmith/Context Hubで、いわゆるsleep-time compute、つまり“寝ている間の計算”のように、トレースをオフライン解析して、そこからメモリを書き戻すワークフローを紹介していた。
DJミオ:
リアルタイムに全部やるんじゃなくて、後から整理して“明日の自分”のために保存する感じね。
DJレン:
そして @dair_ai が言及していた論文では、エージェントメモリはブラックボックスとして最終タスクの成功だけで評価するのではなく、
- storage
- retrieval
- update
- consolidation
- lifecycle
というデータ管理層全体として評価すべきだと主張している。
DJミオ:
これ、すごく大事だね。今までは“賢いかどうか”が中心だったけど、これからは“何を、どこまで、どう記憶し、どう忘れるか”が差別化ポイントになる。
DJレン:
そう。エージェントの次の競争軸は、能力だけではなく、記憶のシステム設計なんだと思う。
4. 中国のオープンモデルはどこまで来たか
GLM-5.2、Kimi配信、国内計算基盤
DJミオ:
次のまとまりは、中国系オープンモデルの存在感。まずGLM-5.2がかなり強く語られていた。
DJレン:
うん。複数の投稿で、GLM-5.2がいま最強クラスのオープンウェイト候補だと位置づけられている。
CoreWeaveはArtificial AnalysisやAgent Arenaでの上位を強調し、BasetenやCursorで利用可能になったことで、配信・実装面の立ち上がりも早い。
DJミオ:
@nutlope は、GLM 5.2をOpus 4.8とWebタスクで比較して、
- 品質は近い
- 出力トークンは約2倍
- それでもまだ速い
- しかも約3倍安い
と報告していたね。
DJレン:
さらにArenaによると、GLM-5.2 MaxはCode Arena: Frontendでも強い位置にいる。
つまり、知識系だけじゃなく、コーディングやエージェント領域でも“同じ部屋にいる”存在になってきた。
DJミオ:
ただしベンチマークの読み方は慎重に、という話もあった。GLM-5.2はARC-AGI-2でも話題で、@fchollet は「オープンソースモデルとしてはこれまでで最強の結果」と呼んでいたけど、その**22.8%**をどう評価するかは議論が分かれていた。
DJレン:
そう。ある人は「すごい前進」と見るし、ある人は「依然としてフロンティアモデルとの差は大きい」と見る。
でもAINewsが言いたい本質は、単独のベンチ数字ではなく、中国のオープンモデルが、コーディング・エージェント・知識労働の複数領域で継続的に存在感を示しているということだね。
DJミオ:
商用化の面では、MoonshotのKimi APIがAWS Marketplaceに入ったのも大きい。企業調達がしやすくなって、請求の一本化やEDP消化ができる。
DJレン:
これは地味に重要。性能が良くても、企業が買えなければ広がらないから。
そして国内計算資源の話では、@teortaxesTex が、Huaweiが950 SuperPOD級の大規模システムをデモするかもしれないという報告に注目していた。
もし本当なら、中国国内で大規模NPUクラスタを実用レベルの規模で作れることになり、モデル提供の経済性とレジリエンスが大きく改善する。
DJミオ:
つまり、モデルだけじゃなくて、その背後の国産計算基盤も整ってきているかもしれない、という話だね。
5. 政策、才能、フロンティアラボ戦略
規制・蒸留・人材移動
DJミオ:
ここからは政策や人材の話。Anthropicがいろんな意味で中心にいた。
DJレン:
まず政策面では、@kimmonismus が、トランプ時代のAI輸出規制に対する最初の大きな法的挑戦を報じていた。
Legionの主張は、「ホスト型モデルへのアクセスは、モデル重みや技術データの輸出と同じではない」というもの。
DJミオ:
これ、すごく現代的な論点だよね。モデルそのものを渡すのではなく、API越しに使わせることは、輸出なのか何なのか。
DJレン:
そう。AI規制は、重みの移転と能力への遠隔アクセスをどう区別するかが核心になる。
同時に、以前話題になっていたMythosの件についても、Reuters/APの文脈が補足されていた。Anthropicのモデルが、制限付きテスト環境で米国の機微システムの脆弱性を見つけたという話だね。
ただし一部のコメントでは、初期報道は誇張されていた可能性もあると警戒されている。
DJミオ:
派手な見出しに飛びつきすぎず、事実関係と検証条件を見るべき、ということか。
DJレン:
そしてもっと地政学的に大きいのが、蒸留とアクセス制御の話。
同じく@kimmonismusによれば、Anthropicは、Alibaba関連のオペレーターが約25,000の不正アカウントと2,880万件のClaude対話を使って、Qwen級システムへの蒸留を行ったと非難している。
DJミオ:
もし正しければ、これは単なる“規約違反”ではなく、かなり大きいよね。
DJレン:
うん。これは「敵対的蒸留」の議論を、噂レベルから執行・国家戦略レベルに引き上げる話になる。
フロンティアラボにとって、API公開は普及のために必要だけど、それが能力抽出の攻撃面にもなりうる。
DJミオ:
人材面でも動きがあった。Arthur ConmyがAnthropicに参加したのは、アラインメント方面で注目、と。
DJレン:
さらに新ラボも生まれている。
Mirendil AIは2億ドルのシードで立ち上がって、科学向けの自己加速的AI R&Dを掲げている。
イギリスでは、BOLD LabとSOFAIRという2つの国家的基礎AI研究所に、合計6000万ポンドのシード資金が入り、UCL DARKはBOLDに合流する。
DJミオ:
そして商業面では、Bloomberg報道ベースで、Google DeepMindからAnthropicへの人材流出も続いている。
やっぱりスタートアップ的なアップサイドが、最前線の人材を引きつけているんだね。
DJレン:
そう。技術競争だけじゃなく、規制・アクセス・人材・資金のすべてが競争環境を作っている。
6. Top Tweetsまとめ
DJミオ:
AINewsは最後に、その日のTop Tweetsもまとめていたね。ざっと整理すると、
-
OpenAI Jalapeño
その日一番インパクトのある、製品・インフラ両面の発表。 -
GPT-5.5 Instant update
OpenAIが、意図理解、制約処理、会話スタイルを改善した更新版をロールアウト。 -
Qwen-AgentWorld
Qwenが、エージェント向けのlanguage world modelsを発表しオープンソース化。 -
AnthropicのエージェントIDモデル
Slack上のClaudeが固有クレデンシャルと監査証跡を持つ設計を明確化。 -
Cursor x Notion
CursorのタスクをNotionから直接委譲できるようになり、エージェントワークフローが単独チャットアプリではなく、既存チームソフトへ埋め込まれていく流れを示した。
DJレン:
この並びを見るだけでも、2026年のAIの中心が、
- モデルそのもの
だけでなく、 - インフラ
- エージェントUX
-
既存業務ツールへの統合
に移っていることがわかるね。
7. AI Reddit Recap
/r/LocalLlama + /r/localLLM
中国AIチップの地図と輸出規制の“位置追跡”
DJミオ:
ここからReddit。まず /r/LocalLlama と /r/localLLM の話題。1つ目はかなり盛り上がっていた、中国AIチップ企業のマップだね。
DJレン:
投稿では、中国のAIアクセラレータ企業として、
- Huawei Ascend
- Alibaba T-Head
- Baidu Kunlunxin
- MetaX
- Moore Threads
- Biren
- Iluvatar CoreX
の7社を挙げていた。
しかも、多くが直近6か月でIPOしていて、現行世代はおおむねH100級、次世代はH200級を狙っている、という強気の見立て。
DJミオ:
具体的には、
- Huawei Ascend 910C / 910D / 950 のロードマップ
- 国内HBMの話
- Alibabaの16×96GB PG1サーバーで合計1.536TB VRAM
- MetaX C600の144GB HBM3e
- Moore Threads S5000の80GBと1 PFLOPS
- BirenやIluvatarのFP8/FP4やエッジ推論モジュール
といった話が並んでいた。
DJレン:
投稿全体の主張は、中国のAIインフラがNVIDIA/CUDA依存から国産スタックへ移りつつあるというもの。
OAM風モジュール、独自インターコネクト、SMIC製造、高稼働率、そしてQwen/DeepSeek/GLMみたいな中国系オープンウェイトが、まず非NVIDIA向けに最適化されていく可能性も示唆していた。
DJミオ:
ただ、コメント欄はかなり懐疑的。
「それで実際どこで買えるの? 欧州で? AliExpressで?」という実用面の疑問もあったし、もっと本質的には、ボトルネックはソフトウェアスタックだという指摘が強かった。
DJレン:
そう。
- CUDA互換
- ドライバ
- コンパイラ/ランタイムの成熟度
- フレームワーク統合
が揃わないと、ハードのスペックだけでは勝負にならない。
しかも、ある技術的に詳しいコメントは、この投稿が実運用可能性を盛っていると批判していた。
DJミオ:
たとえば、1,536GBの合計VRAMでは、約1,510GBのBF16モデルを動かすには足りないんじゃないか、と。
実際には、ランタイムのオーバーヘッド、KVキャッシュ、アクティベーション、断片化、分散実行のコストが必要だから。
DJレン:
その通り。さらに、Huawei Ascend 950PRについて、仮に128GB VRAM、1.6TB/s、1 PFLOPS FP8だとしても、NVIDIA H200の144GB、4.8TB/s、2 PFLOPS dense FP8に比べると、帯域も演算も大きく劣るという比較もあった。
だから“H100/H200級”という言い方には、かなり留保が必要だというわけ。
DJミオ:
Kunlun M100についても、コアスペックが公開情報から十分追えないとか、vLLM対応が旧世代向けでは、というツッコミ。
Moore ThreadsのC600についても、今出荷されているのは実はC500/C550クラスで、64GB GDDR6程度ではないか、という指摘があった。
DJレン:
そしてそこからHBM3e量産へ飛ぶのは、製造・実装として未証明の大ジャンプ。
要するに、ハードの“ロードマップ”と“現場で回る製品”は違う、ということだね。
DJミオ:
もう1つの注目投稿は、Chip Security Act。これは、米国の最先端AIチップに位置追跡メカニズムを義務付ける法案が、業界の一定の支持を得ているという話。
DJレン:
技術的には、輸出規制対象チップに、ハードウェアまたはファームウェアレベルの位置情報・アテステーション・通報機能を入れる発想だね。目的は、高性能AIチップが制限地域へ横流しされるのを防ぐこと。
DJミオ:
でもコメント欄はかなり否定的だった。「中国に対する競争力を自分で下げるだけでは」とか、「新しいセキュリティ/プライバシー穴を作るだけでは」という反応が多かった。
皮肉っぽく「最高に安全な位置追跡機能だね、セキュリティ問題なんてあるわけないよね」と。
DJレン:
輸出管理を強めるほど、信頼できるハードウェアとは何か、監視機能は攻撃面にならないかという問題が出てくる。非常に難しい。
8. Open Model Releases
Unlimited-OCR と Qwen-AgentWorld
DJミオ:
次はオープンモデル公開の話。まずBaiduのUnlimited-OCR。
DJレン:
これはModelScopeで公開された、MITライセンスの3.3B多言語OCR/文書解析モデル。
単一画像だけでなく、複数ページ文書やPDFもワンショットで処理でき、最大32K出力トークンに対応している。
DJミオ:
GitHubでは、Transformers推論と、OpenAI互換ストリーミングを持つSGLangサービングも案内されていたね。
さらに画像/レイアウト用にbaseとgundamという2つのモードがある。
DJレン:
ただコメントでは、
- PaddleOCR-VL-1.6と比べてどうなのか
- スループットと精度のトレードオフは?
- 32K出力で実際何ページ入るのか
- そもそもgundam modeって何?
- Paddle対応がないのはなぜ?
という疑問が多かった。
DJミオ:
“Hugging Faceのモデルカードはここ”というリンクも貼られていたけど、要するに、公開されたこと自体は歓迎されつつも、比較評価と用語の明確化が求められているわけだね。
DJレン:
そしてもう一つが、ここでも再登場するQwen-AgentWorld-35B-A3B。
Redditでは、これはチャットモデルや自律エージェントそのものではなく、環境応答を予測するための言語世界モデルだと説明されていた。
DJミオ:
MCP、terminal、SWE、Android、web、OS GUIなどで、エージェントの行動に対して環境がどう返すかを予測する。
だから、オフライン評価、合成軌跡生成、ツール利用ワークフローテスト、サンドボックス的訓練に使える、と。
DJレン:
コメントは軽めだったけど、
「ls -la の出力みたいなものを予測させられるなら、実際かなり実用的」
という反応もあったし、
「“あなたは今MCPサーバーです”って言わせてるだけなのでは」という半ば冗談の懐疑もあった。
DJミオ:
でもこの“環境を模擬する”方向性が、実はエージェント能力の土台になりうる、というのが今の面白いところだね。
9. Less Technical AI Subreddit Recap
Krea 2、画像復元の限界、3DからAIアニメへ
DJミオ:
ここからは、やや一般寄りのサブレディットまとめ。まずは画像モデル。
Krea 2のオープンソース化が話題だった。
DJレン:
Kreaは、自社で訓練したオープンソースのtext-to-imageモデル Krea 2を、コードや重みとともに公開した。
配布は krea.ai、GitHub、Hugging Faceチェックポイント。
しかもKrea-2-RawとKrea-2-Turboの両方が出ている。
DJミオ:
研究責任者によると、これはKreaにとって初の完全内製・オープンソースモデル公開。
さらにコミュニティの反応次第で、
- ガイダンス/ステップ蒸留なしのTurbo
- 5B版
- 画像参照
- 編集
- バウンディングボックス
- 文字描画の改善
-
写実性向上
みたいな追加公開も検討中。
DJレン:
コメントでは、特に
- なぜQwen VAEを使って、FLUX.2 VAEではないのか
- 美学・嗜好最適化のために、aesthetic reward modelも公開してほしい
- 画像編集版は出るのか
-
スタイル変換はできるようになるのか
といった透明性や下流制御性への関心が高かった。
DJミオ:
次に印象的だったのが、「自分の写真を老化させて、それを復元させた」という投稿。
DJレン:
これはすごく教育的な例だね。
元のポートレートを意図的に古く傷んだ感じにして、それをChatGPTの画像復元/カラー化で戻させたところ、元の本人に戻るというより、“それっぽい別人”が生成された。
ひげや顔の構造、シャープさなどが幻覚的に補われて、別の高齢男性に見える。
DJミオ:
コメントでも、「AIの復元は忠実な再構成ではなく、劣化入力に条件づけられた生成だ」という理解につながっていた。
顔認識やセキュリティ用途にも危険がある、という指摘もあったし、「ジャック・ブラックっぽい」と冗談も飛んでいた。
DJレン:
別の人は、Geminiで老化させた画像を元フレームにトリミングし直して、NanoBananaProにかけたら、復元としてはかなり良かったとも書いていた。
つまり、フレーミングや前処理も結果に大きく影響する。
DJミオ:
“復元”と言っても、本当はかなり強い生成処理なんだ、という認識が重要だね。
DJレン:
そして動画方面では、日本のアニメーターが簡単な3DモデルからSeedanceでアニメをレンダリングしているという投稿も大きかった。
DJミオ:
元動画リンクは403で見られなかったけれど、コメントではその制作者がTetsurou、しかもTRIGUN STAMPEDEやTRIGUN STARGAZEのクレジットを持つアニメ業界ベテランだと特定されていた。
DJレン:
技術的に重要なのは、これが単なるテキストからの動画生成ではなく、単純な3Dブロッキングが空間・時間的一貫性の土台になっているということ。
その上にSeedanceが見た目を描く。
DJミオ:
だからコメントでも、これは長尺AI映像への現実的な道じゃないか、と言われていた。
3Dでステージングを固定しておけば、プロンプト変更でアニメ風から写実風、レトロコミック風へとスタイルだけ差し替えることもできるかもしれない。
DJレン:
さらに、AIはアニメ制作の中でも特に中割りのような、高コストだけれど創造性の中心ではない工程を支援しうる、という見方もあった。
レイアウト、演技、キーアニメのような人間の意図を残しつつ、量産工程を軽くする方向だね。
DJミオ:
その意味で、このデモは“AIが全部作る”ではなく、経験あるアニメーターがAIをレンダラー/コンポジターとして使う例として読まれていた。
10. AI Datacenter Backlash and Defense
うるさいデータセンター、そしてJohn Carmackの擁護
DJミオ:
次はデータセンターをめぐる社会的な反発。まず、バージニアのデータセンターが24時間ずっと高周波ノイズを出していて、住民が窓にマットレスやプレキシガラスを付けているというニュース。
DJレン:
原因は、報道ベースではオンサイトの天然ガスタービン。その高い唸りが止まらない。
コメントでは、「これはデータセンターそのものの問題というより、発電設備の立地問題だ」という整理が多かった。
DJミオ:
つまり、グリッド接続ではなく自前発電で回しているからうるさいのであって、データセンターは本来、電力・冷却・ネット接続があればどこにでも置ける。
だったら、なぜ住宅地のすぐそばにタービン付きインフラを置くのか、という怒りだね。
DJレン:
そう。工学的に住宅近接が必須なわけではない。だから、ゾーニングや許認可の失敗だという見方になる。
EUやUKなら、こうした産業騒音源にはもっと厳しい環境審査や距離規制が入るはずだ、という比較も出ていた。
DJミオ:
必要なのは、
- より強いゾーニング
- 系統接続の要求
- 防音対策
- あるいは立地変更
という話になっていたね。
DJレン:
そしてもう一つ、John Carmackが、データセンターへの反対運動が、アメリカの反原発感情のようなものになってAIインフラ整備を遅らせるのでは、と投稿して話題になった。
DJミオ:
彼は、データセンター需要はAIによる大きな転換を示すもので、現実の価値と進歩の証拠だと捉えている。
それに対して、Markus “notch” Perssonが「Why?」と返していた、という構図。
DJレン:
コメント欄ではCarmackの立場に全面同意というより、中間的な立場が多かった。
つまり、
- データセンターは必要
- でも住宅地に迷惑をかけない場所に建てるべき
- そして自前の電力と水を確保すべき
という考え方。
DJミオ:
ノイズだけでなく、排熱も論点だったね。
大規模施設を町のそばに置くと、冷却排気や音響負荷が住民生活を圧迫する。
DJレン:
さらに、「今後データセンターを増やすなら、新しい信頼できる発電、特に原子力とセットでやるべきだ」という声も強かった。
AIデータセンターは高くて連続的な負荷を持つから、化石燃料だけで支えるのではなく、クリーンで安定したベースロードを用意すべきだ、と。
DJミオ:
一方で、石油・石炭業界がAI需要を利用して利益を得る構図になってしまう、という警戒もある。
インフラ問題って、技術だけじゃなく、エネルギー政策そのものだね。
11. GeminiとFableの“噂”
DJミオ:
最後は噂話セクション。まず、Gemini 3.5 Proが今週来るという未確認情報。
DJレン:
リーク画像ベースの噂で、内容としては、
- より強いvision / multimodal reasoning
- 改善されたmemory / context retention
- agent workflows
- SVG / frontend generation
- native image model
- Gemini Super App
- そして2.5Mトークンのコンテキストウィンドウ
といった盛り盛りの主張。
DJミオ:
でもコメントはかなり懐疑的。
「まず出してから言って」「リグレッションなしで頼む」「2.5Mはさすがに盛りすぎ、1Mくらいが現実的では」という反応だった。
DJレン:
技術的に面白いのは、あるコメントが「もし本当に強いなら、リークでコーディングベンチマーク首位を強調しないのは不自然」と言っていたこと。
つまり、今の最上位モデル競争では、コード性能が看板指標になっている。
DJミオ:
あと、実運用上の懸念として、「有料Proでも負荷が高いとfallback modelに回されるんじゃないか」という話もあった。
広告されたモデルが常に使えるとは限らない、という不信感だね。
DJレン:
もう一つが、Anthropic系のFable 5復活の噂。
Claude Code v2.1.190の文字列変更から、
「You’ve used your Fable 5 usage for this week」
という文が見つかり、しかも「purchased separately from your plan」が消えていた。
DJミオ:
これがもし本当なら、Fable 5は“別売りの短期アクセス”ではなく、サブスクに週次クォータ付きで含まれる形に変わるかもしれない。
DJレン:
コメント自体はほぼ盛り上がりの域を出ないけれど、唯一具体的だったのは、
「短い期間だけ使えるプランより、少なくても毎週使える枠の方がありがたい」
という意見だったね。
12. AI Discords と締め
DJミオ:
そして最後、AI Discordsの欄では、「今日Discordへのアクセスが止まった。この形では戻さないけれど、新しいAINewsを出していく。ここまで読んでくれてありがとう、良いランだった」と締めていた。
DJレン:
情報収集の導線そのものが変わる、という話でもあるね。
AIニュースって、モデルや製品だけじゃなく、どこから観測するかもどんどん変わっている。
13. 総括
“not much happened”の本当の意味
DJミオ:
さてレン、今夜全体を通して、この号の本質を一言で言うと?
DJレン:
「AI競争の主戦場が、モデル単体から“システム全体”へ移った」かな。
具体的には、
- OpenAIのJalapeñoで見えるハードウェア内製化
- QualcommによるModular買収で示されるコンパイラ/ランタイム層の再編
- NeMo AutoModel、SkyPilot、Modal、DFLASHに見えるサービング最適化競争
- AnthropicやHugging Faceに見えるエージェントUIと権限設計
- Qwen-AgentWorldやOpenThoughts-Agent、Engramに見える環境モデル化とメモリの重要化
- GLM-5.2やKimi、Huaweiの報で見える中国のモデル+配信+計算基盤の一体化
- データセンター議論に見える社会実装とエネルギー問題
- そして輸出規制・蒸留・人材移動という政治経済のレイヤー
まで全部つながっていた。
DJミオ:
ほんとだね。“今日はあまり起きなかった”どころか、むしろAIの次の時代に何が重要かが、立体的に見えた日だったのかもしれない。
DJレン:
そう思う。昔なら「新モデル出ました」で終わった話が、今は
- どのチップで動かすのか
- どんな権限で組織に入るのか
- 何を覚えるのか
- どこでホストされるのか
- 誰がコストを負担し、誰が規制するのか
まで問われる。
AIは完全に社会インフラ化のフェーズへ入っている。
DJミオ:
そしてその中で、オープンソースもDIYも、商用プラットフォームも国家政策も、全部が絡んでくる。
穏やかな一日の顔をして、実はかなり深い地殻変動が進んでいた、というわけです。
エンディング
DJミオ:
というわけで今夜のMidnight AI Grooveは、AINews「not much happened today」をもとに、Twitter Recap、Reddit Recap、Less Technicalな話題まで、まとめてお届けしました。
DJレン:
キーワードを最後に並べるなら、
Jalapeño、Modular、NeMo AutoModel、SkyPilot、DFLASH、Claude in Slack、capability-based security、Moon Bot、Qwen-AgentWorld、OpenThoughts-Agent、memory layer、GLM-5.2、Kimi on AWS、Huawei SuperPOD、export controls、distillation、Krea 2、generative restoration、Seedance、datacenter backlash、Gemini rumors、Fable rumors。
今日は“何も起きてない日”じゃなかったね。
DJミオ:
ほんとに。
それでは皆さん、今夜も記憶は整理して、コンテキストは詰め込みすぎず、よい夜を。
DJレン:
Midnight AI Groove、DJレンでした。
DJミオ:
DJミオでした。おやすみなさい。
