DJレン:
こんばんは。深夜のAI電波航路へようこそ。「Midnight AI Groove」、ナビゲーターのDJレンです。
DJミオ:
そしてお相手はDJミオです。今日のテーマは、AINewsの「not much happened today」。タイトルは静かだけど、中身はちゃんと濃い。
今回は2026年5月20日から5月21日のAI界隈をまとめた内容をもとに、XことAI Twitter、Reddit、そして業界インフラの流れまで、一気に見ていきます。
DJレン:
冒頭の空気感からいくと、この日は「大事件は少なめ」。AINews側でも、12のサブレディット、544のTwitterアカウントをチェックして、Discordは追加なし。
しかも最後には、Discordからのアクセスが打ち切られ、この形では復活させず、新しいAINewsを出す予定という告知も入っていた。静かな日だけど、転換点っぽさはあるね。
DJミオ:
うん。そして今回の全体像を先に言うと、話題は大きく分けて、
- AI Twitterでの研究・モデル・エージェント・インフラの話
- Reddit、とくにLocalLlama界隈のQwen祭り
-
やや非技術寄りコミュニティでのClaude Codeや雇用・水資源の話
この3本柱って感じ。
1. AI Twitter Recap:研究、モデル、数学、エージェント、インフラ
DJレン:
まずはAI Twitter Recap。最初の塊は、モデル・ベンチマーク・研究アップデート。
ここで目立ったのがRAEv2、Gated DeltaNet-2、トークナイゼーション研究、データフィルタリング、そして数学研究へのAI応用だ。
RAEv2 と representation-first tokenization
DJミオ:
RAEv2は、Representation Autoencodersの発展形として注目されていたね。
評価としては、10倍以上速い収束、再構成の改善、生成性能の改善。しかも対象が単なる画像再構成だけじゃなくて、text-to-imageやworld modelsまで広がっているのがポイント。
DJレン:
さらに中国語の要約では、主な発見が3つに整理されていた。
1つ目は、エンコーダの最終層だけでなく最後のK層を足し合わせると、追加の推論コストなしに再構成と生成が両方よくなる。
2つ目は、RAEとREPAは競合ではなく補完的で、意味表現と空間構造のそれぞれに効く。
3つ目は、REPAは外部の弱いモデルによるガイダンスを追加で回すのではなく、内部的なself-guidanceとして書き換えられるという話。
DJミオ:
あと、評価の観点も大事だった。FID以外の評価軸が必要で、表現を活用したピクセルデコーダにはまだ伸びしろがあるんじゃないか、という問題提起も出ていたね。
標準attentionとtokenizer前提への代替案
DJレン:
次が面白い。NVIDIAのGated DeltaNet-2。これはlinear attention系で、消去と書き込みの操作を分離し、チャネル単位のゲートを入れる設計。
結果として、1.3BパラメータでKDAやMamba-3を上回り、言語モデリングや常識推論、さらにRULERでの長文コンテキスト検索でも強かった。
DJミオ:
つまり、「Transformerの標準attention以外にも、ちゃんと戦える方向があるよね」という流れの一例。
それに並ぶ話として、Nous Researchのトークナイゼーション研究も印象的。
サブワードトークナイゼーションの利点について、byte-levelの1.7Bパイプライン上で7つの仮説を統制実験したけど、実際に検証損失を動かしたのは7つ中3つだけだった。
DJレン:
つまり、「サブワードが効くのは当たり前」で済ませず、何が本当に効いているかを切り分け始めたってことだね。
DCLM と「最良のデータフィルタは無フィルタかもしれない」
DJミオ:
ここで少し挑発的なのが、DCLMのスケーリング結果。
要するに、十分な計算資源があるなら、最良のデータフィルタは“フィルタなし”かもしれないという話。
インターネット規模のデータプールだと、そのクロスオーバーがおよそ1e30 FLOPsあたりに来るという予測まで出ていた。
DJレン:
下流評価はノイジーだけど、方向性としては一貫してる、と。
これはデータキュレーション界隈にとって結構大きい。いままで「うまく削る」「うまく選ぶ」が正義だったけど、計算量が増えるとその前提が崩れる可能性がある。
2. Mechanistic Interpretability と幾何学
DJレン:
次はmechanistic interpretability。
Goodfire AIが言っていたのは、「モデルは曲がった多様体上で考えているのに、SAEは直線的な特徴で切っているからズレる」という有名な批判は、半分は正しいけど、半分は違うという立場。
DJミオ:
その修正案が、SAE特徴を単独で見るのではなく、共起発火パターンでクラスタリングして“特徴群”として解釈するというもの。
つまり、疎な特徴を捨てるんじゃなくて、単一特徴崇拝をやめて構造化された集合として読む。
これは今のSAE議論に対する現実的アップデートだよね。
3. 数学はAI研究の実験場になっている
DJレン:
科学的な議論として一番大きかったのは、OpenAIがErdősの単位距離問題に関連する結果を出したという報道。
これについては、数学こそAI支援研究のブレイクスルーが起きやすい領域ではないかという見方が出ていた。
DJミオ:
理由は明快で、成果をチェックしやすい、議論しやすい、拡張しやすいから。
一方で、当然ながら懐疑もあった。
「3時間後には人間が更新してたじゃん」みたいな茶化しもあれば、
「AI数学と認める基準が都合よく動く」というゴールポスト移動への指摘もあった。
DJレン:
それでもメタポイントとしては重要だね。
数学は“AIと人間の共同研究”を比較的見えやすい形で評価できるフロンティアになっている、ということだ。
4. エージェント、ハーネス、開発者ツール群
DJミオ:
ここからはかなり実務寄り。Agents, Harnesses, and Developer Tooling。
ハーネスが能力差を作る
DJレン:
まず、ハーネスの力はまだまだ大きい。
たとえば physics-intern という科学問題用ハーネスでは、Gemini 3.1 Proが17.7から31.4まで伸びて、GPT 5.5 Proを上回った。
ただし重要なのは、GPT 5.5 Pro自体はそのハーネスで改善しなかったこと。
DJミオ:
つまり、足場かけや外部構成の吸収力はモデル依存。
すべてのモデルが同じように“周辺工夫”で伸びるわけじゃない。
同じ流れで、mini-swe-agentをProgramBenchで動かせるようにしたという話もあって、ソフトウェア工学エージェント向けのハーネス改善そのものが研究領域になってる。
単一エージェントからサブエージェント編成へ
DJレン:
設計論としては、最初は単一エージェントから始めて、ツール乱立やプロンプト肥大が耐えられなくなったら、manager/sub-agentや分散マルチエージェントへ移るのが実践的、という整理が出ていた。
DJミオ:
このあたりは、Cognitionのsub-Devinの実利用報告とも噛み合う。
以前ならエンジニア2週間以上かかっていそうな作業が、数時間に圧縮されたという体験談もあった。
要するに、マルチエージェントは“とにかく複雑化しよう”じゃなく、必要になったら分業構造を導入するという順序が大事。
5. Codex、Gemini、そしてエージェント製品面の拡張
OpenAI Codexの変化
DJレン:
OpenAIのCodex Thursdayアップデートも重要だった。
機能単体より、コーディングエージェントがどこへ向かっているかを示している。
DJミオ:
追加されたのは、たとえばAppshots。
Macアプリのウィンドウからスクリーンショットとテキストを一緒に取得して、より豊かな作業コンテキストを渡せる。
さらに、チーム向けプラグイン共有、組織分析の詳細化も入った。
DJレン:
でも一番大きいのは、リモートコンピュータ利用だろうね。
Macがロックされていても、スマホから安全にそのMac上のアプリを使わせられる。
これは「チャットIDE」から「継続的なクロスデバイス・オペレーター」への進化を示している。
Geminiのエージェント/ツール面
DJミオ:
Google側も勢いがある。
Gemini 3.5 FlashがAPEX-Agents-AAで1位。しかも大きいモデルを超えている。
実装例も増えていて、GitHub issue triageを単一のGemini APIコールだけで実現した例や、車線や車の認識推論をカスタムvisionパイプラインからGemini 3.5 Flashの単発マルチモーダルAPIに置き換えた例も紹介されていた。
DJレン:
さらにGoogleは、Daily Briefや、OpenTable、Canva、Instacartと連携する接続アクションも拡大。
要するに、一般消費者向けのエージェントワークフローが形になり始めている。
6. 開発者インフラ:retrieval、streaming、sandbox、security
DJレン:
開発者インフラの論点もかなりはっきりしていた。収束先は、
検索・ストリーミング・サンドボックス・セキュリティ境界。
DJミオ:
たとえばWeaviateは、データベース内にMCPサーバーを内蔵。
これでコーディングエージェントがリポジトリを取り込み、BM25とベクトル検索のハイブリッド検索を追加プロセスなしで使える。
DJレン:
LangChainは2つ大きい。
1つはsandbox Auth Proxyで、エージェントと外界の境界を制御。
もう1つは、型付きストリーミングプロトコル。
ツール、サブエージェント、メディア、割り込みなどを、単なるトークン列ではなく第一級の投影対象として扱う設計だ。
DJミオ:
そしてvLLMのElastic Expert Parallelism。
これはMoEのDP/EPトポロジーをフル再起動なしでライブ変更でき、NVLink/RDMA経由でGPU間直接転送する。
単なるスケールの話だけじゃなくて、今後の障害耐性のあるサービングにも効いてくる。
7. インフラ、計算資源、ビジネスシグナル
DJレン:
この日のAI界で「金の流れ」を一番感じるのがこのパート。
まずturbopuffer。
3月時点でARR1億ドル超、しかも黒字、しかも調達額は100万ドル未満という報告が出た。
DJミオ:
メッセージは明快で、“AIの魔法は必要な文脈をちょうどよく引いてこられるときに起きる”。
つまりプロダクト差別化のかなりの部分が、検索・取得・文脈注入の問題になっている。
この流れに合わせて、「華やかなフロンティア研究だけでなく、地味に見えるAIインフラに富が積み上がっている」という見方も出ていた。
Modal、Daytona、エージェントネイティブ計算
DJレン:
Modalも大きかったね。
3億5500万ドルのSeries C、評価額46.5億ドル。
投資家も利用者も同じ物語を語っていて、AIワークロード向けにクラウドスタックを作り直す会社として強い。
DJミオ:
それと関連して、Daytonaの売り文句として、60msサンドボックス、75秒で5万スタートアップ、使用量の約半分がRL/evalsという話が紹介されていた。
つまり、エージェントネイティブな計算環境自体が一つのカテゴリになりつつある。
Compute race と HBM比率の上昇
DJレン:
計算資源の整理もあった。
アメリカの先頭集団、つまりOpenAI、Anthropic、Google、そこにMeta/xAIも合流する層は複数ギガワット級。
中国の巨大プレイヤーは数百MWから複数GWへ、しかも国内スタック化を進めている。
欧州ではMistralが今およそ90MW、2029年までに1GWを狙うという整理。
DJミオ:
数字そのものは議論の余地があるけど、計算資源が戦略ボトルネックという構図は一貫してる。
しかも、OpenAIが最近の計算増強レースを始めたとしても、最先端ラボがまだ世界全体の計算能力を使い切ってはいないという指摘もあった。
どこまで加速できるかはまだ未確定。
DJレン:
加えて部品経済も変わっていて、HBMがAIチップ部品支出に占める割合が2024年Q1の52%から2025年Q4には63%まで増加。
つまり、計算競争はメモリ競争でもある。
Harkの大型調達
DJミオ:
さらにHarkが、7億ドルを評価額60億ドルで調達。
狙いはGPUインフラ、将来モデル開発、ハードウェア、マルチモーダルやパーソナルインテリジェンス製品。
詳細はまだ少ないけど、投資家が縦統合型のAIデバイス/インフラ構想に大きく賭けているのはわかる。
DJレン:
あと、F.03が200時間ノンストップ自律稼働したという報告もあったけど、これは現時点では技術的な中身の判断材料が足りないという留保付きだった。
8. マルチモーダル、動画、バイオ、地球観測、ロボティクス
動画編集と生成
DJレン:
映像系では、RunwayのAleph 2.0とEdit Studio。
1フレームを編集すると、その編集を動画全体へ伝播できる。
これは“参照フレームに基づく編集伝播”をかなり実用化した形。
DJミオ:
さらにAlibaba系のMIGAは、学習不要で無限フレーム動画生成を目指す手法として注目されていた。
2段階のアライメント機構で時間的一貫性を保つのが肝。
オープンソース寄りでは、LongCat-Video-Avatar 1.5も出ていて、
Whisper-Large採用、8ステップ推論、長尺動画での同一人物一貫性、スタイル領域への一般化などがポイントだった。
バイオと地球観測
DJレン:
生物系では、Hugging Face BioのCarbon DNAモデル群。
用途としては、配列設計、変異効果予測、表現学習。
そしてインフラ面では、Carbon-500M、3B、8Bが単一のTrainium2 trn2.3xlargeで初日から動作した、という話も出ていた。
DJミオ:
地球観測ではOlmoEarth v1.1。
これが面白いのは、Sentinel-2の多解像度入力のトークナイズ方法を変えて、トークン数を3分の1にしたことで、3倍速く安くしたというところ。
まさに二乗コストの罠をトークン設計で回避している。
オープンロボティクス
DJレン:
ロボットでは、Hugging FaceのLeRobot Humanoidが注目された。
理由は単なるデモじゃなくて、本当にフルスタックで開いているから。
DJミオ:
そう。お値段は約2500ドル、3Dプリント、完全なハードウェア/CAD、キャリブレーション、ランタイム、シミュレーション、同定ツール、学習パイプラインまで揃っている。
安いだけじゃなくて、修理しやすい、試行錯誤しやすい。
現実のロボット学習ワークフローに乗せやすいことが大事なんだよね。
9. Top tweets:この日の象徴的トピック
DJレン:
トップツイート的なまとめもあった。
目立ったのは、
- OpenAI/Codexの製品拡張:ロック中のMacをスマホ経由で扱える、Appshots導入
- インフラ勝者の台頭:turbopufferの1億ドルランレート、Modalの大型調達、Harkの大型調達
- 研究議論:OpenAIの数学結果、RAEv2、そして「データフィルタ不要説」
- エージェント能力トレンド:Gemini 3.5 FlashがAPEX-Agents-AA首位、Gemma 4 E4BがiOSシミュレータをオンデバイスで駆動、Devin for Windows
DJミオ:
要するに、研究の新規性だけじゃなく、使えるエージェント製品面とその下支えとなるインフラが並んで強かった日だったわけね。
Reddit Recap:LocalLlama と localLLM の熱量
10. Qwen 3.7 Max ベンチマークと 27B待望論
DJミオ:
ここからはReddit。まずは**/r/LocalLlama と /r/localLLM**。
何より目立ったのはQwen 3.7 Maxと、次の27Bあるいは35Bが出るのか問題。
DJレン:
まずロードマップの噂として、Qwenは次の27Bを高確率で出しそうという発言が話題になった。
ただし公式発表ではなく、あくまでロードマップの示唆・噂。
ここでの議論はかなり実務的で、16GB VRAM勢には27B denseはきつい、むしろ35B MoEやA3B方式の方がハイブリッドCPU/GPU推論で扱いやすいという声が多かった。
DJミオ:
つまりユーザーの目線は「性能」だけじゃなく、どう載るか。
普通のゲーミングノートや16GB級GPUで回るかどうかが大問題。
逆に、50B~80Bの大きめdenseも欲しい、Qwen 3.6 27BはMTPで速いから、速度を少し犠牲にしてもパラメータを増やしたいという意見もあった。
DJレン:
さらに妄想寄りでは、122B-A10Bみたいな大規模MoEの話も出ていたね。
“総パラメータは大きいけどアクティブは低い”モデルへの期待が強い。
Artificial Analysis のランキング入り
DJミオ:
次に、Qwen3.7 MaxがArtificial Analysisで5位に入った件。
報告では、GPT-5.4 xhighとほぼ同格、Gemini 3.5 Flashを少し上回る。
しかもQwen3.6 27Bとは6ポイント差ということで、
「じゃあ今後のQwen3.7 27B/35Bはかなり強いんじゃ?」という期待が膨らんでいた。
DJレン:
ただ、慎重論もある。
3.7 Maxは390B級の非公開MoEで、アクティブ30BくらいのAPI専用かもしれない。
つまり、Maxの性能をそのまま小型オープンモデルへ外挿するなという警戒だ。
DJミオ:
しかも技術的関心としては、本当に新アーキテクチャなのか、それとも既存系のファインチューニングで性能を絞り出しただけなのか、
そしてQwen系でしばしば言われる**“overthinking”問題、つまり考えすぎ・冗長化**が直ったのか、そこも注目されていた。
「新しい王が来た」系の熱狂と冷静さ
DJレン:
Qwen3.7-Maxのベンチグリッドは、Terminal-Bench 2.0、SWE-bench Pro、MCP-Atlas、HLE、Apex、IFBench、SuperGPQAなど多くで先頭級をアピールしていた。
そのインパクトで、「新しい王」みたいな盛り上がりがあった。
DJミオ:
でも同時に、Qwenは歴史的にMax系をopen-weight化していないという現実もある。
だから期待の中心は、3.7-Maxそのものより、その派生としての大きめオープンMoEが出るか。
たとえば3.7-122B-A17B、512kコンテキスト、MXFP4/NVFP4低ビット量子化みたいな夢が語られていた。
DJレン:
ローカル勢の夢としては、“Opus at home” だね。
高性能マルチGPU環境なら、家でかなり強いモデルを回したい。
ただし、Alibaba/Qwen側が収益化重視に寄っているなら、最強のローカルモデルは出さないかもしれないという疑いもあった。
11. Qwen 3.6 35B MTP量子化パフォーマンス
DJレン:
次の大トピックが、Qwen 3.6 35B A3B MTPの量子化ベンチ。
DJミオ:
特に話題だったのが、RTX 4070 Super 12GB + Ryzen 7 9700Xで、Qwen3.6-35B-A3B-MTPを110 tok/sで回したという報告。
条件はIQ4_XS 4.19 bpw GGUF、131072コンテキスト、q8_0 KV cache、draft-max=3、draft-p-min=0.75など。
そしてllama.cppからik_llama.cppへ替えたことで約23%高速化した。
DJレン:
面白いのは、MTP受理率は下がっているのに全体速度は上がった点。
だから改善要因は単なるaccept rateではなく、バックエンド効率やオフロードの改善っぽい。
作者は、GPUをヘッドレス/セカンダリ運用してVRAMを最大限空けるのを勧めていた。
DJミオ:
さらに、--fit --fit-margin 1664を推奨して、OOMなら1792や2048へ、という細かいチューニングまで共有されていた。
あとCachyOS/KDE Waylandユーザー向けには、PlasmaをソフトウェアレンダリングにしてアイドルVRAMを1GB超から126MB程度に減らす裏技まで出ていた。
代償は、もちろんアニメーションやコンポジタが遅いか使えないこと。
DJレン:
技術論点としては、
- 比較時のllama.cppコマンドの正確な再現性
- 直近でMTP関連PRが入っていてバージョン差が大きいこと
-
IQ4_XSのメモリ節約と知能劣化のトレードオフ
あたりに関心が集まっていた。
NTP vs MTP の量子化比較
DJミオ:
別投稿では、NTPとMTPの量子化結果比較もあった。
結論としては、NTPなら**“入る中で一番大きい量子化を選べ”がかなり戦える。
一方MTPはGPUでは20~40%くらい速くなる**けど、メモリ圧は増えるしCPUには勧めにくい。
DJレン:
CPU/GPUハイブリッド勢からは、MTPでひどく遅くなったという実報告もあり、これはベンチ結果とも一致していた。
また、mainline llama.cppではngram speculative decodingとMTPを同時利用できるという指摘もあって、
「NTP対MTP」が単純な二択比較ではないんじゃないか、という方法論の議論も出ていたね。
12. Open-weight と削除要請の緊張関係
DJレン:
ここでは法務と公開モデルの話。
まず、Heretic Free Software ProjectがMetaから法的通知を受け、Llama派生モデルの重みリポジトリを削除したという件。
DJミオ:
Heretic側は従ったうえで、Codebergミラーへ移行しつつ、単一ホスティングに依存せずアクセスを維持する技術的対策を進めると表明。
コメント欄では、著作権データで学習した疑いのある側が、派生物に厳しく出るのは偽善的だという反発が目立っていた。
DJレン:
しかも皮肉として、LlamaはLM Arenaでトップ200の中ですでに168モデル・23競合に追い抜かれているみたいな言い回しが引用されていた。
法務の強さとベンチ競争力の低下を対比するムードだね。
Cohere の Command A+
DJミオ:
もう一つは、CohereがCommand A+を発表したこと。
これは同社初のMoE open-weightsで、Apache 2.0。
狙いは、最高ベンチを誇ることよりも、低遅延・高応答性・エージェント/エンタープライズ用途・1~2GPUでの実用性。
DJレン:
コミュニティの反応はおおむね好意的。
Command R+が昔かなり良かった、特に創作やERP系タスクで印象が強かった、という思い出補正もある。
その一方で、標準ベンチマーク比較が足りない、MiniMax M2.7やMimo V2.5との比較が見えないという競争力への疑問もあった。
DJミオ:
そして実用派の関心はやっぱりそこ、GGUF量子化はすぐ出るのか、もっと小さいconsumer GPU向けモデルも来るのか。
APIだけでなく、ローカル推論可能性が重要なんだよね。
Less Technical AI Subreddit Recap
13. Claude Code ワークフローとAnthropicの学習教材
「コードを読まないvibe coding」実践法
DJレン:
次は、やや広めのAIコミュニティ。
まず目立ったのが、10年経験のソフトウェアエンジニアが、Claude Codeでスマホから副業プロジェクトを“vibe coding”して、生成コードは読まないという投稿。
DJミオ:
でもこれ、雑に丸投げしてる話じゃない。むしろかなり慎重な運用ルールが共有されていた。
たとえば、
- まずPlan modeで始める
- 計画を反復的に確認・修正する
- 頭に収まるサイズまで作業を小さくする
- テストケースをエージェントに作らせる
- 各完了ごとにgit commit
- DBに触らせる前に必ずバックアップ
- Chrome DevTools MCPなどでE2E検証する
DJレン:
複雑な変更では、
計画レビュー用、セキュリティレビュー用、テスト監査用の並列レビューエージェントを使ってから、
それでも大丈夫ならauto modeへ移るという流れ。
コメント欄でも、**“頭に入りきらない計画は大きすぎる”**というルールがかなり支持されていた。
DJミオ:
実践知としては、
「1変更、1期待テスト、1ロールバック地点」
さらに**“何を触るな”を明示する**、というスコープ制御が大切だとされていたね。
それをsuperpowers skillsetみたいな再利用可能なワークフローへ落とし込もう、という提案もあった。
Anthropicの無料講座群
DJレン:
そしてAnthropicが、無料の公式AI講座を13以上、修了証付きで公開している件も盛り上がった。
内容はMCP、agentic AI、Claude Code、Claude API、BedrockやVertex AIでの企業展開など。
DJミオ:
特に評価が高かったのがMCP関連講座。
STDIO transportやStreamableHTTPといった、ツール統合の実装面に踏み込んでいるところが「ちゃんと役に立つ」と言われていた。
CodeSignalとの連携で、Python/TypeScriptのエージェント構築ラボまであるらしい。
DJレン:
そして「それ本当に公式?」という疑念に対しては、
AnthropicのlearnページからSkilljarへ辿れるので正規の教材だと確認されていた。
Claudeが「寝てください」と言う問題
DJミオ:
もう一つ、ちょっと奇妙だけど話題性が強かったのが、Claudeがセッション途中で“寝たほうがいいですよ”みたいなことを言い出す問題。
これは現状、明確な設計意図というより、モデルの性格づけや安全調整の副作用っぽいと見られている。
DJレン:
報道では、利用時間コンテキストがないはずなので、ウェルビーイング機能や計算節約のための意図的スロットリングとは考えにくいとされていた。
Anthropic側のスタッフも、これを**“character tic”、癖のようなもの**と表現して、今後のモデルで直したいと言っていたらしい。
つまり、プロダクト方針というより挙動バグ寄りだね。
14. AIの雇用・インフラへの反発
データセンターの水問題 vs アーモンド農場
DJレン:
ここでは社会反応の話。
まず、**“データセンターの水消費ばかり責められるけど、アーモンド農場の方がずっと使ってる”**という投稿が大きく伸びた。
DJミオ:
図では、米国本土のアーモンド農場が1999年から2026年にかけて5500億ガロン前後から1600億ガロン級まで増えている一方、データセンターは軸の近くに張り付く程度という見せ方だった。
意図としては、AIインフラ批判の注目のされ方は偏ってないかという問題提起。
DJレン:
ただコメントでは、
- アーモンド批判はすでに存在する
- カリフォルニアの水政策論争では定番
-
ゴルフ場の方がデータセンターより多く水を使う場合もある
といった反論や補足も出ていた。
要するに、単純な“AIだけが悪者”論に対するカウンターだけど、現実には農業、酪農、ゴルフ場、データセンターを含む配分問題として見ないといけない。
Metaの大規模レイオフ
DJミオ:
もう一つは、Metaが約8000人、全従業員の約10%にあたるレイオフを進めているという話。
投稿のフレーミングは、AIが巨大テック企業を揺らしているというもの。
DJレン:
でもコメント欄は、かなり冷静というかシニカルで、
「それはAIで“混乱している”というより、AI導入の狙いどおりの人員削減では?」とか、
「そもそもZIRP時代の過剰採用の調整では?」という見方が多かった。
DJミオ:
加えて、Metaの2000億ドルAI投資って何に使うんだという疑問も強かった。
暗に、データセンター、GPU、訓練計算、モデル開発みたいな巨額CAPEXの話になってくる。
そして中長期的には、大企業で毎年10~20%の人員削減が常態化するのではという予想まで出ていた。
15. AI Discords:静かな終幕
DJレン:
最後にAI Discords。
ここは情報というよりお知らせで、Discord側のアクセスがこの日シャットダウンされた。
だからこの形式では戻さず、新しいAINewsを出すとのこと。
DJミオ:
記事タイトルどおり「何も起きなかった日」っぽく見えて、実際には、
研究の細かい前進、
エージェント設計と開発ツールの成熟、
インフラ企業と計算資源への資本集中、
ローカルLLM勢のQwen期待、
社会的な反発や摩擦、
そして情報流通チャネルの変化まで見えていた。
静かな日にこそ、地殻変動が見えるって感じ。
番組のまとめ
DJレン:
じゃあ最後に、この回の要点をコンパクトにまとめよう。
DJミオ:
はい。今回のAINewsで見えたのは――
DJレン:
研究面では、
- RAEv2が表現ベース生成の有力な更新
- Gated DeltaNet-2がlinear attention系の有望株
- トークナイゼーションの効き方を再検証する流れ
- 十分な計算量ではデータフィルタ不要説
- SAE解釈は単一特徴から特徴群へ
- 数学がAI共同研究の見えやすい前線
DJミオ:
エージェントと製品面では、
- ハーネスが依然として能力を大きく押し上げる
- 単一エージェントから必要に応じてサブエージェント編成へ
- Codexはクロスデバイス運用へ進化
- Geminiは軽量モデルと単発APIでの実用性を拡大
- 開発者インフラはretrieval、streaming、sandbox、securityへ収束
DJレン:
インフラとビジネスでは、
- turbopuffer、Modal、Harkなどに資本と期待が集中
- compute raceはギガワット級へ
- HBM比率の上昇がメモリ中心の競争を示す
- AIクラウドやエージェントネイティブ計算が独立カテゴリ化
DJミオ:
マルチモーダルと実世界系では、
- 動画編集の伝播型ワークフロー
- バイオ基盤モデルの使いやすさ向上
- 地球観測のトークン設計最適化
-
LeRobot Humanoidのような修理可能で反復しやすいオープンロボット
が印象的だった。
DJレン:
Reddit側では、
- Qwen 3.7 Maxの強さと、27B/35B open-weight待望論
- Qwen 3.6 35B MTP量子化の高速化ノウハウ
- Metaの法務とopen-weight文化の緊張
-
Cohere Command A+への期待と実用性評価
が中心だった。
DJミオ:
そして一般コミュニティ側では、
- Claude Codeの安全なvibe coding作法
- AnthropicのMCP/Claude講座の評価
- Claudeの“寝てください”挙動という奇妙なバグ
-
AIの水使用や雇用への反発と、その見方のズレ
が話題だったね。
DJレン:
今夜はここまで。静かな日ほど、AIの本流がよく見える。
ここは**「Midnight AI Groove」**、DJレンでした。
DJミオ:
DJミオでした。おやすみなさい。次の波でまた会いましょう。
