今日の話題
- アリババのWanチームが、音声と映像をリアルタイムにやり取りする対話モデル「Wan-Streamer v0.1」の研究プレビューを公開した。音声・映像・テキストの入出力を1つのTransformerにまとめ、モデル側の応答遅延は約200ミリ秒だとしている。
- 計算資源をめぐる動きも続いた。GoogleがGPU不足を理由にMetaへのGemini提供を絞ったと報じられ、欧州ではオーストリアがEU域内へのAnthropic誘致を呼びかけた。
Hot
アリババのWanチームが対話モデル「Wan-Streamer v0.1」の研究プレビューを公開
アリババのWanチームが、リアルタイムの音声・映像対話に向けた基盤モデル「Wan-Streamer v0.1」を公開した。音声認識や音声合成、アバター生成といった処理を別々のモジュールでつなぐ従来の構成とは異なり、音声・映像・テキストの入出力を1つのTransformerでまとめて扱う。トークンを時系列に織り交ぜ、ブロック単位の因果アテンションで逐次的にストリーミングする設計で、相手の発話に割り込みながら応答するフルデュプレックスの対話を想定する。論文によると、モデル側の応答遅延は約200ミリ秒で、双方向のネットワーク遅延350ミリ秒を加えても対話全体の遅延は約550ミリ秒に収まり、最短160ミリ秒・25fpsの単位で出力するという。現時点のv0.1は192pの実証段階で、高解像度化は今後の課題に挙げている。
Source: https://arxiv.org/abs/2606.25041
Source: https://wan-streamer.com/
Business
GoogleがGPU不足でMetaへのGemini提供を絞ったと報じられた
GoogleがGPU不足を理由に、MetaによるGeminiの利用を制限したとFinancial Timesが報じた。関係者の話として、Googleは3月ごろMetaに対し、Metaが購入を求めていたGemini向けの計算資源をすべては供給できないと伝えたという。これによりMetaの社内AIプロジェクトの一部に中断や遅れが生じたとされる。ほかのGoogle顧客にも少なからぬ影響が出ているが、需要がとりわけ大きいMetaが最も打撃を受けたと報じられている。Googleはこの件を確認しておらず、現時点では未確認の情報だ。
Source: https://www.reuters.com/business/google-limits-metas-use-its-gemini-ai-models-ft-reports-2026-06-28/
オーストリアがEU域内でのAnthropic誘致を提案したと報じられた
オーストリアのデジタル化担当国務長官Alexander Proell氏が、EUのテクノロジー担当委員Henna Virkkunen氏に書簡を送り、EU域内へのAnthropic誘致を検討するよう提案したとBloombergなどが報じた。米国が米国外の利用者によるAnthropicの最先端モデルの利用を制限したことを受けた動きで、Proell氏は書簡で、欧州が重要なイノベーションから取り残されてはならないと指摘。法的な安定性や市場、資本、価値観の面でEUは適しているとして、域内にAnthropicを誘致する道を一緒に探りたいと呼びかけた。ただ具体的な進め方には触れておらず、実現を疑問視する見方があることも認めている。Anthropicはこの提案についてコメントしていない。