※本記事は公開情報をもとにした個人的なまとめであり、各企業の公式見解ではありません。本記事は投資助言を目的としたものではありません。
米CAISI、Microsoft・Google DeepMind・xAIとフロンティアモデル評価で正式合意
5月5日、米商務省NIST傘下のCenter for AI Standards and Innovation(CAISI)は、Microsoft、Google DeepMind、xAIの3社と、フロンティアAIモデルの公開前評価および国家安全保障観点での研究協力に関する合意を結んだと発表しました。
各社はモデルをCAISIに提供し、能力評価とリスク調査の対象とすることに同意したとされています。研究目的では、セーフガードを一部緩めた状態のモデルへのアクセスも認める内容とのことです。OpenAIとAnthropicは2024年から既存の評価パートナーシップを持っていましたが、今回これを米国のAI Action Planの優先事項に沿う形で再交渉しています。これにより、米国の主要フロンティアAIラボが揃って公的機関による公開前評価に参加する体制が整いました。
数日前から「米ホワイトハウスがリリース前評価制度を検討」との報道が出ていましたが、今回はそれが具体的なベンダー間合意として動き出した格好です。アプリケーション開発側としては、上流のモデル評価レポートやガバナンス情報がより整理されて出てくる流れにあるので、社内のモデル選定プロセスでも「評価レポートをどこから取得するか」を整理しておく価値はありそうです。
Anthropic、金融サービス向けに10種のAIエージェントとMicrosoft 365統合を発表
5月5日、AnthropicはClaudeをベースに、銀行・保険・資産運用・フィンテック向けの業務を自動化する10種類のAIエージェント・テンプレートを公開したと発表しました。
対象タスクには、ピッチブック作成、クレジットメモ起案、KYCファイルのスクリーニング、財務諸表の監査などが含まれています。あわせて、Claudeアドインを通じてExcel、PowerPoint、Word、Outlookとの連携が拡張され、複数アプリケーション間で会話コンテキストを引き継げる挙動が紹介されました。データ連携面では、Dun & Bradstreet、Verisk、Moody'sといったデータプロバイダーとの提携拡大も発表されています。
報道では、Goldman Sachs、Visa、Citi、AIGなど大手金融機関での導入が進んでいるとされています。
開発者目線では、業務領域別のエージェント・テンプレートが整備されてくると、自前で同様のワークフローを組むよりも、テンプレートを起点にカスタマイズする選択肢が現実的になってきた印象です。Excel・PowerPointへの常駐型UIは、一般職務でのClaude採用の入り口になりそうです。
Allen Institute for AI、ロボット制御向け基盤モデル「MolmoAct 2」をオープンソースで公開
5月5日、シアトル拠点のAllen Institute for AI(Ai2)は、ロボット制御向けの次世代オープンソース基盤モデル「MolmoAct 2」を発表しました。
MolmoAct 2は、現実世界での物体操作タスクを対象としたVision-Language-Action系モデルで、前世代と比べて一部のタスクで最大37倍速い処理スピードを達成しているとされています。あわせて公開された大規模データセット「MolmoAct 2-Bimanual YAM」は、双腕(バイマニュアル)デモンストレーションのオープンソースとして720時間超のデータを含むとのことです。タスク例としては、タオルを畳む、買い物のスキャン、スマートフォンの充電、テーブルの片付けなどが想定されています。再アノテーションにより、ユニークラベル数は7.1万から約14.6万に増えたと説明されています。
ロボティクス分野でも、汎用基盤モデル+データセットを完全オープンで配るアプローチが定着してきており、シミュレーション学習や評価ベンチマークの充実とあわせて、研究室・スタートアップが現物を触りやすい状況が続いています。
PayPal、AI活用を軸とした構造改革プログラムで15億ドル規模のコスト最適化を計画
5月5日、PayPalは2026年第1四半期決算説明とあわせて、構造改革とAI導入による業務効率化を通じて、15億ドル規模のコスト最適化を進める計画を発表しました。
同社はビジネスを「チェックアウト・ソリューションとPayPal」「コンシューマー・ファイナンシャル・サービスおよびVenmo」「ペイメントサービスと暗号資産」の3セグメントに再編した上で、AIと自動化の活用によって製品開発スピードと相互運用性を引き上げ、節約分は再投資に回す方針です。AI関連のコスト構造改革は、2フェーズに分けて段階的に進められると説明されています。
決済プラットフォーマーが「自社業務へのAI導入」を成長戦略の中心に据える事例として、フィンテック領域でのAIプロセス再設計の動きを象徴する発表となりました。
まとめ
5月5日は、政策面・モデル面・基盤面の3方向で動きがそれぞれ前進した1日でした。開発者目線での主なポイントは次のとおりです。
- 米CAISIによる主要ラボ各社との公開前評価合意は、フロンティアモデルに関するガバナンスが「自主公表」から「政府機関と連携した正式評価」へ進む流れを後押ししています。社内導入ガイドラインで、評価レポートの参照ポリシーを整えておく価値があります。
- Anthropicの金融特化エージェント10種とMicrosoft 365連携は、業界別ユースケースに即した「テンプレート+アドイン」モデルがエンタープライズ導入の主流になりつつあることを示しています。
- Ai2のMolmoAct 2は、ロボティクス領域でのオープン基盤モデル+大規模データセットの組み合わせが研究・スタートアップ双方に効くフォーマットになっていることを再確認させる内容でした。
- PayPalの構造改革計画は、決済プラットフォーマーがAI活用によるコスト構造の見直しを公的にコミットする例として注目されます。
参考
- CAISI Signs Agreements Regarding Frontier AI National Security Testing With Google DeepMind, Microsoft and xAI (NIST)
- Trump admin moves further into AI oversight, will test Google, Microsoft and xAI models (CNBC)
- Anthropic Unveils AI Agents to Field Financial Services Tasks (Bloomberg)
- Ai2 releases MolmoAct 2, enhancing robot intelligence in the real world (SiliconANGLE)
- PayPal says it's 'becoming a technology company again' that means AI (TechCrunch)
