はじめに
最近、フィジカルAI という言葉をよく聞くようになってきました。
しかし、どういうものなのかいまいちキャッチアップできていなかったので一度調査してみることにしました。
そこでわかったことをこちらの記事にまとめています。
1. フィジカルAIとは何か?
Gartnerの定義によると、以下の様な技術のことを指す様です。
フィジカルAIとは、ロボットや車両、各種機械といった実機に対して、AIがセンサで周囲の状況を捉えながら学習し、自ら判断して装置を動かす(制御する)ための設計・開発のアプローチです。マルチモーダルAIのソフトウェアとハードウェアを、空間情報や物理法則(重力・摩擦・衝突など)と組み合わせることで、現実世界で「周囲を捉え、判断し、動作に移す」を行えるようにします。
つまり、
フィジカルAIとは、 「物理世界において、センサーで環境を認識し、AIで判断し、アクチュエーター(駆動装置)で行動する自律システム」 のことだと言えそうです。
2. 今までのロボット技術と何が違うのか?
従来のロボットでも機械学習(ML)を用いて、画像から対象物を認識したり、センサー値に基づいて動作を補正したりする試みは行われてきていました。
その中で、従来のロボットとフィジカルAIの決定的な違いは、その動かし方の「仕組み」と、ロボット自身が持つ 「身体性」 にあります。
-
従来のロボティクス(ルールベース / 分離された身体):
人間が1行ずつコードを書いたり、動作を直接覚え込ませる(ティーチング)手法です。知能(ソフト)と身体(ハード)が切り離されており、身体は単に「命じられた座標へ動く装置」でした。そのため、物体の重さや摩擦の変化、数ミリのズレといった「物理的な不確実性」に対応できず、動作が破綻しやすい弱点がありました。 -
フィジカルAI(学習ベース / 身体化された知能):
AIが自らの身体を通じて、重力や摩擦、感触といった物理法則を直接学習します。
VLA(視覚・言語・行動)モデルに加え、触覚や力加減を統合することで、カメラで見えない部分の「滑り」を察知したり、壊れやすいものを優しく掴むといった「身体的感覚」を伴う動作が可能になります。これにより、初めて見る道具や複雑な環境でも、人間が「コツ」を掴むように柔軟に動くことが期待できます。
3. 国内外のフィジカルAI事例
実際に市場でどういったフィジカルAIのサービス・製品が出ているかを調査しました。
現時点は、米国勢はソフトウェアと汎用知能(基盤モデル)の開発をリードしており、中国勢は圧倒的なサプライチェーンを背景としたハードウェアの量産と低価格化が戦略となっている様に見えます。
日本は、世界屈指の産業用ロボットシェアと、長年蓄積された製造現場のデータ(現場力)を武器に、独自のフィジカルAI戦略を展開していこうとしている様です。
海外の動向
- NVIDIA(米国):
汎用ロボット基盤モデル「GR00T」および世界モデル「Cosmos」
世界モデルは、物理法則をシミュレーション上で理解するための技術です。
ロボットが自律的に学習し、人間のような推論と行動を行えるようにするためのプラットフォームを提供しています。
ボストン・ダイナミクスやキャタピラーなどの主要パートナーが同社の技術を採用しています。
- Figure AI(米国):
BMWの工場で稼働する最新人型ロボット「Figure 02」
マイクロソフトやオープンAIから巨額の出資を受け、製造現場での精密な作業と自然言語による指示理解を両立したヒューマノイドを開発しています 。
後継モデルとしての「Figure 02」も開発されている様です。
- Gemini RoboticsI(米国):
高度な推論能力を備えた次世代フィジカルAI。
最新の大規模モデル「Gemini」の推論能力を物理世界へ統合した進化版で、より複雑な指示や、動的に変化する環境下での高度なタスク計画を可能にしています。
- Unitree Robotics(中国):
世界最安クラスの人型ロボット「R1」
圧倒的なコスト競争力(R1は約5,900ドル〜)を武器に、人型ロボットの量産化を推進しています。
- UBTECH Robotics(中国):
自動車組み立てラインで活躍する「Walker S2」
中国初の人型ロボット上場企業であり、実戦的な工場自動化ソリューションとして、自動車生産ラインでの実稼働を進めています。
国内の動向:
- Preferred Networks (Preferred Computing Platform / MN-Core):
独自の省電力AIプロセッサ「MN-Core」シリーズを活用し、物理世界のシミュレーションやロボット制御に必要な膨大な計算を効率化するAIクラウドサービスを2026年に開始予定です。
- SoftBank (ソフトバンク):
「テクノロジーの社会実装」を掲げ、フィジカルAIを次世代社会インフラの核と位置づけています。特に、通信インフラ(AI-RAN)とロボティクスを統合し、広域での自律移動や物流の最適化を目指しています。また、後述の日本独自の1兆パラメーター級の大規模AIモデル開発プロジェクトにも参画し、産業データの活用を推進しています。また、安川電機との協業により「フィジカルAI」領域における新たな自動化ソリューションの創出を目指すとのニュースリリースも出ています。
- Mujin (MujinOS / オートメーションストラテジー):
独自のフィジカルAI技術「MujinOS」を核に、複雑な物流・製造現場の自動化を実現。2025年には大規模な資金調達を実施し、経営と現場をデジタルツインで繋ぐ戦略を推進しています。
- 日立製作所(HMAX)
日立は、長年培った社会インフラの知見とAIを統合する戦略を推進しています。
HMAX (Hitachi Modernization Actions for X)という2026年のCESで発表されたAIソリューション群では、エネルギー、モビリティ、産業の各分野で、現場のデータをリアルタイムに分析・運用し、予測保守やシステム最適化を実現しようとしています。
- 官民共同:
ソフトバンクやPFNら国内企業10社以上が参画し、日本の製造業が持つ豊富な産業データを活用して、ロボットや機械を自律制御するための「1兆パラメータ級」大規模AIモデルを官民連携で開発するプロジェクトの方針が出ているそうです。
4. これからの技術はどうなっていくか?
この部分は調査結果を踏まえたただの推測です
フィジカルAIは、従来の「プログラムされた通りに動く機械」から、「物理世界を理解し、自律的に学習・適応する知能」へと進化していくことができる技術になります。
なので、特定タスク専用のプログラミングが不要な「ロボット基盤モデル」の普及によって、一台のロボットが指示一つでゴミ拾いから部品の組み立てまでこなす「汎用性」を獲得していく様になるとおもわれます。
そういって、身体的な動きもロボットが模倣できる様になっていくことで、現在暗黙知などの形式知化が生成AIにより推し進められているのと同じことが、身体に依存していた物理的な作業にも起きてくるんではないかと思っています。たとえば、物流、製造、医療、災害対応といった、作業などの労働の需要があるリアルな現場への導入が進んでいくのではないかと。

さいごに
フィジカルAIについて調べることで、現在AIが理解できるスコープが知識やデータといったオンライン上のものから、物理的な世界に及んできていることが理解できました。
ロボット自体が身体に対しての感覚を得ていく様な、SF映画の様な世界が近づいている様なワクワク感がありました。
生成AIの登場により起きた業務の変革がフィジカルAIにより拡大していくのかなと、これからも最新動向を追っていきたいと思いました。

