はじめに
前回の投稿から二週間たちましたね。こちらNissanのQiita、ニキータの孫1です。今までのブログでは E2E 自動運転とUI/UXの話をしていますが、今回は久々の学会現地レポートです。2025 年 7 月 29 日〜8 月 1 日に京都・国立京都国際会館で開催された 第28回 画像の認識・理解シンポジウム(MIRU2025) にフル参加してきたので、備忘録+来年以降のためのメモを残します。なお、早期割引(Early‑Bird)を見逃さずに登録したので経費的にもホッとしました。
MIRU2025 概要と今年のトピック
| 項目 | 内容 |
|---|---|
| 会期 | 2025/07/29(火)–08/01(金) |
| 会場 | 国立京都国際会館(京都市左京区・宝ヶ池) |
| 参加形態 | 完全オンサイト |
| 発表件数 | 論文発表 602 件、そのうち口頭発表 88 件 |
| 目立ったキーワード | Vision×LLM、Gaussian Splatting、生成AI |
公式サイトにもある通り、今年は “マルチモーダル+生成” が一気に市民権を得た 印象です。
会場レポート:国立京都国際会館で“宇宙船気分”
- メインホールの円盤天井はSF 映画セット級
- ガラス越しに望む 宝ヶ池 がオアシス――休憩は池を眺めてクールダウン
- 地下鉄「国際会館」駅から徒歩 5 分なのに、真夏は汗が試験運転レベル
建築ガチ勢としては、打ちっぱなしコンクリ×水盤の組み合わせを見るだけでテンション MAX。

公式以外の楽しみ方(非公式 Tip)
-
朝ラン
京都御苑周辺の周回コース(約 20-30分程度)を朝ラン → 涼しい頭で 9 時の招待講演へ参加。 -
夜の CV 井戸端会議
烏丸線沿いの居酒屋はどこも CV 研究者で満席。来年公式Slack で #miru2025_hungry チャンネルが欲しい(笑)
チュートリアル講演ピックアップ
河原塚健人先生「ロボット基盤モデル研究の最前線」
VLAの全体像を歴史→アーキテクチャ→データ収集→評価ベンチまで順に縦断。
CLIPort→RT-1/2→GR00T N1 へ続く系譜を整理し、Sensorimotor・World・Affordance 3系統の特徴を比較。
ALOHA/RT-X など巨大データ収集や GenAug・ROSIE といった拡張手法、RoboArena 等の評価環境も網羅。
産業実装が視界に入る一方、日本の論文シェアが 5 % 未満という現実を示し「今こそ巻き返そう」と檄。
八木拓真先生 「一人称視点映像解析の最先端」
ウェアラブル FPV が取得する視線・手操作・自己運動を軸に行動認識タスクを体系立て。
Ego4D/Ego-Exo4D の 1,422 h 多視点データセット、Expert commentary & Narrate-and-act のアノテ手法を紹介。
Dual-Encoder の堅調ぶりと InternVideo2.5・MM-Ego・EgoLM など MLLM 系のベンチ結果を比較。
Apple Vision Pro でのテレオペ収集や Meta のスマートグラス計画など Big Tech のハード流入が商用化を後押し中。
坊農真弓先生「AIは手話言語をどう捉えるべきか」
OpenPose 以降,運動学ベースが手話研究を牽引してきた軌跡を振り返りつつ最新成果を提示。
MediaPipe を用いた 3D 正規化,口形4分類 81 % 精度,新たなジェスチャータイプ付与で一致率 80 % 超を達成。
“sign→gloss→text” 変換の情報欠落リスクを指摘し Gloss(⼿話⾔語の記述⼿法の⼀つで、⼿話⾔語 の元の意味と構造を保持することを⽬的としたもの) 偏重=第二の デジタル・ミラノ 問題に警鐘。
日本発の自発会話 48 h コーパスを足がかりに,身体記号論 × マルチモーダル LLM の将来像を示す。
- 3本とも「Vision × 言語 × 行動」の融合がいよいよ実務フェーズに入ったことを実感させる内容でした。
特に河原塚先生のチュートリアルで突きつけられた “国内プレゼンスの低さ” は、自動運転屋としても他人事ではありません……!
企業展示
- プレゼンスを向上するために, 我らNissanにも展示へ:
-
トップカンファレンスで発表した論文を展示
“Explanation for Trajectory Planning using Multi-modal Large Language Model for Autonomous Driving”, ECCVw2024
“3D Flow Field Estimation around a Vehicle Using Convolutional Neural Networks”, BMVC2021 -
研究だけではなく, 生産現場にもAIを導入し, 物体検出などのCV技術から量子コンピュータを活用するまでに,生産を改良すること取り組みを紹介
-
おわりに
酷暑の京都で体力ゲージは削られましたが、それ以上に CV 研究の熱量をチャージできた4日間でした。次回 MIRU は長崎での開催が予定されていますが、Vision×LLM×生成モデルの三つ巴はさらに加速するはず。この記事が来年以降の参加を検討する方のヒントになれば幸いです。それではまた次で!
— ニキータの孫1

