AMD Open Robotics Hackathon 参加記

Last updated at 2025-12-11Posted at 2025-12-11

この記事は Computer Society Advent Calendar 2025 の25日目の記事です。

はじめに

AMD Open Robotic Hackthonに参加して、なんと3位に入賞しました！この記事では、ハッカソンの概要や、私たちが作った「回転寿司ロボット」について紹介します。

1. AMD Open Robotic Hackthon とは

AMD Open Robotic Hackthonは、AMDが主催し、Hugging Faceをはじめとする企業が協賛するロボットをお題にしたハッカソンです。今回は東京とパリの2会場で同時開催されました（おそらく初開催！）。

1.1 環境や設備について

このハッカソンの特徴は、今世界中で最も注目が集まっている（はず！）オープンソースのロボットライブラリ huggingface/lerobot を使うことです。
データ収集からモデル学習までを手軽に行える環境が整っていました。

ハッカソン運営から提供された機材はこんな感じです。

ロボットアーム: LeRobot SO-101 (1セット)
PC: Laptop ASUS Vivobook S 14 (Ryzen AI 9 HX 370搭載)
学習環境: ROCm cloud インスタンス (1チームにつき2つ)
その他: Webカメラ, スタンド, クランプなどのツール

1.2 何をするの？

今回のハッカソンでは、約45時間という限られた時間内に2つのミッションをクリアする必要がありました。

1. Lerobotを使った「Hello World!」

まずはLeRobot SO-101に慣れるためのミッションです。
データ収集 → 学習 → 推論という一連の流れを体験するのが目的。特に意味のあるタスクでなくても、アームで何か持ち上げたり移動させたりできればOKです。

2. 現実世界の課題を解決する（本番）

こっちがメインです。実世界で役に立ちそうなタスクを自分たちで考えて、実際に実装します。

ロボットでデータ収集
学習
推論して、デモを見せる
データセット、モデルの重みそして学習のログを公開・提出

1.3 審査基準

勝者は100点満点で採点されます。

成果物提出 (30点): レポジトリ、動画、ドキュメントなどがちゃんとあるか
プロジェクトの中身 (70点):
1. クリエイティビティ (30)
2. 技術的な難しさ (20)
3. 使いやすさ (10)
4. 実際のユースケース (10)

2. アイディア：回転寿司の大将

せっかく東京開催だし、日本っぽくて面白いタスクがいいよね、という話になり、チームメンバーから出たアイデアが 「回転寿司」 でした。

「サーモン」みたいに食べたいネタを言うだけで、ロボットが取ってくれたら最高ですよね。

理想的な動きはこんなイメージです↓
（「サーモン」と伝えた場合）

3. 学習モデルの選定

やりたいことは「言語指示による条件付け」なのですが、LeRobot公式で提供されているPolicyの中から選ぶとなると、以下の3つが候補になります。

ただ、今回はLaptopを使って推論させることを考えると、できるだけ軽いモデルを使いたい…。
さらに、審査基準に「技術的な難しさ」という項目があるため、あえて既存のものではなく独自のPolicyを実装することにしました。

採用したのは、2025年のCoRLで発表されたばかりの Streaming Flow です。
FlowベースのPolicyなんですが、パラメータサイズが小さく、そ性能が良いのが特徴です。

※ちなみに私はStreaming Flowに全然詳しくないので、実装と学習まわりはチームの先輩がやってくれました（感謝）。

lerobot公式から提供されたモデルについて、apiは統一していますので同じデータセットを使って簡単に学習することができます。そのため上記の smol VLA, pi0, pi0.5 についてすべて学習し、実機でテストしました。

4. 推論デモ

smol VLA、 pi0、 pi0.5そして最後に streaming flowについて実機テストして対照実験やった結果、自前実装のstreaming flowが勝ちました。

実際に動かしてみた様子がこちら。

「サーモン」を指定した場合:

「たまご」を指定した場合:

5. 結果

なんと3位に入賞しました! 😎

ただ、実は本番ジャッジメントのデモでは、なぜかモデルが正常に動かなくなってしまいました（本番に弱い…😭）。

はっきりした原因は不明ですが、おそらく 「光と影」に過学習 してしまったんじゃないかと思います。データ収集をした昼間と違って、本番のデモは日が沈んだ後だったので、照明環境の違いで推論が狂った可能性高いです。

それでも入賞できた理由を分析すると、おそらくこのあたりが評価されたのかなと思います。

技術的な難易度: 短期間で自前実装したモデル（Streaming Flow）は、smol vlaより1000倍くらいパラメータが小さく、集積GPUのLaptopでもサクサク動いたこと。そして 「回転」 という難しいダイナミックスシステムにうまく対応できたこと
証拠動画: 成功したときの動画をちゃんと撮ってあったこと
コンセプト: アイディア自体が面白く、現実世界でのユースケース（自動化）もイメージしやすかったこと

6. プロジェクト詳細

作ったものは以下で公開しています。

6.1 学習済みモデル

6.2 Dataset

6.3 リポジトリ

7. 感想

約45時間という制限時間がある中で、ハードウェアの調整、データ収集、学習、テストなど一連のタスクを密に行う必要がありました。とても疲れましたが、すごく楽しかったです。事前学習済みモデルのfinetuningがうまく行かないとか、本番になって動くはずだったモデルが狂い始めるとか(笑)大変なこともたくさんありましたが、チーム全体で協力して、出てきた問題を試行錯誤して解決して行けたというのはすごくいい経験でした。

You get articles that match your needs
You can efficiently read back useful information
You can use dark theme

What you can do with signing up