はじめに
諸般の事情で AWS Summit Singapore に行くことになりましたので、DeepRacerワークショップと DeepRacer リーグに参加してきました。
DeepRacer ワークショップ
ワークショップは 2 パートに別れており、前半は強化学習や DeepRacer についての説明がありました。後半は aws-samples/aws-deepracer-workshops に沿ったハンズオンでした。
ハンズオンでは、現在プレビュー中の DeepRacer コンソールを使ってモデルのトレーニングと評価を行います。AWS アカウントは用意されていたものを使用しました。
公式ドキュメントである程度雰囲気はわかりますが、SageMakerを直接操作する場合に比べ、設定範囲は限られており、
- トレーニングするコース
- 報酬関数
- ハイパーパラメータ
- アクション空間(選択しうるスピードとステアリングの組み合わせ)
を入力することになります。デフォルトでは 60 分間のトレーニングとなります。
用意されているサンプルの報酬関数を使って 60 分ほどトレーニングすると、
シミュレータ上では 1 週 30 秒台で完走できるモデルになりました。
DeepRacer リーグ
ワークショップで作成したモデルを持ち込んで、リーグに参加することができました。
公式ルール にある通り、4分間走らせて、一番早いラップタイムで順位付けされます。コースアウトするとスタッフの方が戻してくれます。
DeepRacerコンソールからダウンロードしたモデルをUSBメモリに書き込み、DeepRacer本体に差し込みます。ステアリングは自動ですが、スロットルは人間が操作するため、出力を上げすぎると、曲がりきれずに壁に激突しました。
たまたまコースアウトせずに周れた時があり、今回は 12 秒台という記録でした。
ほとんどのラップではコースアウトしていたため、安定感がない代わりに、
シミュレーションよりもかなり早い結果になりました。
感想
一周でも完走できれば OK というルールなので、スロットル調整(と運)が重要だと感じました。
スロットルを思いきり上げて運良く一周できれば、好成績を収められるのではないでしょうか。