More than 1 year has passed since last update.

AWS DeepRacerのハンズオンをやってみた

Last updated at 2022-08-08Posted at 2022-08-05

はじめに

面白そうだからAWS DeepRacerやってみようという話になったのでとりあえずハンズオンやってみました!

AWS DeepRacerとは

AWS DeepRacer(以下DeepRacer)とは、楽しく体系的に強化学習を学べるサービス

評価関数やハイパーパラメーターを設定してモデルを作成することでシミュレータ、もしくは実機でレースをすることができます。

DeepRacerを始める

早速DeepRacerを始めてみましょう！

マネジメントコンソールからDeepRacerにアクセスします。
ここからの流れは基本的にAWS DeepRacer Workshop のハンズオンに沿って行っていきます。

ハンズオンの内容だけであれば無料枠内で完結するはずです。

車両のカスタマイズ

まず、左メニューのYour garageから自分専用の車両を作成します。

~~ハンズオンにはステアリングなどを設定する項目があったのですが見当たらないので見た目とカメラだけ設定して進めます。~~
チュートリアルが作られた時と設定の順番が前後していました。モデルを作成する際にステアリングなどは設定します。

色は自由に選んで、カメラはとりあえず一人で走るだけなのでCameraを選択します。

各カメラの用途は以下のようになっています。

カメラの名前	用途
Camera	スタンダードなタイムアタック用
Stereo camera	立体視カメラ　障害物レース,直接対決レース用
LIDARセンサー	後方の死角用センサー　直接対決レース用

これで車両の設定はOKです！

モデルの作成

まず、左メニューからYour modelsを選択

Create Modelを選択
Modelの名前を決める
コースを選択ハンズオンに則ってここではThe 2019 DeepRacer Championship Cupを選択(けっこう後ろの方にある)

レースタイプはtime trialを選択、ハイパーパラメータはとりあえずノータッチでOK

ここでステアリングの設定があるのでDiscrete action spaceを選択
ステアリング角度 MAX:30° 粒度:5
スピード MAX:1m/s 粒度:3
に設定

次にさっき設定した自分の車両を選択

ここで報酬関数を設定します
ハンズオンの資料に乗っている報酬関数の中でも一番スタンダードな関数を設定します。

def reward_function(params):
    '''
    エージェントにセンターラインに従うように報酬を与える例
    '''
    
    # 中心線からだんだん離れていく3つのマークを計算する
    marker_1 = 0.1 * params['track_width']
    marker_2 = 0.25 * params['track_width']
    marker_3 = 0.5 * params['track_width']
    
    # 車が中心線に近いほど報酬を与える
    if params['distance_from_center'] <= marker_1:
        reward = 1.0
    elif params['distance_from_center'] <= marker_2:
        reward = 0.5
    elif params['distance_from_center'] <= marker_3:
        reward = 0.1
    else:
        reward = 1e-3  # クラッシュした可能性が高い / トラックから外れた状態に近い
    
    return float(reward)