2
2

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?

More than 5 years have passed since last update.

AWS DeepRacerのはじめかた(3)最初のエンジンを作成

Last updated at Posted at 2019-05-12

目次(投稿一覧)

  1. DeepRacerのはじめかた(1)概要と目次
  2. DeepRacerのはじめかた(2)サービスの利用開始と参考費用
  3. DeepRacerのはじめかた(3)最初のエンジンを作成 ← 表示中
  4. DeepRacerのはじめかた(4)Evaluation(作成したエンジンを評価)
  5. DeepRacerのはじめかた(5)ログの場所
  6. DeepRacerのはじめかた(6)モデルのダウンロード方法
  7. DeepRacerのはじめかた(7)Virtual Circuit
  8. DeepRacerのはじめかた(8)参考情報 モデルのトレーニングと評価

概要

エンジン(モデル)作成には強化学習(きょうかがくしゅう)を使います。
RL は Reinforcement Learningの略です。
reward(褒賞、報酬)というものが出てきますが、正しく学習できたときのご褒美(できなかったときの罰)のようなものです。
強化学習について調べてみてから、以下に挑戦してみてください。

***AWS Deep Racer***サイト

最初のエンジン(モデル)を作成開始

注意:Regionを**米国東部 (バージニア北部)**に変更

WS2019051217_0001.JPG

または、こちらのリンクにアクセス AWS DeepRacer 

AWS DeepRacer を開始

WS20190512190500_0000.JPG

Create model

ページの下部にある 「Create model」ボタンを押すと最初のエンジン(モデル)の作成を開始できます。
WS20190512190536_0000.JPG

Create modelの手順

  1. Account resourcesをリセット(初期状態から開始したいときのみ)
  2. Model details(名前や備考を記載)
  3. Environment simulation(どのコースで学習を進めるかを決定)
  4. Action space(ロボットの動作条件を決定)
  5. Reward function(強化学習の報酬条件等を記載)
  6. Hyperparameters(ハイパーパラメーターを設定)
  7. Stop conditions(強化学習を何分行うか)

注意

以降は、Create modelページの項目を***「初期状態」画面***で説明します。
実際は各設定を色々と調整し、より良いモデルの作成にチャレンジすることになります。
また、設定した内容については、キャプチャしたり、メモしておくことをお勧めします。

Overview

全体手順等の説明です。
WS20190512200526_0000.JPG

Account resources

初期状態から開始したいときのみ Reset resurces ボタンを押しますが、最初に作成する場合は(作成したところなので)不要だと思います。
緑のチェックマークが表示されていることを確認下さい。
WS20190512200554_0000.JPG

Model details

名前や備考を記載します。
注意:後で変更できない!
WS20190512200559_0000.JPG

Environment simulation

どのコースで学習を進めるかを決定します。
もくもく会の参加者は「re:Invent 2018」を選択してください。
WS20190512200509_0000.JPG

Action space

ロボットの動作条件を決定します。
WS20190512200527_0000.JPG

Action listは設定によって自動的に変更されます。
WS20190512200549_0000.JPG

Reward function

強化学習の報酬条件等を記載します。
詳細情報やサンプルについては、こちらを参照ください。
AWS Input Parameters of the AWS DeepRacer Reward Function
記載が終わったら、必ず「Validate」ボタンで構文に間違いがないかを確認してください。
開始時にも「Validate」のチェックは自動的に行われます。
WS20190512200558_0000.JPG

Hyperparameters

ハイパーパラメーターを設定します。
WS20190512200539_0000.JPG

Stop conditions

強化学習を最大何分行うかを設定します。
注意:この時間=課金対象になります
下に注意事項が明記されていますので、必ず確認してください。
長く学習させると、費用が高くなります。
WS20190512200513_0000.JPG

強化学習を開始

準備が完了したら、「start training」ボタンで、最初のエンジン(モデル)の強化学習を開始します。
開始まで6分程かかりますので、しばらく待ちます。
学習中の参考画面)実際にコースを走る映像も出てきますので、見ていても楽しいです。
2019_0508_163646_000000.JPG

注意:
・この学習中の映像は、学習が終了した後に再生することはできません
 必要な場合は録画しておく必要があります。
 (映像の表示がうまくいかない場合も多いですが、回線やPCの見直しで改善することも。)
・Webブラウザを閉じたり、PCを終了しても学習は続きます
・中止したい場合は画面上のStop trainingボタンを押し、確認画面で停止する事で学習を終了させる事ができます。

強化学習の完了と最初のエンジン(モデル)が完成

強化学習が終了し、最初のエンジン(モデル)が完成したら、表示がCompletedになります。
WS20190512200535_0000.JPG

移動

次の記事
DeepRacerのはじめかた(4)Evaluation(作成したエンジンを評価)

前の記事
DeepRacerのはじめかた(2)サービスの利用開始と参考費用

Top 概要と目次 に戻る
DeepRacerのはじめかた(1)概要と目次

2
2
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
2
2

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?