はじめに
今日イベントでAmazon forecastで時系列予測の事例紹介を見たところ
とてもお手軽にできそうな感じがつかめたのでその日のうちにやってみた。
参考:https://dev.classmethod.jp/cloud/aws/amazon-forecast-getting-start/
大きな流れはコチラ。
1. 学習データを取得する
2. 学習データのインポート
3. amazon forecastの設定 ←今回はココ!
4. 学習結果の確認
3. amazon forecastの設定
ここからがamazon forecastの本領。
まずはawsからamazon forecastのサービスを探してアクセス
TOP画面がコチラ。[Create dataset group]クリック
dataset groupの名前を決める。なんでもいい。
forecast domainはどういう性質のデータを取り扱うのか?を訪ねている。
売上予測とかシフト計画とか色々選べるけど、
残念ながら今回の気温の推移に関する選択肢はなかったので
Customを選択して[Next]クリック
続いて、データセットに読み込ませる要素(カラム列)の指定
最低限必要な要素はデフォルトの画面にも表示しているように
- item_id ←アイテムID(今回の場合だと地名)
- timestamp ←日付
- target_value ←目的変数(今回の場合だと気温)
上記3種が最低限必要。
なお、AttributeNameはS3に保管したcsvファイルのカラム名に相当するのでそこの名前を合わせるのがポイント。
ちなみに今回の記事ではforecastのデフォルトの名前に合うように自分が用意したcsvのカラム名を合わせました。
Attributetypeは値の型。ほんとはもっと多彩なtypeが選べるとは思うけど、今回はたまたまうまいこと型を変えずに済んだのでこのままでいく。
次の画面はデータセットの詳細設定画面。
タイムスタンプの書式もと工夫できるっぽいけど今回はデフォルトの型と合わせているので対応不要。
DataLocationでは、S3に格納したcsvファイルのパスを指定すればよいようだ。さっきパスコピーした値をセット。
いよいよ、データのインポート~学習結果の確認といった
学習フェイズの画面。
まずはdatasetのインポートから。
画面左側の[target type your data]のところの[Start]クリック。意外と時間かかる。今回のデータだと5分程度かかった。
インポート完了したこんな感じ。
続いていよいよ学習の開始。[Predictor Training]の[start]クリック
学習モデルの設定画面。
forecastHorizonはどんだけ未来まで予測するかを指定できる。
Algorithm Selectionは学習モデルを選択できる。
ここでCustomを選んで癖のあるモデルにしたいところだけど
今回はお手軽なAutomatic[AutoML]を選択。で、[Train Predictor]クリック
学習完了!いよいよ結果発表!というところで次の記事に続く~。
おわりに
時系列予測プログラムを作るときの要となる部分が
Automatic[AutoML]を選択するだけで完了する、
驚異的なお手軽さ。これがamazon forecast。まじやばい。
アルゴリズムのチョイスもさることながら
モデル評価も本来は大変なはずなんだけど
それもまるっとお任せできてしまう。それがamazon forecast、まじやばい。大事なので2度言いました。
~次回へ続く~