sageMakerを使ってみていてジョブの作成時にめちゃめちゃハマったのでメモ
(ハマった部分だけ記載しているので他の部分は割愛します)
とりあえずデフォルトで用意されている学習法を使ってみようと思い今回はliner learnerを選択。
トレーニングデータは自前で用意していました。
それで今回ハマったのはチャネルの作り方とトレーニングデータの作り方。
もともと作成していたトレーニングデータは1~5列目に説明変数、6列目に目的変数を記載していました。
コンテンツタイプにtext/csv;label_size=<num>
の<num>
に目的変数が記載してある列番号書いとけばいいのかなって思ったのでtext/csv;label_size=6
ってしてジョブを作成していたのですが何度やってもfailed...
ヘッダつけてるからダメなのかなって思ってヘッダ消したけどやっぱダメでした。
結局AWSのドキュメント見て気づいたのですが
コンテンツタイプをtext/csv
にしてトレーニングデータの1列目に目的変数を記載してねって書いてあったのでトレーニングデータを書き換えることで無事にジョブが通りました。
まだモデル作成等はやっていないのでこれからやります。
追記
記事書いた直後にモデル作成とかもやったのですがモデル、エンドポイントの作成では特にハマることなくできました
ただエンドポイントを作成してどうやって使ったらいいのか全くわからない......
どなたかわかる方がいらっしゃいましたらご享受お願いします
追記2
エンドポイント作成して実際に使うことができましたので記事にしました
やったね