LoginSignup
3
1

More than 3 years have passed since last update.

AutoAI使ってCSVデータの一括予測

Last updated at Posted at 2020-11-02

 AutoAIはとても便利なツールです。データがあれば(これが実は大変なのかもしれませんが)簡単に予測モデルを作ることができます。
具体的にはcsv形式のデータをアップロードして予測したい項目を選択してあとはAutoAIにお任せ、自動的にモデルを作ってくれます。
詳細はこちらのブログが参考になりました。
AutoAIでお手軽機械学習(その1) 準備編
 ところでモデルを作るまでは超簡単だったのですが実際に予測を行う場合、例えば予測したいデータがCSVとしてあって一括予測したい場合にはプログラムを書いてAPIを呼び出す必要があってちょっと面倒でした。
が、最近新しい機能が追加されてそれが簡単になったようなのでメモしておきます。
参考にした記事はこちらです。
AutoAIでお手軽機械学習(その3) Webサービス編

 今回はKaggleにあったタイタニックのデータ(train.csv)でモデルを作成、バッチでテストデータ(test.csv)の予測を行うということをやってみました。
タイタニックデータ

手順は
- モデルの作成
- デプロイメントステージにモデルをプロモート
(この2つは上の記事を参考に進めました)
- バッチを利用してモデルのデプロイメント
(ここではこの手順を書いておきます)

モデルを作成してデプロイメントスペースにプロモートした後の図がこちらです。予測で使うデータセット(test.csv)も予め入れておいた方がいいです。
image.png
Space1というデプロイメントスペースにモデルが表示されています。(ここではTitanicとbank) Titanicを使うのでそちらをクリック
そしてデプロイメントの作成をクリック
次に以下の画面が出てくるので”バッチ”をクリック
任意の名前を入れて一番下にあるハードウェア定義を選択、右下の”作成”をクリック
image.png
次に”ジョブの作成”
ジョブ名の入力
image.png
ハードウェアの選択、スケジュール(任意の時間にスタートできるように設定できるようです)と続けます。(基本デフォルトのまま行きました)
次にデータの選択があるので入力にtest.csvを選択、出力ファイルに任意のファイル名を入れます。
image.png
次をクリックして次の画面で作成をクリックします。
これであとは待つだけです。
image.png
ジョブ名をクリックすると状況が表示されます。
image.png
デプロイメントスペースのデータ資産に先ほどしてしたデータができてますね。
image.pngimage.png

ダウンロードして確認してみてください!

ちなみに上でやったものをKaggleにあげたらこんな結果でした。
image.png
全部で17539の中で5744だから悪くはないです。
たくさんの人が真似しそうですが。

3
1
1

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
3
1