0
1

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?

More than 1 year has passed since last update.

【AutoML】チュートリアルを使って分類モデルを作ってみる【Azure】

Posted at

今回はAutoMLのチュートリアルをやってみたいと思います。
この記事ではAzureMLStudio上での操作で実行をしていきます。

ワークスペースやクラスターの作成、実行方法等は最初の記事を参考にしてください。

データの追加

それではまずはAutoMLのジョブを作成していきます。
image.png

左上の新規機械学習ジョブを開きます。

次にデータの選択、登録です。
image.png

今回はtitanicのデータを用意してみたいと思います。
以前の記事でデータストアに登録しているのでそちらを持ってきたいと思います。
image.png
データセットの名前を決めて
image.png
データを選択して
image.png
データの設定をします。
この時データ内に複数行(改行してるデータ)があるかを指定します。
存在する場合は別途処理をするようなので速度が低下するようです。

image.png

その後学習に利用するデータの設定をします。
学習に含めるか、データの型の指定を行えるようです。
また日付型の場合は形式の設定ができるみたいですね。
データの型は初期値としておおむね正しいものが設定されているようなのであまり気にしなくてもよさそうです。
今回はSurvivedの項目を整数からブールに変更してみました。
image.png
最後に確認して登録します。
image.png
ちゃんと追加できました。

ジョブの構成

続いてジョブを設定していきます。
image.png
実験の名前と予測対象のカラム名を指定し、学習に用いるコンピューティング先を指定します。

タスクと設定の選択

ここではどのアルゴリズムで学習させるかを選択できるようです。
image.png

予測対象から自動で最適なものを選んでくれてるようです。
異なるものが選択されていればここで修正できますね。
今回はこのまま分析で行います。
ディープラーニングの有無も選べます。
今回はなしで行きましょう。

検証とテストの種類を選択

ここでは検証方法とテストデータの設定ができます。
image.png

検証にはいくつか種類があるようですが自動という項目があるので今回はこれで行きたいと思います。
image.png

テストデータについては、自分で指定するか分割するかを選べるようです。
今回はテストデータ30%で分割してもらいましょう。
その後実行します。

image.png
実行できました。
完了まで待ってみましょう。

結果の確認

実行終了までに55 分 48.33 秒かかりました。
全部で58個のモデルが作られているようです。
image.png
一番良かった結果には説明がついてるようです。
こちらを確認してみましょう。

説明プレビュー

説明タブではデータについてが可視化されているようです。
重要度やデータの分布が確認できるようです。
image.png

メトリック

メトリックでは精度指標が可視化されて確認できるようです。
image.png

データ変換

データ変換タブではどのようにデータが処理されているかを可視化してくれています。
image.png

テスト結果

テスト結果タブではテストデータを用いた結果を可視化してくれています。
表示内容はメトリックと同じようですね。
image.png

成果物

出力とログを確認してみたところ、model.pklというモデルファイルがありました。
このモデルが使えると思ったなら、これを利用して運用することができるのかなと思います。
image.png

デプロイ

作成したモデルをデプロイします。
リアルタイムエンドポイントとwebサービスへの配置がありますが、今回はwebサービスへの配置を行ってみたいと思います。
モデルのページからデプロイを選択します。
image.png

名前等の設定を行うとデプロイができます。
image.png

デプロイしたモデルのテストを行ってみます。
image.png

実行結果がjsonで帰ってきてますね。今回はfalseになったようです。

まとめ

今回はAutoMLをStudio上で実行してみました。
58個もモデルを作ってるためか時間はかかってしまいましたね。
このモデルの作成数についてですが、ジョブの作成時にタスクと設定の項目に追加の構成設定をする項目がありました。
中身を見てみると、終了の目標閾値や実行したいモデルの種類を選択できるようです。
image.png

こちらを設定することで短時間で任意のモデルを確認することができるようになりますね。
次回はこれらをpythonから実行してみたいと思います。

0
1
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
0
1

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?