目次
1. AutoML Tablesチュートリアル 〜概要編〜
2. AutoML Tablesチュートリアル 〜セットアップ編〜(近日公開)
AutoMLとは
・最小限の労力と機械学習の専門知識で、高品質のカスタム機械学習モデルをクラウド上で作成できるGUIのツールです
・Google Cloud Platform(GCP)の無料枠(12ヶ月, $300まで)の範囲内なら使用は無料です。
・学習用/予測用データセットさえ用意すれば、あとは画面の指示に従ってボタンを押すだけである程度の精度のモデルが組め、予測できます。
AutoMLのバリエーション
データの種類 | 名称 | |
---|---|---|
1 | 構造化データ | AutoML Tables |
2 | テキスト | AutoML Natural Language |
3 | テキスト | AutoML Translation |
4 | 画像 | AutoML Vision |
5 | 画像 | AutoML Video Intelligence |
AutoMLには分析するデータの種類や目的に応じて、様々なバリエーションがあります。 | ||
今回は、**構造化データ(表データ)**に基づいて、機械学習モデルを作成するAutoML Tablesについて説明します。 |
AutoML Tablesとは
・複数の説明変数(特徴量)と1つの目的変数(ターゲット)を含んだ表データをもとに機械学習モデルを作成し、予測を行うことができます。以下は表データの例です。
・学習データをインポートし、説明変数と目的変数を指定すれば、クラウド上で学習のための計算を自動で行います。
・学習が終わればメールで通知してくれるので、モデル作成中は待つだけでよく非常に便利です。
AutoML Tablesの仕組み
1.学習用の構造化データ(表形式データ)をインプットします。
2.データのスキーマを定義(各変数は数値かカテゴリかなど)します。
3.目的変数(ターゲット)と説明変数(特徴量)を選択します。
4.学習データに基づき、機械学習モデルのトレーニングを行います。
ー特徴量エンジニアリング
ー適切なモデルの選択&アンサンブルモデルの作成
ーハイパーパラメータチューニング
5.作成したモデルの評価を、各評価指標を用いて実施します。
6.作成したモデルをデプロイします。
7.モデルに予測データを入れて、予測を行います。
8.予測結果を表示します。
AutoML Tablesの料金
・初回に限り、6時間分無償でモデルをトレーニング可能です。
・モデルトレーニング1時間あたり$19.36 請求されます。
・作成したモデルで予測を行う際は1時間あたり$1.16 請求されます。
・請求は秒単位まで計算して行われます。
・Google Cloud Platform(GCP)の無料枠**(12ヶ月, $300まで)**の範囲内なら使用は無料です。
AutoML Tablesの実績
・Fox Sports社のマーケティングチームはAutoML Tablesで作成した機械学習モデルを用いて、クリケットにおいて、各プレーが起こるタイミングを事前に予測することを可能にしました。この予測結果を用いて、クリケット中継のカメラアングルなどを変更することで、1ドルの支出に対する契約者数が150%もUPしました。
・Jam City社のリードデータサイエンティストは、AutoML Tablesを用いて、ハリーポッターのゲームでのプレーヤーの動きを予想できるようになりました。予測結果を用いることで、課金をするプレーヤーの行動が明らかになり、効果的な広告費の運用につながりました。
・Kaggleが主催するハッカソンイベントの、KaggleDays SF Hackathonにおいて、自動車部品についての素材の特性とテスト結果の情報を与えて、製造における欠陥を予測する課題にAutoML Tablesを用いたGoogleのチームが参加しました。結果は74組中、僅差の2位を獲得しました。他のチームが手動で懸命に特徴量エンジニアリング、ハイパーパラメータチューニングを行う中、GoogleのAutoMLを用いたチームはモデルが自動的に作成されるのを監視していただけでした
参考文献
AutoML テーブル Google Cloud
[開発者のための機械学習入門]
(https://www.slideshare.net/uesaka/azure-machine-learning-studio-148264288)
Google Developers Japan: GoogleのAutoMLがKaggleDaysでの表形式データのコンペで2位に