はじめに
私はMicrosoft Azureを2022年3月から約3ヶ月間使用しています。しばしばAzure Portalで迷子になる程のAzure初心者です。
この度、「Qiita Engineer Festa 2022」というイベントを知り、良い機会なのでAzure Machine Learningに入門してみました。
使用する教材
教材は、Azure公式の「チュートリアル: Azure Machine Learning Studio でコードなし自動機械学習を使用して需要を予測する」を使用しました。
準備
Azure Portalにログイン
Azureのアカウントがない方は以下から無料で作成できます。
Azureのアカウントが作成できたらAzure Portalにログインします。
Azure Machine Learning の作成
Machine Learningの「作成」をクリックします。
以下のように値を設定します。(その他の設定項目は自動入力に従います。)
設定項目 | 値 | 備考 |
---|---|---|
リソースグループ | qiita | 新規作成 |
ワークスペース名 | qiita | |
コンテナレジストリ | qiita | 新規作成 |
問題がなければ「検証に成功しました」と表示されますので、「作成」をクリックします。
Azure Machine Learning Studio
データセット(CSV)のダウンロード
bike-no.csvをダウンロードします。
自動機械学習ジョブの作成
Microsoft Azure Machine Learning Studio(以下、Studio)を開いたら、作成者の「自動ML」をクリックし、「新規の自動機械学習ジョブ」をクリックします。
データアセットの選択
「作成」をクリックし、次に「ローカルファイルから」をクリックします。
ローカルファイルからデータセットを作成
基本情報を入力します。今回は名前は「qiita」、データセットの種類は「表形式」、説明は「qiita記事用データセット」とします。「次へ」をクリックします。
データストアとファイルの選択
「workspaceblobstore」を選択します。データセットは先ほどダウンロードしたbike-no.csvを参照するようにします。「次へ」をクリックします。
設定とプレビュー
設定項目 | 値 |
---|---|
ファイル形式 | 区切り |
区切り記号 | コンマ |
エンコード | UTF-8 |
列見出し | 最初のファイルのみにヘッダーがある |
行のスキップ | なし |
「次へ」をクリックします。
スキーマ
casualとregisteredを無視するように、トグルスイッチをOFFにします。「次へ」をクリックします。
データアセットの選択(再び)
「最新の情報に更新」をクリックし、データアセットから「qiita」を選択し、「次へ」をクリックします。
ジョブの構成
設定項目 | 値 |
---|---|
新しい実験名 | automl-mikeshare |
ターゲット列 | cnt(Integer) |
コンピューティングの種類 | コンピューティングクラスター |
「新規」をクリックし、コンピューティングクラスターを作成します。
コンピューティングクラスターの作成
仮想マシン
設定項目 | 値 |
---|---|
バーチャルマシン層 | 専用 |
仮想マシンの種類 | CPU |
仮想マシンのサイズ | Standard_DS12_v2 |
以上を設定し、「次へ」をクリックします。
詳細設定
設定項目 | 値 |
---|---|
コンピューティング名 | bike-compute |
最小ノード数 | 0 |
最大ノード数 | 1 |
スケール ダウンする前のアイドル時間 (秒) | 120 |
以上を設定し、「作成」をクリックします。
ノード数はケチりました。公式チュートリアルでは最小ノード数1、最大ノード数6となっています。
ジョブの構成(再び)
先ほど作成した「bike-compute」を選択し、「次へ」をクリックします。
タスクと設定の選択
「時系列の予測」を選択し、以下のように設定し、「次へ」をクリックします。
設定項目 | 値 |
---|---|
時系列 | date(Date) |
時系列ID | 自動検出 |
頻度 | 自動検出 |
予測期間 | 自動検出 |
検証とテスト
「終了」をクリックします。
すると以下のような画面になります。終了するまでしばらく待ちます。(約50分)
モデルの調査
「モデル」タブを選択するとテストされたアルゴリズム (モデル) を確認できます。
モデルのデプロイ
今回は平均平方二乗誤差が最も低かったアルゴリズム名「VotingEnsemble」を選択し、「デプロイ」をクリックし、「Webサービスへの配置」をクリックします。
設定項目 | 値 |
---|---|
名前 | bikeshare-deploy |
説明 | Qiita記事用デプロイ |
コンピューティングの種類 | Azureコンテナーインスタンス |
テスト
アセットの「エンドポイント」をクリックし、「bikeshare-deploy」をクリックします。
「テスト」タブをクリックし、dateに「2023-01-01T00:00:00.000Z」を入力後、「テスト」をクリックすると、右側にテスト結果が表示されます。
{
"Results": {
"forecast": [
1009.0995173136394
],
"prediction_interval": [
"[-74879.55713775268, 76897.75617237993]"
],
"index": [
{
"date": 1672531200000
}
]
}
}
不要になったらリソースグループの削除を!
今回はリソースグループをqiitaにしましたので、Azure Portalでリソースグループを削除します。
種類「リソースグループ」かつ名前「qiita」をクリックします。
リソースグループ名に「qiita」を入力し、「削除」をクリックします。
今回の入門はこれで以上となります。
まとめ
- Azure Machine Learningは無料の公式ドキュメント(チュートリアル等)が非常に充実しています。
- 操作の習得であれば別途書籍等は必要ないと思います。
- AutoMLは1行もコードを書く必要がありませんでした。
稚拙な文章にお付き合いいただき、ありがとうございました。
入門してみたら非常に簡単にできました。
皆様も素敵なAzure Machine Learningライフを!