はじめまして。株式会社キカガクの小池です。
キカガクは、「AI を含めた先端技術の研修」を行っている会社です。
機械学習を学びたい
機械学習の構造を学びたい
だけど、プログラミングをしたことがない。コードを覚えるのは大変そう。
本記事はそういった機械学習初学者の方、機械学習を使用したビジネスサイドの方向けの記事になっています。
今回は Azure Machiene Lerning サービスの内の1つである Microsoft の Machiene Lerning デザイナーを使用します。
こちらはコードをかかずに機械学習モデルの構築、デプロイを行うことができる画期的なサービスです。
今回は機械学習モデルの構築について解説します!!
今回はサンプルデータを使用し、分類問題に取り組んでいきます。
分類の目的は、どのデータがどの種類に属するのかを見ることです。
図のような例であれば未知のデータはカテゴリ A に分類されそうですね。
入力されるデータがいくつかのグループに分けられることを前提として、グループ内で細かな違いを無視することになります。
プロットするとすれば分類はデータ全体をできるだけ分けるように線を引くことに相当します。
- 犬 or 猫
- 上がる or 下がる
- A さん or B さん or C さん
のような例は分類のタスクとなります。
それでは Machiene Lerning デザイナーを使用しましょう。
事前準備
こちらでは Azure を使用して行きますのでサブスクリプションの登録が必要になります。初めて利用する方は無料で使用できます。初めてでない方でも数十円程度で実装できます!
リソースの作成
まずはリソースの作成をします。アプリをダウンロードするイメージです。
machine learning と検索して頂き作成を押してください。
リソースの設定は画像の通りです。設定ができましたら作成を押してください。
作成が完了しましたらスタジオの起動を押してください。
起動後、このような画面に遷移します。こちらが Azure Machine Learning のホーム画面です。
こちらで機械学習モデルの構築、運用を行うことができ、今回使用するデザイナー以外にも自動機械学習、 Notebook を使用して機械学習モデルを構築することができます。それではデザイナーを使用して行きましょう。今すぐ開始をクリックしてください。
新しいパイプラインの+を押してください。 Dense Net を使用した画像分類モデル構築の例などもみることができます。
その後、このような画面に遷移します。デザイナーを使う前に、使用する演算装置を設定する必要があります。
コンピューティング先を設定を押してください。こちらでどのコンピューティング先を選ぶかによって値段が変わってきます。
より演算速度の早いもののほうが値段も高くなります。今回は推奨されているものをそのまま使用します。
ここまでで Azure Machine Learning デザイナーの初期設定が完了です。
学習の実行
それでは実際に Azure Machine Learning デザイナーを使用して機械学習分類モデルの構築を行っていきましょう。
機械学習におけるモデル構築の流れは次の通りです。
1. 使用するデータの準備
2. データの分割
3. 使用するアルゴリズムの定義
4. モデルの学習
5. モデルの検証
6. モデルの評価
もちろん他にもデータの前処理やハイパーパラメータ調整などの手順もありますが今回はモデル構築の基本的な部分にのみ解説を行っていきます。
1.使用するデータの準備
今回はサンプルのデータセットの米国国勢調査局提供の、成人収入に関する二項分類データセットを使用します。
画像にあるデータセットを作業場へドラッグアンドドロップしてください。
もちろん自前のデータセットをアップロードしモデル構築をすることもできます。
このようにドラッグアンドドロップ出来ていれば Good です。
◯を押して頂き
視覚化を行うことによって
このようにデータセットの可視化を行うことができます。
これだけでもコードを使用せずに簡単に可視化できるという点で驚いた方もいらっしゃるかと思います。
今回は統計データを使用して対象の人々を分類し、個人が 1 年間に 50,000 ドル以上の年収を得られるかどうかを予測します。
実際に機械学習を行っていく際には、文字列を数値に変換する処理が必要なのですが、このあたりも自動で行ってくれます。
もちろん、手動で変換処理を定義することもできます。
2. データの分割
データの準備ができましたらデータの分割を行います。
データの分割を行わなくても、モデルを学習することができます。
しかし、モデルの学習を行う際には、モデルをテストすることも視野に入れる必要があります。
なぜなら、学習に使用したデータセットに対してうまく分類を行えるかのテストを行っても、適切なテストではないからです。(受験勉強で、勉強した過去問で実力テストを行うようなイメージを持つとわかりやすいです。)
そのため、データセットを学習に使用するデータセットと、テストに使用するデータセットの 2 つに分割します。
Data Transformation より Split Data を選択してドラッグアンドドロップしてください。
データの分割の割合を定義します。
学習データ80%、テストデータ20%をしております。
その後、データセットの◯とデータ分割の◯を線でつないでください。
こうすることによって処理の流れを定義しています。
3. 使用するアルゴリズムの定義
今回は決定木をベースとしたアルゴリズムで実装を行います。
決定木は条件分岐を繰り返すことにより分類を行う手法です。
他にもディープラーニングやサポートベクターマシンなどと言った手法があります。
4. モデルの学習
アルゴリズムの定義ができましたら学習をさせます。
こちらで Column を選択します。データの何を予測させるかを選択します。
今回はincome(収入)を予測させます。
5. モデルの検証
学習ができたら検証を行います。
学習とデータ分割をした際のデータを線でつないでください。
Model Scoreing & Evaluation より Model Scoreing を選択しドラッグアンドドロップしてください。
こちらは Score Model を可視化したものです
予測値が算出されていることが確認できます。
また Scored Probabilities という名前で各予測に対する確率を確認できます。
(つまりどのくらい機械が自身を持って予測をしたのかを確認できます。)
それでは全体でどれだけ正解していたのかを確認するために 6. モデルの評価をみていきましょう。
6. モデルの評価
Model Scoreing でも予測の結果をみることができます。
ここでは、最終的に予測がどれくらいあっているのかを確認するため、 Model Scoreing & Evaluation より Evaluate Model をドラッグアンドドロップしてください。
こちらをドラッグアンドドロップしました機械学習モデル構築の流れは以上になりますので、右上の送信ボタンを押してください。
そうすると実行のセットアップ画面に遷移します。こちらを行ったあとに再度送信を押してください。
こちらを押すことによって一連の処理が実行されます。
画像右上のように実行中となっていましたら処理が行われています。
より複雑な処理を定義すればするほど実行時間は長くなります。
実行された処理は完了という表示になります。完了まで 5 分ほどお待ち下さい。
実行が完了すると全体の正解率を確認できます。
また混合行列という画像の出力もされますので各値に対してどれくらい予測があたっていたのかを確認することができます。
このようにして簡単に機械学習モデルを構築することができました。
あとはこのモデルをデプロイすることによってこのように簡単にこちらのモデルを使用できます。
デプロイを行う方法の詳細については、第二弾としてまとめていきたいと思います。
待ちきれないという方はこちらの「モデルのデプロイ」を参照してください。
Microsoftの Machiene Lerning デザイナーを使用してGUI(ドラッグアンドドロップ)で機械学習モデルを構築の流れを御紹介してきました。
ありがとうございました。
お知らせ
動画を通じて、ディープラーニングが一から学習できる大人気コースの脱ブラックボックスが無料になりました。
手書きの数学とハンズオン形式のプログラミングによって、初学者でも安心して一から学習できます。
機械学習やディープラーニングを基礎から実践を学びたい方は、ぜひ教材の1つとしてご利用ください!
▶︎ 脱ブラックボックスコースを無料で学び始めたい方はこちら!