Edited at

AutoAIでお手軽機械学習(その2) モデル構築編


はじめに

AutoAIでお手軽機械学習(その1) 準備編 の続編です。

環境準備は「その1」で終わったので、「その2」では実際にモデルを作ってみます。


想定ユースケース・利用データ

https://archive.ics.uci.edu/ml/datasets/bank+marketing 

に公開されているデータセット Bank Marketing Data Setを利用して、テレバンキング先の顧客が、商品を購入するかどうかを予測するモデルを作ります。

変数名
内容

age
年齢

job
仕事

marital
婚姻有無

education
教育水準

default
クレジットカードの債務不履行有無

balance
年間平均残高(€)

housing
住宅ローンの有無

loan
個人ローンの有無

contact
連絡方法

day
最終接触日

month
最終接触月

duration
最終接触時間(秒)

campaign
キャンペーン中の連絡数

pdays
最後に連絡した日からの日数

previous
キャンペーンまでに接触した回数

poutcome
以前のマーケティングキャンペーンの結果

y
商品購入有無

学習を簡略化するため、フルセットではなく、4521件のサブセットの方を利用します。

また、4521件のうち、4000件を学習データとして、残り521件をテストデータ用にリザーブしておきます。


データ準備

学習に使う以下のデータは、あらかじめダウンロードしておいて下さい。

Bank Marketing学習用CSV(bank-4000.csv)


モデル作成


Watson Studio プロジェクト管理画面の表示

最初に次のURLを指定して、Watson Studioにログインします。

https://dataplatform.cloud.ibm.com

下のような画面になるはずなので、「その1」で事前に作成したプロジェクトのリンクをクリックします。

もし、このプロジェクトが出てこない場合は、左上の「三」のアイコンをクリックして下さい。

下のようなメニューが出てくるので、「View All Projects」を選択して、事前に作成したプロジェクトを呼び出します。

下のような画面が出てくれば、プロジェクト管理画面の表示ができている状態です。


AutoAIの呼出し

画面右上の「Add to project」をクリックします。

下のようなメニューが出てくるので、「AutoAI experiment」を選択して下さい。

モデルの名称として「Bank Marketing」など、適当な名前を入力して、画面右下の「Create」ボタンをクリックします。


csvファイルのアップロード

下のような画面になるので、指示に従い、赤枠の領域に事前にダウンロードしておいたbank-4000.csvファイルを drag & dropでアップロードします。


学習の開始

画面が下のように変化するので、Column nameとして一番下の「y」を選択し、その後、画面右下の「Run experiment」をクリックします。これだけ学習が開始します。

後は、モデル作成の状況を確認するだけです。


学習の状況

図のような形で、学習が進んでいきます。

次のような画面になればモデル作成に成功しています。


学習結果の確認

それでは、学習結果について順に確認していきます。


作成済みモデル一覧

モデルがP1からP4まで4通り作成されます。下の図では、その4つのモデルが精度順にリスト表示さrています。


作成済みモデル詳細画面

個別のモデルのリンクをクリックすると詳細画面になります。

ROC曲線と精度のサマリー表

混同行列(Confusion Matrix)

特徴量最適化の結果

特徴量ごとの重要度表示

第三部では、こうやって作ったモデルをWatson Machine Learningにデプロイして、Webサービス経由でアクセスすることで、モデルの精度を検証します。

AutoAIでお手軽機械学習(その3) Webサービス編