はじめに
Oracle Analytics Cloud(OAC)の2023年3月版で、Oracle Autonomous Data Warehouse(ADW)のAutoML機能をOACから直接実行して機械学習モデルを作成し、それをOACから利用できるように登録してくれる新機能が登場しました。
別の記事では、ADWの機械学習とOACの連携をについて書きましたが、さらに簡単にADWの機械学習モデルを利用できるようになりました。
1. ADWにデータの準備をする
Oracle Analytics Cloud:ADWの機械学習モデルを使用する と同様にADWのチュートリアルに従って、「2. Database Actionsでデータロード」まで実行します。
(もちろん、最後まで試してもOKです!)
107: ADBの付属ツールで機械学習(予測モデルからデプロイまで)
機械学習の教師データとテストデータは、こちらを使わせてもらいます。
2. 接続とデータセットを作成する
OACにログインします。
「作成」から「接続」をクリックします。
接続先として「Oracle Autonomous Data Warehouse」を選択します。
ADWへのデータ準備のステップで事前に作成しておいた「OML」ユーザに関する情報を入力します。
「作成」から「データセット」をクリックします。
作成した「接続」を選択します。
スキーマを展開し「OML」を展開して「TRAIN」表をドラッグ&ドロップします。
データセットに名前をつけて保存します。
これが機械学習モデルを作成する際の教師データとなります。
3. ADWのAutoMLで機械学習モデルを作成
ホーム画面に戻り、「作成」から「データフロー」をクリックします。
今作ったばかりのデータセットが表示されるので、それを選択して「追加」をクリックします。
ステップの追加(+)をクリックして、「AutoML」を選択します。
データセットの接続先がADWの場合だけ、AutoMLステップが追加できます。
「Target」として「SURVIVED」列を選択します。
「Task Type」は「Classification」にして、「Model Ranking Metric」は「Accuracy」にします。
「モデルの保存」ステップでは、モデル名を「TITANIC_PREDICT」にします。説明は任意です。
モデルに名前をつけて保存します。
データフローを実行して、しばらく待ちます。
完了したのを確認して、ナビゲータアイコンを」クリックし「機械学習」を確認します。
「TITANIC_PREDICT」という機械学習モデルがADWに作成され、OACに自動的に登録されているのがわかります。
右クリックして、「検査」を選択します。
モデルの情報を確認できます。「閉じる」で閉じます。
4. 登録した機械学習モデルで予測
テストデータに対して、作成した機械学習モデルを適用してみます。
テストデータをデータセットとして登録するので、ホーム画面に戻り「作成」から「データセット」を選択します。
「TEST」表をドラッグ&ドロップで選択し、保存します。
TRAIN表とは、SERVICED列が無いだけで、その他の構造は同じです。
ふたたびデータフローを作成します。
「TEST」データセットを選択して「追加」をクリックします。
+をクリックしてステップを追加します。「モデルの適用」を選択します。
自動的に登録された機械学習モデルを選択します。
「列の追加」ステップを追加します。
計算式として「1」と入力し、列の名前は「人数」とします。
最後のステップとして「データの保存」を追加します。
名前をつけて保存し、データフローを実行します。
5. 予測した結果を確認してみる
データフローで保存したデータセットが「データセット」で確認できます。
クリックして、ワークブックとして開いてみます。
さらに、様々な可視化表現を加えてみました。
おわりに
事前準備として、ADWにユーザを作ったりデータをロードしたりしましたが、それ以外の作業が全部OAC内で完結できました。
ADWでの予測モデル作成やノートブックの操作も十分簡単ですが、さらにハードルが下がったように思います。