はじめに
Oracle Analtyics Cloud(OAC)には、機械学習テクノロジーを活用する様々な機能が搭載されています。
データ・フローでは、OACで機械学習モデルを構築し、それを適用することができます。
事前にAutonomous Data Warehouse(ADW)で構築された機械学習モデルを登録しておけば、それをデータ・フローのステップとして利用することもできます。
この記事では、ADWに定義されている機械学習モデルをOACのデータフローで使用する方法を紹介します。
1. ADWで機械学習モデルを作成する
ちょうど良いチュートリアルがあったので、これに沿ってADWのAutoML機能を使用して機械学習モデルを作成してみました。
-
107: ADBの付属ツールで機械学習(予測モデルからデプロイまで)
このチュートリアルは、タイタニック号の生存者予測をするもので、実行したのは「3. OML AutoML UIで生存予測モデル作成」までです。
もちろん、興味があれば最後までやりきってもいいと思います!
2. OACでADWへの接続を作成
「作成」メニューから「接続」を選択します。
接続先として「Oracle Autonomous Data Warehouse」を選択します。
機械学習チュートリアルで作成した「OML」ユーザを使用します。
必要な情報を入力し「保存」をクリックします。
3. ADW内のテストデータをデータセットとして定義
「作成」メニューから「データセット」を選択します。
機械学習チュートリアルを実行していれば、OMLユーザが「TEST」表を所有しているはずなので、これをデータセットとします。
先程作成した「接続」を選択します。
「TEST」表を「Titanic Test」という名前のデータセットとして保存します。
これは、後で使用します。
4. ADW内の機械学習モデルを登録
ホーム画面に移動します。
ページメニューから機械学習モデルを登録します。
データセットを作成したときに使用したのと同じ「接続」を選択します。
機械学習モデルが一覧表示されるので、先程チュートリアルで作成したものの中から一つを選択し、「登録」をクリックします。
5. OACのデータ・フローを作成、実行
「作成」メニューから「データフロー」を選択します。
事前に作成しておいたデータセット「Titanic Test」を選択します。
「+」をクリックしてステップを追加します。
「モデルの適用」を選択します。
登録した機械学習モデルを選択して「OK」をクリックします。
「+」をクリックしてステップを追加します。
「データの保存」を選択します。
「データセット」「データセット表」「表」に「TITANIC_PREDICT」と入力し、データフローを保存します。
データフローを実行します。
6. 結果の確認
予測した結果は、ADWに「TITANIC_PREDICT」という名前の表として保存されます。同時にOACのデータセットとしても自動的に登録されます。
データセットからワークブックを作成してみました。
SURVIVED列は、「0 = No, 1 = Yes」です。
PCLASS列は、「1 = 1st, 2 = 2nd, 3 = 3rd」です。
男性よりも女性が、またより高いチケットの購入者の方が生存者の割合が高いと予測されました。
おわりに
OACには、データフローからADWのAutoML機能を呼び出して使用する機能が搭載されています。
この機能を使用すると、ADWの画面をほとんど見ることなく機械学習モデルの作成と利用ができてしまいます。
よろしければ、そちらも試してみてください。