Watsn Studio (別名 Cloud Pak for Data)は自動でモデルを作ってくれるAutoAIとかSPSS Modeler, Cognos, Jupiterなどいろいろなツールが入っていてとても便利なツールです。しかもIBM Cloudのライトアカウントを使えばすべて無料でお試し出来ます。一方最近名前をよく聞くようになってきたSnowFlake, こちらも無料のお試し版でいろいろ試せます。
今回はIBM CloudのWatsin StudioからSnowFlakeのデータベースにつなげることをやってみました。Watson StudioはSnowFlake以外にも様々なデータベースに接続してデータを見ることができます。
たとえば
Cloud Pak for DataでGoogle Big Query上のテーブルを仮想化してアクセス
https://qiita.com/nishikyon/items/ef2d60b4687b8a6c3e39
これ以外のもあるとあらゆるデータベース、オブジェクトストレージ、クラウドストレージなどに接続できます。データの場所を気にしないで Watson Studioで全てを見ることができる。そんなことも可能になります。
さて今回の手順は
1. IBM Cloudのアカウント作成(無料のライトアカウントでもOK)
2. IBM CloudにWatson Studioサービスを作成
3. SnowFlakeの無料お試しを申し込む
4. Watson StudioからSnowFlakeに繋げる
1. IBM Cloudのアカウント作成(無料のライトアカウントでもOK)
こちたから作成ください。メールアドレスがあれば作成できます。
https://www.ibm.com/jp-ja/cloud/free
2. IBM CloudにWatson Studioサービスを作成
こちらを参考にサービスを作ってください、無料のライトプランでも大丈夫
プロジェクトまで作ってください。
https://qiita.com/nishikyon/items/ba698b638300848b746e
3. SnowFlakeの無料お試しを申し込む。接続情報を取得する。
こちらを参考に申し込んでください。メールアドレスがあれば大丈夫です。
https://docs.snowflake.com/ja/user-guide/admin-trial-account.html
そしてSnowFlakeの接続情報としては
アカウント名、ログインの時に使うユーザー名、パスワード、そしてデータベース名、ウェアハウス名の5つが必要になってきます。
ログイン時のユーザー毎、パスワードはご自分で任意の門おが設定できます。
データベース、ウェアハウスはお試しアカウントで自動的に作られるのでそれを使っても良いですし自分で作ることもできます。
そして厄介なのがアカウント名。これはどこかということ、
アカウントを申し込んだ後に来たメールにありました。たとえば私は以下のような、メールを受け取りました。
あなたのアカウントにはこのURLからアクセスできますよ、というメールなのですが、ここのURLの最初のhttps://, 最後のsnowflakeconputing.com/console/login をとったところ、ここでは ”FM22406.ap-northest-1.aws” がアカウント名になります。
4. Watson StudioからSnowFlakeに繋げる
それではIBM CloudからWatson Studioのプロジェクトを立ち上げてみましょう。
今回のステップ2で作成したプロジェクトを開いてください。
次の画面の”プロジェクトに追加”をクリックしてください。
接続をクリック
SnowFlakeを選んで”選択”をクリック
接続名は任意のものを入れてください。
そしてSnowFlakeの接続情報を入れてください。そして右下の”作成”をクリックしてください。
データ資産に"SnowFlake"が追加されました。
試しにData Refinelyでデータベースのデータを見てみましょう。
”プロジェクトに追加”、”Data Refinelyフロー”と選択
接速でSnowFlakeを選ぶとSnowFlakeの中のデータベースが見れます。
データを選択すると
データが見えました!