こちらでは軽くウォークスルーしましたが、Genieにフォーカスして再度ウォークスルーします。
公式ブログも公開されています。
Genieとは何か
マニュアルからの引用。要は自然言語(日本語)だけでデータ分析できる環境です。
AI/BI Genieは、DatabricksIQ を搭載したコード不要のインターフェースで、ビジネスユーザーが自然言語を使用してセルフサービスのデータ分析を実行できるようにします。データアナリストなどのドメイン エキスパートは、データセット、サンプル クエリ、テキスト ガイドラインを使用してGenieスペースを構成し、genieがビジネス上の質問を分析クエリに変換できるようにします。設定後、ビジネス ユーザーは質問をしたり、視覚化を生成したりして、運用データを理解できます。Genieは、データの変更やユーザーからの新たな質問に応じて、セマンティックナレッジを継続的に更新します。
今回のウォークスルーを通じて、特に Genieは、データの変更やユーザーからの新たな質問に応じて、セマンティックナレッジを継続的に更新します。 が重要なポイントだと思いました。最初の回答が期待通りじゃなくても会話を通じて改善していくことができます。
Genieの有効化
ユーザーアイコンからプレビューにアクセスして、Genie Spacesを有効化します。
Genieスペースの作成
Genieで作業する際には、Genieスペースを作成する必要があります。画面右上の +New をクリックします。
以下を設定します。タイトルや説明文は他のユーザーが理解しやすくするためのものです。
- Title: Ginieスペースの名称
- Description: 説明文
- Defalut Warehouse: 処理に使用するウェアハウス
- Tables: 分析で使用するテーブル
- Sample Questions: 他の方が利用する際に参考になる質問例
ベストプラクティス
- Genieスペースを作成する際には、スペースの目的に適したテーブルのみを追加するようにします。そうすることで、特定のテーマにフォーカスすることができます。さらに、テーブルに余計な列が含まれている場合には、列を除外したビューを作成しGenieスペースに登録しましょう。
- やり取りの精度を上げるためには、テーブルやカラムに適切なコメントが追加されているべきです。
ということで以下のテーブルを登録します。
その他、質問例も追加しています。Saveをクリックすることでスペースが作成されます。
Genieスペースでの分析
結果は返ってきましたが、レスポンスが英語です。
左上のNew Chatをクリックしてやり取りをリセットします。
以下のプロンプトで日本語で回答するように指示します。
こんにちは。回答は英語を使わず日本語で回答してください。
テーブルの情報を聞いてみます。
どのようなデータがありますか
都道府県別の感染者数の推移
しつこく日本語でお願いしましょう。
日本語で説明してください。
なお、データが返ってきた際、下部にいろいろなボタンが表示されます。
左から
- ポジティブフィードバック
- ネガティブフィードバック
- レスポンスの再生成
- 結果をクリップボードにコピー
- 結果をCSVでダウンロード
- サンプルのインストラクションとして保存
- Show generated code: 生成されたコードの表示
となっています。インストラクションとして保存することで、Genieのレスポンス生成をガイドすることができます。
また、やりとりしている背後ではSQLが生成されています。これを確認するにはShow generated codeをクリックします。
元々のテーブルcovid_cases_base
には都道府県のデータしか入っていませんが、地方別の集計結果も欲しくなりました。
地方別の感染者数の推移
なお、この時点で背後ではテーブル結合を行なってくれています。
SELECT
p.Area,
c.date_timestamp,
SUM(c.Cases) as TotalCases
FROM
takaakiyayoi_catalog.japan_covid_analysis.covid_cases_base c
JOIN takaakiyayoi_catalog.japan_covid_analysis.pref_area p ON c.Prefecture = p.Prefecture
GROUP BY
p.Area,
c.date_timestamp
ORDER BY
p.Area,
c.date_timestamp
そして、可視化も指示できます。
可視化して
その他の機能
インストラクション
上でのやり取りのように、プロンプトで毎回指示するのではなく、一般的な指示やSQLの例を追加することで、Genieの挙動をガイドすることができます。先にこちら使っておくべきでした。
あなたは日本におけるCOVID-19の感染者数に関するエキスパートです。与えられた質問に対して英語を使わずに日本語で回答します。
データ
モニタリング
どのユーザーがどのような質問をしたのか、結果に満足したのかなどを一覧で確認できます。
設定
Genieスペースの共有
作成したGenieスペースは権限を設定することで他ユーザーと共有することができます。画面右上のShareをクリックすることで、リンクをコピーしたり、ワークスペース上でGenieスペースを確認できます。
所感
全部日本語でできるというのは、アシスタントの時も感じましたが新たな体験だなと。
期待しない挙動をする際には、丁寧かつ根気強くやりとりしていくことが大事なのだなと。って、こういう感想を製品のレビューで書くことになるとは...。
こちらのベストプラクティスも感慨深いです。
- 回答の品質を確認するには、Genieスペースをテストします。モデルが期待どおりの回答を提供するかどうかを確認するには、次のことを試してください。
- 提供した質問を言い換えてください。
- データセットに関連するその他の質問をしてください。
- 質問に対して期待通りの回答が得られるまで、 Genieスペースの指示を追加および調整します。