3
1

こちらでは軽くウォークスルーしましたが、Genieにフォーカスして再度ウォークスルーします。

公式ブログも公開されています。

Genieとは何か

マニュアルからの引用。要は自然言語(日本語)だけでデータ分析できる環境です。

AI/BI Genieは、DatabricksIQ を搭載したコード不要のインターフェースで、ビジネスユーザーが自然言語を使用してセルフサービスのデータ分析を実行できるようにします。データアナリストなどのドメイン エキスパートは、データセット、サンプル クエリ、テキスト ガイドラインを使用してGenieスペースを構成し、genieがビジネス上の質問を分析クエリに変換できるようにします。設定後、ビジネス ユーザーは質問をしたり、視覚化を生成したりして、運用データを理解できます。Genieは、データの変更やユーザーからの新たな質問に応じて、セマンティックナレッジを継続的に更新します。

今回のウォークスルーを通じて、特に Genieは、データの変更やユーザーからの新たな質問に応じて、セマンティックナレッジを継続的に更新します。 が重要なポイントだと思いました。最初の回答が期待通りじゃなくても会話を通じて改善していくことができます。

Genieの有効化

ユーザーアイコンからプレビューにアクセスして、Genie Spacesを有効化します。
Screenshot 2024-06-18 at 11.01.48.png

サイドメニューのGenieをクリックします。
Screenshot 2024-06-18 at 11.05.20.png

Genieスペースの作成

Genieで作業する際には、Genieスペースを作成する必要があります。画面右上の +New をクリックします。
Screenshot 2024-06-18 at 11.10.08.png

以下を設定します。タイトルや説明文は他のユーザーが理解しやすくするためのものです。
Screenshot 2024-06-18 at 11.12.13.png

  • Title: Ginieスペースの名称
  • Description: 説明文
  • Defalut Warehouse: 処理に使用するウェアハウス
  • Tables: 分析で使用するテーブル
  • Sample Questions: 他の方が利用する際に参考になる質問例

ベストプラクティス

  • Genieスペースを作成する際には、スペースの目的に適したテーブルのみを追加するようにします。そうすることで、特定のテーマにフォーカスすることができます。さらに、テーブルに余計な列が含まれている場合には、列を除外したビューを作成しGenieスペースに登録しましょう。
  • やり取りの精度を上げるためには、テーブルやカラムに適切なコメントが追加されているべきです。

ということで以下のテーブルを登録します。

Screenshot 2024-06-18 at 11.19.13.png
Screenshot 2024-06-18 at 11.19.42.png

その他、質問例も追加しています。Saveをクリックすることでスペースが作成されます。
Screenshot 2024-06-18 at 11.26.07.png

これでスペースが作成されました。
Screenshot 2024-06-18 at 11.23.29.png

Genieスペースでの分析

早速、質問例を試してみます。
Screenshot 2024-06-18 at 11.33.01.png

結果は返ってきましたが、レスポンスが英語です。

左上のNew Chatをクリックしてやり取りをリセットします。

以下のプロンプトで日本語で回答するように指示します。

こんにちは。回答は英語を使わず日本語で回答してください。

テーブルの情報を聞いてみます。

どのようなデータがありますか

日本語で回答が得られるようになりました。
Screenshot 2024-06-18 at 11.40.32.png

都道府県別の感染者数の推移

それでも英語で返ってくることはあります。
Screenshot 2024-06-18 at 11.41.35.png

しつこく日本語でお願いしましょう。

日本語で説明してください。

よしよし。
Screenshot 2024-06-18 at 11.42.17.png

なお、データが返ってきた際、下部にいろいろなボタンが表示されます。
Screenshot 2024-06-18 at 11.42.39.png

左から

  • ポジティブフィードバック
  • ネガティブフィードバック
  • レスポンスの再生成
  • 結果をクリップボードにコピー
  • 結果をCSVでダウンロード
  • サンプルのインストラクションとして保存
  • Show generated code: 生成されたコードの表示

となっています。インストラクションとして保存することで、Genieのレスポンス生成をガイドすることができます。
Screenshot 2024-06-18 at 11.44.59.png

また、やりとりしている背後ではSQLが生成されています。これを確認するにはShow generated codeをクリックします。
Screenshot 2024-06-18 at 11.46.28.png

元々のテーブルcovid_cases_baseには都道府県のデータしか入っていませんが、地方別の集計結果も欲しくなりました。

地方別の感染者数の推移

どうしても英語好きらしい。
Screenshot 2024-06-18 at 11.48.48.png

なお、この時点で背後ではテーブル結合を行なってくれています。

SELECT
  p.Area,
  c.date_timestamp,
  SUM(c.Cases) as TotalCases
FROM
  takaakiyayoi_catalog.japan_covid_analysis.covid_cases_base c
  JOIN takaakiyayoi_catalog.japan_covid_analysis.pref_area p ON c.Prefecture = p.Prefecture
GROUP BY
  p.Area,
  c.date_timestamp
ORDER BY
  p.Area,
  c.date_timestamp

そして、可視化も指示できます。

可視化して

Screenshot 2024-06-18 at 11.50.57.png

その他の機能

インストラクション

上でのやり取りのように、プロンプトで毎回指示するのではなく、一般的な指示やSQLの例を追加することで、Genieの挙動をガイドすることができます。先にこちら使っておくべきでした。
Screenshot 2024-06-18 at 12.00.20.png

あなたは日本におけるCOVID-19の感染者数に関するエキスパートです。与えられた質問に対して英語を使わずに日本語で回答します。

データ

スペースに登録されているテーブルを確認できます。
Screenshot 2024-06-18 at 12.00.50.png

モニタリング

どのユーザーがどのような質問をしたのか、結果に満足したのかなどを一覧で確認できます。
Screenshot 2024-06-18 at 11.58.08.png

設定

作成時に指定したスペースの設定を変更できます。
Screenshot 2024-06-18 at 12.01.14.png

Genieスペースの共有

作成したGenieスペースは権限を設定することで他ユーザーと共有することができます。画面右上のShareをクリックすることで、リンクをコピーしたり、ワークスペース上でGenieスペースを確認できます。
Screenshot 2024-06-18 at 12.34.16.png
Screenshot 2024-06-18 at 12.35.05.png

所感

全部日本語でできるというのは、アシスタントの時も感じましたが新たな体験だなと。

期待しない挙動をする際には、丁寧かつ根気強くやりとりしていくことが大事なのだなと。って、こういう感想を製品のレビューで書くことになるとは...。

こちらのベストプラクティスも感慨深いです。

  • 回答の品質を確認するには、Genieスペースをテストします。モデルが期待どおりの回答を提供するかどうかを確認するには、次のことを試してください。
    • 提供した質問を言い換えてください。
    • データセットに関連するその他の質問をしてください。
  • 質問に対して期待通りの回答が得られるまで、 Genieスペースの指示を追加および調整します。

はじめてのDatabricks

はじめてのDatabricks

Databricks無料トライアル

Databricks無料トライアル

3
1
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
3
1