LoginSignup
1
0

Databricksアシスタントのティップスを試してみる

Last updated at Posted at 2024-01-10

こちらで説明されているティップスを日本語でウォークスルーします。

ノートブック左側のアシスタントボタンを押して、Databricksアシスタントを表示させます。
Screenshot 2024-01-10 at 17.47.57.png

今回はアシスタントメインなのでアシスタントパネルを拡大します。
Screenshot 2024-01-10 at 17.49.57.png
Screenshot 2024-01-10 at 17.50.47.png

1. Find Tablesアクションの活用

コマンド/findTablesを使うのがお勧めです。covidに関するテーブルを探したいものとします。

/findTables covid

テーブル一覧が表示されます。
Screenshot 2024-01-10 at 17.51.20.png

テーブルをクリックするとコンテキストメニューが表示されます。
Screenshot 2024-01-10 at 17.51.41.png

Suggest SELECT queriesを選択すると、このテーブルに対するSELECTクエリーを提案してくれます。
Screenshot 2024-01-10 at 17.52.47.png

Describeならテーブルを説明してくれます。
Screenshot 2024-01-10 at 17.53.54.png

Query in natural languageを選択すると、以下のプロンプトで自然言語でテーブルに対する問い合わせを行うことができます。日本語でも大丈夫です。

都道府県はいくつ含まれていますか

Screenshot 2024-01-10 at 17.55.19.png

4. アシスタントパネルでコードを直接実行でも触れますが、この画面から直接クエリーを実行できます。コードスニペットの左上にある▶️ボタンでコードを実行できます。
Screenshot 2024-01-10 at 18.02.10.png
Screenshot 2024-01-10 at 18.03.06.png

注意
コードを実行した際エラーになる場合はコードを修正してください。

2. レスポンスの形式の指定

どのような回答が得たいのかをプロンプトで指定できます。以下のようなクエリーを記述したとします。

SQL
SELECT
  *,
  date(date_timestamp) AS Date,
  month(date_timestamp) AS Month,
  year(date_timestamp) AS Year,
  concat(
    year(date_timestamp),
    "-",
    RIGHT(concat("0", month(date_timestamp)), 2)
  ) AS YearMonth
FROM
  takaakiyayoi_catalog.japan_covid_analysis.covid_cases;

クエリーが記述されているセルを選択している状態で、アシスタントに以下を問い合わせます。

このクエリーを簡潔に説明して

いくつかの文で説明されます。

このクエリは、日本の全ての都道府県においてCOVID-19の感染者数を月単位で集計するものです。date関数を使用して、 date_timestamp列からの日付を抽出します。monthおよびyear関数を使用して、date_timestamp列から月と年を抽出します。また、concat関数を使用して、年と月を結合する新しい列YearMonthを作成します。最後に、SUM関数とGROUP BY句を使用して、都道府県と月ごとの感染者数を計算し、それぞれの組み合わせごとに単一の行を作成します。

Screenshot 2024-01-10 at 18.07.09.png

詳細な説明を求めることも可能です。

このクエリーをステップバイステップで説明して

以下は、このクエリを一つずつ説明したものです:

  1. SELECT文で、元のテーブルからすべての列を選択します。
    date、month、およびyear関数を使用して、 date_timestamp 列から日付、月、年を抽出します。
  2. concat関数を使用して、年と月を結合する新しい列YearMonthを作成します。このとき、monthが1桁の場合でも、2桁の値になるようにconcat("0", month(date_timestamp))関数を使用します。
  3. 元のテーブルと新しい列Date、Month、Year、およびYearMonthのテーブルを連結して、中間テーブルを作成します。
  4. このクエリーは、日付、月、年、および年と月の列を追加し、YearMonth 列を作成するためのコードです。

Screenshot 2024-01-10 at 18.10.15.png

3. Databricksアシスタントにデータを行レベルで教える

これは自然言語によるクエリー生成のバリエーションなので割愛します。元記事で言っているのは、「高さのカラム(ht)は6-2のようにハイフンで区切られている文字列フォーマットです」と言うように、あるカラムのフォーマットを教えるためのプロンプトを与えるというものです。

4. アシスタントパネルでコードを直接実行

アシスタントからコードスニペットが返却された際には、セルに▶️ボタンが表示されます。ノートブックが稼働中のクラスターにアタッチされていればそのままコードスニペットを実行できます。
Screenshot 2024-01-11 at 14.25.06.png

コードの修正が必要な場合には、アシスタントパネル上で直接コードを編集できます。ノートブックにコードを挿入する前に試行錯誤することができます。

5. ノートブック内のセルアクションを使う

ノートブックのセルにもアシスタントへのショートカットボタンがあります。
Screenshot 2024-01-10 at 18.20.29.png

こちらからアシスタントに問い合わせができます。
Screenshot 2024-01-10 at 18.21.05.png

アシスタントに指示した結果との差分を確認できます。/docはコメント追加を指示するコマンドです。

是非ご活用ください!アシスタントの有効化はこちらから。

Databricksクイックスタートガイド

Databricksクイックスタートガイド

Databricks無料トライアル

Databricks無料トライアル

1
0
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
1
0