はじめに
「SQLを書かずに、データと会話できたら...」
そんな願いを叶えてくれるのが Databricks Genie です。自然言語で質問するだけで、SQL生成から集計、可視化までを自動でやってくれる「対話型BI」機能です。
本記事では、Databricks Free Edition(無料版)を使って、Genieの基本操作から最新機能の Genie Research Agent まで、段階的に体験できるサンプルシナリオを紹介します。
この記事は JEDAI Databricks無料版で始めるGenieもくもく会(2025年12月23日開催)向けに作成しました。
当日の説明資料はこちら。
対象読者
- Databricksをこれから触ってみたい方
- SQLは苦手だけどデータ分析に興味がある方
- 生成AIを活用したBI/分析ツールを試してみたい方
事前準備
Databricks Free Editionのセットアップ
まだアカウントをお持ちでない方は、以下から無料で登録できます。リンク先で無料版を入手を選択ください。
使用するサンプルデータ
Databricks Free Editionには、あらかじめ samples.tpch というサンプルデータセットが用意されています。これはEC(電子商取引)の注文データを模したもので、以下のようなテーブルが含まれています。
| テーブル名 | 内容 |
|---|---|
customer |
顧客情報 |
orders |
注文情報 |
lineitem |
注文明細 |
part |
商品情報 |
supplier |
サプライヤー情報 |
nation |
国情報 |
region |
地域情報 |
Genieスペースの作成
Genieを使うには、まず「Genieスペース」を作成します。
Step 1: Genieの基本操作(15分)
まずはシンプルな質問から始めて、Genieの動作を確認しましょう。
1-1. カウント系の質問
顧客は全部で何人いますか?
Genieが自動でSQLを生成し、結果を返してくれます。生成されたSQLも確認できるので、学習にも役立ちます。


1-2. ランキング・ソート
注文金額が多い上位10件の注文を見せて
1-3. グループ集計
国別の顧客数を教えて
1-4. 可視化リクエスト
月別の売上推移を折れ線グラフで見せて
チェックポイント
- SQLが自動生成されることを確認できましたか?
- 結果がテーブル/グラフで表示されましたか?
- 日本語で質問できることを実感できましたか?
Step 2: より複雑な分析(20分)
基本操作に慣れたら、少し踏み込んだ質問にチャレンジしてみましょう。
2-1. フィルタリング + 集計
アジア地域で最も売上の高い製品カテゴリは?
複数テーブル(region, nation, customer, orders, lineitem, part)を自動でJOINして回答してくれます。
2-2. 計算フィールドの生成
注文から出荷までの平均日数を優先度別に比較して
日付の差分計算も自然言語で指示できます。
2-3. 比率・割合の算出
リピート購入している顧客の割合を教えて
2-4. 時系列比較
売上が前月比で最も成長した月はいつ?
うまくいかないときは
- 質問を具体的にしてみる(期間、対象を明示)
- 一度に複数のことを聞かず、分割して質問する
- テーブル名やカラム名をヒントとして含める
Step 3: Research Agentで深掘り分析(25分)
ここからが本番です!Genie Research Agent は、単なる集計ではなく「なぜ?」「どうすれば?」までをAIが自動でリサーチしてくれる機能です。
仮説生成 → 検証クエリ実行 → 結論導出 という流れを自動で行います。
3-1. 原因分析
売上が低迷している地域があれば、その原因を分析して
Research Agentが複数の仮説を立て、それぞれを検証するクエリを自動実行し、結論を導き出します。
3-2. 顧客セグメント分析
高額注文をする顧客にはどんな特徴がある?
3-3. 問題解決型の質問
出荷遅延が発生しやすいパターンを特定して、改善策を提案して
3-4. 予測・提案型の質問
来四半期の売上予測と、成長のための施策を提案して
Research Agentの観察ポイント
- どんな仮説が生成されるか
- 検証のために何種類のクエリが実行されるか
- 結論の導出プロセスはどうなっているか
- 推奨アクションは具体的か
自由課題
もっと試してみたい方は、以下のお題にチャレンジしてみてください。
| 難易度 | お題 |
|---|---|
| ⭐ | 売れ筋商品トップ5をグラフで表示 |
| ⭐⭐ | 四半期ごとの売上トレンドを前年と比較 |
| ⭐⭐⭐ | 顧客を購買行動でセグメント分けして各グループの特徴を説明 |
| ⭐⭐⭐⭐ | 在庫最適化のための発注タイミングを提案 |
オリジナルデータで試す
自分のデータをUnity Catalogに登録すれば、同じようにGenieで分析できます。CSVファイルのアップロードも可能です。
従来のBIツールとの違い
| 観点 | 従来のBI | Genie |
|---|---|---|
| 操作方法 | ドラッグ&ドロップ、SQL | 自然言語 |
| 学習コスト | ツール固有の操作を習得 | 日本語で質問するだけ |
| 柔軟性 | 事前定義されたダッシュボード | その場で自由に質問 |
| 深掘り分析 | 手動で仮説検証 | Research Agentが自動化 |
まとめ
Databricks Genieを使うことで、以下のような体験ができました。
- 基本操作: 自然言語でSQL生成・集計・可視化
- 複雑な分析: 複数テーブルのJOIN、計算フィールド、時系列比較
- Research Agent: 仮説生成から検証、結論導出までの自動化
「BIを操作する」から「データに質問する」へ。この体験の変化をぜひ実感してみてください。
参考リンク
- Databricks Free Edition
- Genie公式ドキュメント
- Genie spacesのResearch Agent | Databricks on AWS
- JEDAI - Japan Enduser Group for Databricks


















