こんにちは!株式会社マクニカでDatabricksのエンジニアをしています。@satoshy2です。
Databricksとは?(マクニカ紹介ページ)
2025年7月11日までにリリースノートでリリースがアナウンスされている新機能をいくつかご紹介します。先週はプラットフォーム関連のアップデートは4個と多くはありませんでしたが、AI/BIダッシュボート関連とDatabricks Connect関連とDatabricks CLI関連と個別に2つのアップデートを見つけましたので合わせて記載します。
1. Databricks Apps で Lakebase が利用可能に(パブリックプレビュー)
リリース日:2025/07/08
Databricks Apps は、Lakebase データベースインスタンスをアプリリソースとして追加できるようになりました。これにより、これらのリソースを環境変数として追加し、アプリコードからアクセスすることができます。
Lakebase もパブリックプレビュー段階であり、使えるのは以下のリージョンに限られます:
us-east-1、us-west-2、eu-west-1、ap-southeast-1、ap-southeast-2、eu-central-1、us-east-2、ap-south-1
■ 設定概要
-
事前にコンピュートの[OLTPデータベース]タブで Lakebase データベースインスタンスを作成しておきます。
※ 今回の例では、「test-oltp-database」で作成しています。
-
コンピュートの[アプリ]タブで[アプリを作成] -> [カスタムアプリを作成]からアプリを作成します。
-
任意のアプリ名を入力して、[次へ:構成]ボタンをクリックします。
2. ダッシュボードの視覚化の更新(AI/BI リリースノート)
リリース日:2025/07/10
■ 変更点
- エリアグラフのエラーメッセージの修正: 非集計の積み上げエリアグラフを使用する際に表示されるエラーメッセージを修正しました。
- ポイントマップ視覚化UIの更新: ポイントマップの視覚化の緯度と経度のセクションを入れ替えました。
3. Genieインターフェイスの改善(AI/BI リリースノート)
リリース日:2025/07/10
■ 変更点
- 編集可能なフィルターが複数の値を表示: Genie が複数のフィルター値を含む SQL フィルター句を生成するとき、編集可能なフィルターは複数の値を表示するようになりました。
- Genieスペースの説明を編集: Genie スペースの説明をその場で直接編集できるようになりました。
4. Genieのクエリとデータの機能強化(AI/BI リリースノート)
リリース日:2025/07/10
■ 変更点
- SQL クエリの推奨事項: Genie は、ノートブックから取得される一般的な SQL クエリを提案するようになりました。以前は、一般的な SQL クエリオブジェクトのみが提案されていました。
- ディクショナリ値の識別の高速化: 値ディクショナリは、一意の値をより迅速に識別するようになりました。
5. FIPS 準拠の機能拡張2
リリース日:2025/07/11
モデルサービング基盤モデル API の従量課金エンドポイントと、 Databricks がホストするモデルを使用したバッチ推論が、FIPS 準拠の機能になりました。
また、これらの機能は、以下のコンプライアンス要件にも準拠しています。
・FedRAMP Moderate
・IRAP
・Canada Protected B
※ 以前にこの記事でも記載していてパッと見た感じは似ていますが、異なる機能で準拠しています(以前はこちらの機能で、今回はこちらの機能)。
6. Power BI 用 Databricks コネクタが ADBC ドライバーをサポート(パブリックプレビュー)
リリース日:2025/07/11
Power BI 用の Databricks コネクタは、ODBC ドライバの代わりに Arrow Database Connectivity (ADBC) ドライバを使用するように設定できます。
■ 設定方法
- Power BI で目的のダッシュボードを開きます。
- 「データの変換」 をクリックします。
- 「クエリ ー・オプション」セクションの 「詳細エディター」をクリックします。
- ADBC 用の設定
Implementation="2.0"
を指定します。
let
Source = DatabricksMultiCloud.Catalogs("<instance-name>.cloud.databricks.net", "/sql/1.0/warehouses/<sql-warehouse-id>",
[Catalog=null, Database=null, EnableAutomaticProxyDiscovery=null, Implementation="2.0"]),
powerbi_Database = Source{[Name="powerbi",Kind="Database"]}[Data],
default_Schema = powerbi_Database{[Name="default",Kind="Schema"]}[Data],
dashboard_data_Table = default_Schema{[Name="dashboard_data",Kind="Table"]}[Data]
in
dashboard_data_Table
7. アラートの Git 連携(Git によるバージョン管理)
リリース日:2025/07/11
Databricks Gitフォルダを使用して、アラートの変更を追跡および管理できるようになりました。
■ 設定方法
8. Databricks Connect 17.0.1 (Python) のリリース
リリース日:2025/07/11
変更点:小さな問題の修正と内部の改善
Databricks Connect for Python 17.0 はまだサーバレスコンピュートに対応していません。サポートバージョンについては、こちらをご確認ください。
9. Lakeflow Jobs UIが利用可能に(パブリックプレビュー)
リリース日:2025/07(リリースノートに記載がないため日付は不明)
新しいLakeflow Jobs UIは、簡素化されたレイアウト、再設計されたタスクパレット、よりクリーンな空の状態キャンバスを備えてており、より高速で集中的なエクスペリエンスを実現します。
※ こちらはプラットフォームのリリースノートには記載されていませんでしたが、Databricksのトップ画面からアクセス可能な新機能部分に記載されていました。
■ 設定方法
-
ワークスペース画面右上の自分のイニシャルアイコンをクリックして、[プレビュー]をクリックします。
-
画面左のメニューから[ジョブとパイプライン]をクリックして、新規にジョブを作成するか、任意の既存ジョブを開きます。
10. ノートブックでの検索と置換機能の改善 ※リンクはありません
リリース日:2025/07(リリースノートに記載がないため日付は不明)
ノートブックで Ctrl+F を押すと、Databricks ネイティブの検索と置換ツールが開きます。
これにより、現在のビューポート外のコンテンツも含め、ノートブック全体のテキストを素早く検索・置換することができます。
Ctrl+F をもう一度押すと、ブラウザのデフォルトの検索置換機能に戻ります。
※ こちらはプラットフォームのリリースノートには記載されていませんでしたが、Databricksのトップ画面からアクセス可能な新機能部分に記載されていました。
11. Databricks CLI v0.258.0(パブリックプレビュー)
リリース日:2025/07(リリースノートに日付の記載がないため日付は不明)
主な変更点
- default-python テンプレートを、開発ターゲットで pyproject.toml + dynamic_version を使用するように切り替えました。UV が必須になりました。
依存関係の更新
- TF プロバイダーを 1.84.0 にアップグレードしました。
CLI
- databricks auth login を実行すると、.databrickscfg のプロファイルから cluster_id フィールドが削除される問題を修正しました。ログインプロセスで cluster_id フィールドが保持されるようになりました。
バンドル
- パイプライン環境フィールドのサポートを追加しました。
- "bundle summary" で診断警告が標準エラー出力に出力されるようになりました。
- "bundle open" でブラウザを開く前に URL が出力されるようになりました。