皆様お疲れ様でした & ありがとうございました!
今年もDatabricksアドベントカレンダーが終了しました。2024年に続き、今年も4シリーズ体制で多くの記事が投稿されました。ご参加いただいた皆様、本当にありがとうございます!
概要
まずは、データ&AIカンパニーとしてデータから。
| 年 | 参加者数 | 購読者数 | いいね数 | シリーズ数 |
|---|---|---|---|---|
| 2021 | 9 | 7 | 28 | 1 |
| 2022 | 18 | 14 | 76 | 2 |
| 2023 | 19 | 14 | 69 | 2 |
| 2024 | 39 | 41 | 190 | 4 |
| 2025 | 29 | 69 | 110 | 4 |
2024年の爆発的な参加者数増加と比較すると、2025年は参加者数こそ29名と落ち着いた数字となりましたが、購読者数は過去最高の69名を記録しました。これはDatabricksに対する関心が着実に高まっていることを示しています。
また、2024年に初めて4シリーズ体制となりましたが、2025年もその規模を維持できたことは、Databricksコミュニティの成熟を示す重要な指標です。
2025年のトピック傾向
今年の記事から見えてくる主要なトピックを整理してみました。
MCPサーバー関連 ... 今年の大きなトピックの一つがModel Context Protocol(MCP)です。Claude CodeからDatabricksのmanaged MCPサーバーを使う方法や、MarketplaceのMCPサーバー全20種の検証など、エージェント時代の新しい連携方法が注目を集めました。
Databricks Apps ... 昨年に引き続きAppsに関する記事が多く投稿されました。認証方式、ネットワーク設定、社内アプリ開発など、実運用に向けた知見が共有されています。
Genie ... 自然言語によるデータ分析を可能にするGenieについて、出力制御やメトリックビュー連携など、より高度な活用方法が紹介されました。
データ連携・オープン化 ... Unity CatalogのIceberg REST Catalog対応、Catalog federation、Snowflake連携、互換モードなど、データ基盤のオープン化に関する記事が目立ちました。
開発効率化 ... VS Code Extension、Databricks Connect、Asset Bundles、テストとCI戦略など、開発者体験の向上に関する記事も充実しています。
マイグレーション ... LakebridgeのLLMベースコード変換機能「Switch」の開発話や、Oracle PL/SQLからDatabricksへの移行Tipsなど、レガシーシステムからの移行に関する実践的な知見が共有されました。
記事のピックアップ
いくつかの記事を引用させていただきます。
Switch: LakebridgeのLLMベースのコード変換機能を開発した話
@nakazaxさんの記事です。Databricks Labsで公開されているマイグレーションツール「Lakebridge」に搭載されたLLMベースのコード変換機能「Switch」について、コア開発者自らが開発の裏側を解説されています。T-SQLやOracle PL/SQLなどのレガシーコードをDatabricksノートブックに変換する機能で、非同期バッチ推論やリトライ戦略など堅牢な実装の工夫、さらにClaude Codeを活用した開発プロセスまで紹介されており、非常に読み応えのある内容です。
Unity CatalogのIceberg REST Catalog API対応
@nakazaxさんの記事です。Unity CatalogがIceberg REST Catalog APIをサポートしたことで、Databricks外部からIcebergテーブルにアクセスできるようになりました。データ基盤のオープン化を象徴する重要な機能アップデートです。
Databricks Apps (FastAPI + htmx)で簡単社内アプリ作成
@dr_paradiさんの記事です。Databricks Appsの大きなメリットである「認証をDatabricksに丸投げできる」点を活かし、FastAPI + htmxで軽量な社内アプリを作成する方法を解説されています。Slackの音楽チャンネルに貼られたYouTubeを一覧表示・再生できるアプリという実用的な例も紹介されています。
Databricks Apps内で利用する二つの認証方式
@ikejiri-makoto2さんの記事です。Databricks Appsを実運用する際に避けて通れない認証について、2つの方式を詳しく解説されています。同じ方の別記事ではAppsが動かない原因がネットワーク設定だったという実践的なトラブルシューティングも共有されています。
Databricksのユースケースを生成AIで自動生成するアプリ「DemoArigato」を使ってみた
@RyoOkayaさんの記事です。Databricksのデモ環境を自動生成するツール「DemoArigato」の使用レポートです。デモ準備の効率化に役立つツールの紹介は実務者にとって非常に参考になります。
Databricks Webターミナルでコーディングエージェントを動かす
@oddgaiさんの記事です。Databricksのクラスター上でコーディングエージェントを動かすという興味深い試みです。AIエージェント時代のDatabricks活用の新しい形を示しています。
CREATE OR REPLACE でテーブルを更新すると Genie がアホになる
@Camay119さんの記事です。タイトルのインパクトもさることながら、Genieを運用する際の重要な落とし穴を共有いただいています。こうした実運用からの知見は非常に貴重です。
Databricks Notebookにおける最高のフォーマットを考える
@hirayukiさんの記事です。同じ方からはテストとCI戦略、VS Code ExtensionとDatabricks Connect、メダリオンアーキテクチャの必要性など、開発のベストプラクティスに関する記事を複数投稿いただいています。
Azure Databricks セキュリティベストプラクティス適用のためのセキュリティ強度ガイド
@ryoma-nagataさんの記事です。セキュリティは常に重要なトピックです。Azure Databricksのセキュリティベストプラクティスを体系的にまとめていただいています。
Delta Sharingで実現するセキュアな企業間データ連携
@kenrxjさんの記事です。Delta Sharingを用いた企業間データ連携の実践ガイドです。導入から検証まで丁寧にまとめられています。
令和の時代のスキーマレスはスキーマいらないわけじゃない
@kuwa_twさんの記事です。Variant型の管理について深く掘り下げています。同じ方からはmarimoとDatabricksの連携についても記事を投稿いただいています。
Databricks と Snowflake 間のテーブル連携方法のまとめ
@takatotoさんの記事です。DatabricksとSnowflakeの連携方法を網羅的にまとめていただいています。両プラットフォームを併用している組織には必読の内容です。
LangChain/DeepAgentで作るMAGIシステム風AIエージェントをDatabricksにデプロイ
@isanakamishiro2さんの記事です。エヴァンゲリオンのMAGIシステム風のマルチエージェントをDatabricksにデプロイするという面白い試みです。同じ方からはGenieリサーチエージェントの出力制御や、Free Editionでのデータパイプライン構築シリーズも投稿されています。
Claude Code から Databricks の managed MCP server を使う
@soonraahさんの記事です。今年のホットトピックであるMCPサーバーについて、Claude Codeからの利用方法を解説されています。
Databricks MarketplaceのMCP Server全20種の検証始動
@ikejiri-makoto2さんの記事です。MarketplaceにあるMCPサーバー20種の検証という大作です。どのMCPサーバーを使えばよいか迷っている方に参考になります。
Asset BundlesでLakeflow Pipelinesを構築してみる
@ikechanさんの記事です。Asset BundlesでLakeflow Pipelinesを構築する方法を解説されています。IaCでのパイプライン管理に興味がある方に参考になります。
Databricks 公式ドキュメントを読んで権限設計を理解する
@i9wa4さんの記事です。Databricksの権限設計について公式ドキュメントをもとに整理されています。マルチワークスペース環境での権限管理に悩んでいる方におすすめです。
Databricks の互換モード (compatibility mode) で広がるオープンデータ基盤の可能性
@satoshi_enomotoさんの記事です。互換モードという新しい機能について解説されています。オープンデータ基盤を目指す上で重要な機能です。
Catalog federationでAWS Glue Data CatalogのIcebergを参照する
@village802さんの記事です。Catalog federationを使ってGlue Data CatalogのIcebergテーブルを参照する方法を解説されています。マルチクラウド環境でのデータ連携に役立ちます。
Databricksでscikit-learnが重い原因はMLflowだった
@maskot1977さんの記事です。scikit-learnが遅い原因がMLflowの自動ロギングだったという、実際に遭遇しがちな問題とその解決策を共有いただいています。
Oracle PL/SQL を Databricks にマイグレーションするための Databricks Procedure 導入Tips
@case-kさんの記事です。Oracle PL/SQLからDatabricksへの移行という実践的なテーマです。レガシーシステムからの移行を検討している方に参考になります。
Databricks After Party で登壇してきました
@ysdytさんの記事です。Databricks After Partyでの登壇レポートです。コミュニティイベントへの参加報告も嬉しいですね。
5年間の推移を振り返って
2021年から5年間のDatabricksアドベントカレンダーを振り返ると、コミュニティの着実な成長が見えてきます。
参加者数: 9名(2021) → 29名(2025)と約3.2倍に成長
購読者数: 7名(2021) → 69名(2025)と約9.9倍に成長
シリーズ数: 1(2021) → 4(2025)と4倍に拡大
特に購読者数の伸びは顕著で、Databricksに関心を持つ方が確実に増えていることがわかります。
記事のテーマも年々多様化しています。2021年〜2022年頃はSpark、Delta Lake、MLflowといった基盤技術が中心でしたが、2023年以降はUnity Catalog、Vector Search、生成AI関連の記事が増え、2024年〜2025年ではGenie、Apps、MCPサーバーなど、よりエンドユーザー向けの機能や最新技術に関する記事が目立つようになりました。
まとめ
今年も多様なテーマの記事が投稿され、Databricksエコシステムの広がりを感じる内容でした。
特に印象的だったのは以下の点です:
- MCPサーバー関連記事の登場: エージェント時代の到来を感じさせる新しいトピック
- Databricks Appsの実運用知見: 認証、ネットワーク、トラブルシューティングなど実践的な内容
- データ基盤のオープン化: Iceberg対応、Catalog federation、互換モードなど
- マイグレーションツールの進化: LakebridgeのLLMベースコード変換機能「Switch」の開発話など
- Free Editionの活用: より多くの方がDatabricksを試せる環境での学習コンテンツ
来年も皆様のご参加をお待ちしています。良いお年を!
過去のアドベントカレンダー
- Databricks - Qiita Advent Calendar 2024
- Databricks - Qiita Advent Calendar 2023
- Databricks - Qiita Advent Calendar 2022
- Databricks - Qiita Advent Calendar 2021



