2
0

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?

個人的Data + AI Summit 2026振り返り

2
Last updated at Posted at 2026-06-19

今年のテーマ: 「何ができるか」から「どう本番で動かすか」へ

毎年恒例のData + AI Summit (DAIS) 振り返りです。6回目の視聴になりますが、今年のキーノートを貫いていたメッセージは明確でした。「AIが何かをできるか」ではなく「どうやって本番でスケールさせ、ガバナンスを効かせて確実に動かすか」へと、議論の主語が決定的に移ったという点です。ベンチマークのスコア競争ではなく、実際の業務でAIをどう回すかが問われる年になりました。

この振り返りは過去の振り返り記事の続きでもあります。発表内容を点で追うのではなく、過去数年のどの発表の延長線上にあるのかという「線」で見ると、Databricksが一貫した賭けをしていることが見えてきます。あわせて読んでいただけると流れがつかめます。

主要なテーマの3年間の流れを1枚にまとめると、次のようになります。

dais2026_timeline.png

Genieファミリーの確立 (Genie One / Genie Agents / Genie Ontology)

今年最大の発表群は、Genieが単なる会話型アナリティクスから「データに精通したAIの同僚 (data-smart AI coworker)」へと進化し、ファミリーとして再編されたことです。一次情報は公式ブログにまとまっています。

製品の概要は Genie One 製品ページ、機能の詳細は Genie の日本語ドキュメント を参照してください。

Genie Oneは業務ユーザー向けで、インサイトを得るだけでなくアクションの実行まで踏み込みます。Lakehouse FederationやLakeflow Connect、そしてGmail / Slack / Teamsといった日常業務ツールとの双方向連携を通じて、社内外のデータを横断してインサイトを抽出し、各システムに対する操作をオーケストレーションできます。ネイティブのiOS / Androidアプリも提供され、いつでもデータに問い合わせられるようになりました。

Genie Agentsは、これまで100万以上作られてきたGenie Spacesを進化させ、監督なしでマルチステップのワークフローを完結させる自律エージェントです。構造化データだけでなく非構造化データにも推論できます。

そして技術的な肝がGenie Ontologyです。テーブル・クエリ・ダッシュボード・ドキュメント・チケット・チャットなどから知識を自動抽出し、企業の動きとデータの意味を継続的に学習し続ける「生きたコンテキスト層」です。社内ベンチマーク (28問の実データ分析タスク、2026年6月) では、初回試行での正答率が84.5%に達し、最も強力な汎用コーディングエージェントの52.4%、最も弱いもので25%を大きく上回ったと報告されています。しかも精度と引き換えに速度を犠牲にせず、最強のコーディングエージェントの2倍高速とされています。

過去記事との関連

このファミリー化は、いきなり出てきたものではありません。

  • Genieが初めて登場したのは2024年のDatabricks AI/BI (2024振り返り)でした。当時は「対話型でデータに問い合わせ・可視化する」アシスタントという位置づけでした。
  • 2025年にはGenieにDeep Researchモードが加わり、さらに「利用パターンから知識を獲得する (2025振り返り AI/BI)」知識抽出の方向性が示されました。Genie Ontologyは、まさにこの2025年の知識抽出を製品として結実させたものと捉えられます。
  • 同じく2025年に発表されたDatabricks One (2025振り返り) (ビジネスユーザー向けの効率的なUI) の系譜が、業務ユーザー向けの「Genie One」という名前に引き継がれています。

2024年に「対話できるBI」だったものが、2025年に「自分で知識を獲得するGenie」になり、2026年に「アクションまで実行するAIの同僚」へと進化した、という3年の連続性が見て取れます。Genieの品質をどう測り改善するかは、自分でも以前まとめています。Genie Ontologyで精度が上がる構造を、評価の観点から眺めると腹落ちしやすいです。

ガバナンスの効いたVibe Coding (Databricks Apps)

アプリ構築まわりでは、3つの新機能が発表されました。一次情報は公式ブログです。

問題意識は明快で、Vibe Codingは速くて手軽な一方、エンタープライズのアプリには実データに根ざす「コンテキスト」と、安全かつコスト効率よくデプロイするための「コントロール」が欠けているという指摘です。直近6か月でDatabricks Appsはアプリを構築する顧客が大きく増え、稼働中アプリ数はほぼ倍増、毎週利用するユーザー数も3倍以上に増えたという背景も語られています。

App Spacesは、アプリを1つずつレビューするやり方はスケールしないという課題への解です。管理者がリソース、データアクセス、On-Behalf-Of-User用のAPIスコープ、セキュリティポリシーをApp Space単位で定義すると、そのスペース内のすべてのアプリが設定を自動継承します。ガバナンスがリアクティブからシステマティックに変わり、事前承認済みの環境の中でビルダーが自由に作れるようになります。

Genie App Builderは、自然言語の記述からアプリを生成するDatabricksネイティブのAIアプリ作成エージェントです。データ資産やUnity Catalogのセマンティクス、ワークスペースのコンテキストをネイティブに理解した上で、ライブのビルドプランと動作するアプリのプレビューを生成します。

Serverless Micro Appsは、必要時に高速起動し、アイドル時にはゼロまでスケールダウンするmicroVMベースの軽量ランタイムです。常時稼働インフラのコストをかけずに、多数のアプリのポートフォリオを支えられます。

過去記事との関連

  • 2025年にDatabricks AppsがGA (2025振り返り)になり、Node.jsやReactのサポートも入りました。今年のApp Spaces / Genie App Builder / Serverless Micro Appsは、その「アプリを作れる基盤」の上に「誰がどう安全に作るか」というガバナンスとコスト管理を乗せた発展形です。
  • App SpacesのOn-Behalf-Of-User (OBO) スコープの話は、過去に書いたOBO認証の記事とそのまま地続きです。App Space単位でガバナンスを継承する発想は、アプリ単位の認可設定を一段引き上げたものと言えます。

そもそもDatabricks Appsが登場したときの記事と、On-Behalf-Of認証をサンプルアプリで体感した記事です。

Genie App Builderの源流にあたる「自然言語でアプリを作る」体験はAI Dev KitのBuilder Appで先に触れており、公式ブログでGenie App Builderの基盤と名指しされているTypeScript SDKのAppKitも別記事で掘り下げています (プラグイン、型生成、obo.sqlによるユーザー権限実行など)。

Genie ZeroOps: 運用の自動操縦

本番ワークロードを監視し、問題を調査し、安全に修正を提案・検証するAIバックグラウンドエージェントです。一次情報は公式ブログです。

主張の核は、汎用のコーディングエージェントはデータプラットフォームの一部ではないため運用を自動化できない (メトリクス・ログ・リネージにアクセスできず、本番データに安全に触れられない) のに対し、ZeroOpsはDatabricksの一部であるため、ゼロコピークローンのサンドボックスで本番に触れずに修正を検証できるという点です。

ML向けにはFeature Store・MLflow・モデルサービングとネイティブに統合され、本番モデルと同じ評価スイートで修正候補を評価します。問題は重大度順に並ぶ受信トレイ型のUIに、根本原因分析と修正案つきで表示され、承認なしに本番へ適用されることはありません。すべてはUnity Catalogのガバナンス下で動き、自分の資格情報が許す範囲のデータにしかアクセスできません。

過去記事との関連

  • ZeroOpsの直接の基盤は、公式ブログでも名指しされている通りGenie Code (エージェント的なコード生成=Remediate)、Genie Ontology、そしてUnity Catalogのリネージ (Evaluate) です。MLflowはあくまでML用途における複数のネイティブ統合先の一つで、「ZeroOpsの生みの親」ではない点に注意が必要です。実際、ZeroOpsの主戦場はパイプライン障害・上流スキーマ変更・遅延データ・ジョブ・テーブルといったデータ運用全般で、ここにMLflowは絡みません。
  • とはいえMLflowとの接続は自然な補完関係にあります。2025年のMLflow 3.0 GA (2025振り返り)でEvaluate & Monitor (create_monitor() やスコアラーによる本番監視) まで踏み込んだので、ZeroOpsはその「監視」の先にある「修正の自動化」を担う層、と読むと収まりが良いです (MLflowの後継ではなく、監視→修正という補完)。

監視→修正の地続きの流れは、MLflow 3の評価をライフサイクルで捉えた記事や、本番運用モニタリングの記事、そして共著書で扱っています。

オープンソースの「エージェントのOS」: Omnigent

今年もう一つの大きな目玉が、2日目のキーノートで共同創業者でありCTOのMatei Zahariaが発表したOmnigentです。Genieファミリーが「Databricksの中で完結するエージェント」だとすれば、Omnigentはベンダーやツールを問わずエージェントを束ねる、いわば「エージェントのOS」を狙う動きで、国内でもTECH+などのメディアで大きく取り上げられました。一次情報は公式ブログ (日本語ドキュメント もあります) です。

問題意識は「ハーネスの乱立」です。LLMをファイル・UI・セキュリティ機構などの外界に繋ぐソフトウェア層が「ハーネス」で、Claude Code・Codex・Cursor・OpenAI Agent SDKなど、誰もが手軽に独自のハーネスを作れるようになった結果、エージェント同士の連携が難しく、セッションを他人に引き継げずコピー&ペーストを繰り返し、ガバナンスも許可・拒否・確認といった静的な制御に頼らざるを得ない、という分断が起きているという指摘です。

これに対してOmnigentは、ハーネスの上位に共通レイヤ (メタハーネス) を置きます。アーキテクチャは、任意のエージェントをサンドボックス化したセッションとして実行するRunnerと、履歴の共有・ポリシー・スキル管理を担う中央レイヤのServer (任意) で構成され、ターミナル・アプリ・Webから同じライブセッションにアクセスできます。機能は3本柱で整理されています。

dais2026_omnigent.png

  • 構成 (Composition): 異なるハーネスやモデルを組み合わせたエージェントをYAMLで定義でき、1行の変更でハーネスやモデルを差し替えたり、タスク途中で別のエージェントに切り替えたりできます。
  • コラボレーション (Collaboration): 複数人が同一セッションにリアルタイムで参加でき、自分の作業をそのまま別の人へ引き継げます。
  • 統制・ガバナンス (Control): 静的な権限ではなく、行動履歴に応じた動的なポリシーを適用します。「機密文書にアクセスした後は外部送信を制限する」といった制御や、「このタスクで5ドル以上使わない」といったセッション単位のコスト上限も設定できます。

Apache 2.0で2026年6月13日 (サミット直前の週末) にOSS化され、Databricksに依存せずDockerやPostgresなどの標準技術で動作します。Databricksマネージド版 (Unity AI Gateway連携) はBetaです。

過去記事との関連

サミット直前に自分でもOmnigentを動かした記事を書きました。既存のClaude Codeを包んで起動し、ターミナルのセッションがそのままWeb UIにも映る挙動などを試しています。

「エージェントを束ねる上位レイヤー」という発想は、2025年のMCP on Databricks (2025振り返り)やAgent Bricksで進めてきた「マルチエージェント時代の標準化」の延長にあります。ツールごとの個別連携 (N×M問題) を共通プロトコルで解くMCPと、ハーネスごとの分断を共通APIで解くOmnigentは、レイヤーは違えど同じ「標準化で分断をなくす」発想です。

本番グレードのAIを支える基盤

Genieファミリー、Apps、ZeroOps、Omnigentという「使う側」の発表を、足元で支えるインフラ・ガバナンスの発表も揃いました。

Lakebase は2026年初にGAとなり、エージェント向けの低レイテンシなトランザクション読み書きを担う運用データベース層として位置づけられました。分析用のレイクハウス、ガバナンスのUnity Catalog、自然言語インターフェースのGenieと組み合わさり、本番グレードのエージェントAIを動かす統合アーキテクチャを構成します。さらに今年は、このLakebase (OLTP) とレイクハウス (OLAP) を1つのデータコピー上で統合するLTAP (Lake Transactional/Analytical Processing) というアーキテクチャも打ち出され、ETLやレプリカを設計上不要にする方向が示されました。

サービング側の目玉が Lakehouse//RT です。一次情報は公式ブログです。

新しいベクトル化実行エンジンReydenを搭載し、別途サービング層を立てることなく、ガバナンス下のDelta Lake / Apache Iceberg上で直接ミリ秒級の応答を実現します。プレビュー参加者では従来のリアルタイムサービング層比で最大16倍、小規模データセットで10ミリ秒、大規模でも100ミリ秒程度という数値が示されました。すべてのクエリがUnity Catalogのガバナンス下で動き、データコピーやCDCパイプラインを伴わない点が特徴です。現時点ではBetaです。これは「常時稼働で推論ループを回し、データへの高速アクセスがそのまま行動可能性に直結する」エージェント時代の要請に応える層、という位置づけです。

Unity Catalogまわりでは、AWS Glueなどの外部カタログをコピーせずに単一のガバナンス層にまとめるフェデレーションが強化されました。モデルのアクセス制御という観点では、Agent BricksやModel Servingがサポートするフロンティアモデルが広がり、OpenAI / Anthropic / Gemini / Qwenに加えてKimiといったモデルも選べるようになっています。

オープン化の動きも続きました。構造化データに加えてエージェントスキルやMLモデル成果物、非構造化データを、コピーせず組織・プラットフォーム横断で共有するオープンプロトコル (Delta Sharing の進化形であるOpenSharing) がLinux Foundationのもとで立ち上がりました。同じくオープンソースのOmnigentについては、前のセクションで扱った通りです。

過去記事との関連

  • Lakebaseは2025年にOLTP向けデータベースとDBブランチングとして発表 (2025振り返り)されたものが、1年でGAに到達した形です。
  • Unity Catalogは2021年に発表され、リネージやABAC、メトリクスビューと毎年機能が積み増されてきました (2025振り返り Unity Catalog)。今年のフェデレーション強化はその延長です。
  • オープン化は、2024年のUnity Catalogのオープンソース化 (2024振り返り)、2025年のSpark宣言型パイプライン (DLTのオープンソース化) という流れの最新章です。今年は性質の異なる2本、データ共有のプロトコルであるOpenSharingと、エージェントを束ねるメタハーネスのOmnigent (前セクション参照) が加わりました。
  • Lakehouse//RTは、2024年のPhotonやDelta 4.0、2025年のDatabricks SQLでのLLM活用といった「DWH/サービングの高速化」の系譜に、リアルタイムという軸を1本足したものと捉えられます。LTAPとあわせて、Lakebase連載で扱ってきた「エージェント向けの運用DB」の話とも地続きです。

Lakebase自体は、Lakebase × LangGraphの連載で永続メモリのバックエンドとして実際に使い倒しています。

年表で振り返るDAIS

冒頭の図を表で詳細化すると、今年の発表がどこから来ているのかがさらにはっきりします。

テーマ 2024 2025 2026
会話型分析 / Genie AI/BIでGenie初登場 (対話型問い合わせ) Deep Researchモード、知識抽出 Genie One / Agents / Ontology
ビジネスユーザー向けIF AI/BI Dashboard Databricks One Genie One (アクション実行)
エージェント Agent Framework / Tool Catalog Agent Bricks / MCP on Databricks Genie Agents / Omnigent (メタハーネス)
アプリ開発 (Databricks Apps プレビュー) Apps GA (Node.js / React) App Spaces / Genie App Builder / Micro Apps
MLflow / 運用 MLflow 2.14 / AI Gateway MLflow 3.0 GA (評価・監視) Genie ZeroOps (監視→修正の自動化)
運用DB (Lakehouse中心) Lakebase 発表 (OLTP / ブランチング) Lakebase GA / LTAP統合アーキテクチャ
DWH / リアルタイム Photon / Delta 4.0 Databricks SQL (LLM活用) Lakehouse//RT (Reydenエンジン)
ガバナンス ABAC / UC Metrics UCメトリクスビューGA / Iceberg Unity Catalog フェデレーション
オープン化 Unity Catalog OSS化 Spark宣言型パイプライン OSS化 OpenSharing / Omnigent OSS化
モデル DBRX Gemini (Google Cloud提携) Kimi / Qwenなどサポート拡大

横に見ると、ほぼすべてのテーマが「単機能の提供 → GA・標準化 → エージェント時代に向けた再編」という同じカーブを描いていることが分かります。

提供状況のメモ

公開時点で把握している範囲のステータスです。GAとプレビューが混在しているので、実際に試す際はリリースノートや管理コンソールでの確認をおすすめします。

  • Genie One / Genie Agents / Genie Code: GA
  • ネイティブのiOS / Androidアプリ: 提供中
  • App Spaces / Genie App Builder / Serverless Micro Apps: いずれも間もなくPrivate Previewへ
  • Genie ZeroOps: サミット直後にPrivate Previewへ
  • Lakehouse//RT: Beta
  • Omnigent: Apache 2.0でOSS公開済み (Databricksマネージド版はBeta)

まとめ

今年のDAISを一言でまとめると、「Genieをブランドの軸に据え、One / Agents / Code / ZeroOpsというファミリーをGenie Ontologyという共通基盤の上に並べ、Apps・Lakebase・Lakehouse//RT・Unity Catalogで本番運用とガバナンスを固める。さらに、データ共有のOpenSharingと、エージェントを束ねるメタハーネスのOmnigentという2つのオープンソースで、Databricksの外まで開いていく」という構図でした。

  • 2024年に「対話できるBI」として登場したGenieが、2026年には「アクションを実行し、自分で知識を獲得するAIの同僚」へと進化した
  • 2025年にGAになったAppsの上に、ガバナンスとコスト管理 (App Spaces / Micro Apps) が乗り、Vibe Codingがエンタープライズに耐えるものになった
  • MLflowで積み上げてきた評価・モニタリングの基盤と補完する形で、運用の修正までを自動化するZeroOpsが加わった (監視→修正の自動化)
  • Genieが「Databricks内のエージェント」を担う一方、Omnigentはベンダーを問わずエージェントを束ねる「エージェントのOS」をオープンソースで狙う、という2正面の動きが鮮明になった

毎年見ていると、生成AIが出現してからの数年での進化の速さに改めて驚かされます。来年のDAISでは、今年Private Previewだった機能たちがどうGAに育っているか、そしてGenie Ontologyを基盤にした「コンテキスト」の競争がどこまで進むかが見どころになりそうです。

はじめてのDatabricks

はじめてのDatabricks

Databricks無料トライアル

Databricks無料トライアル

2
0
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
2
0

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?