Agentic Data Cloud とは？Googleが示す AI-native なデータ基盤のこれからの当たり前

Last updated at 2026-04-24Posted at 2026-04-24

こんにちは、小林です!
株式会社リンクアンドモチベーションでデータアナリスト兼データスチュワードをしています。普段はデータ分析業務をやりつつ、データ基盤の品質管理も推進しています。最近は AI エージェントを前提としたデータ基盤の設計アップデートを追いかけていて、毎日ワクワクしています!
それでは記事に入ります。

はじめに

2026年4月22日、Google Cloud が「Agentic Data Cloud」という構想を打ち出しました。Google Cloud Next '26 の流れで、関連する発表群が一斉に公開されたタイミングです。

データ基盤や BigQuery と聞いても、普段あまり触れていない方にとっては、正直ピンとこないかもしれません。
アプリケーション開発やデザインに関わっていると、「どこかにデータが溜まっていて、分析チームが使うもの」くらいの認識でも、これまでは特に困らなかったと思います。

この記事は、そんな方に向けて書いています。

専門用語を細かく解説するというよりは、「データ基盤がこれからどう変わっていくのか」 をイメージできるように、なるべくシンプルに整理していきます。
細かい構成や機能については後半に Appendix としてまとめているので、気になる方だけ読んでもらえれば大丈夫です。

ちなみに自分は、データ基盤の構築に関わるデータスチュワードとして働いています。
「エージェントがデータから自然に示唆を引き出してくれる基盤」 を作りたい、と考えていたのですが、今回の発表はそのイメージが一気に現実に近づいたような内容でした。

かなりワクワクしながら見ていたので、その温度感も含めて共有できればと思います。

そもそもデータ基盤って？

ざっくり言うと、会社のデータが集まっている場所 です。

ユーザーの行動ログ、売上、在庫、問い合わせ履歴など、さまざまなデータが 1 箇所に集められていて、必要に応じて取り出して分析します。
Google でいう BigQuery、他社でいう Snowflake や Redshift がこの役割を担っています。

この「データが集まる場所」が、いま静かに、でも確実に作り替えられています。

これまでのデータ基盤 = "倉庫"

これまでのデータ基盤は、本質的には倉庫のようなものでした。

データを集めて整理する
人が SQL を書いて取り出す
ダッシュボードで可視化する
人が見て判断する

この流れが基本です。

整然と管理された倉庫があって、必要なときに担当者が取り出してくれるようなイメージ。
優秀なデータエンジニアが棚を整え、依頼に応じてデータを取り出す。そして最終的な判断は人が行う。

つまり、データはあくまで「人が使うためのもの」 でした。

これからのデータ基盤 = "AI の相棒"

ここで前提が大きく変わります。

Agentic Data Cloud が取っている立場はシンプルで、
「データ基盤は人のためではなく、AI エージェントのためにある」 という考え方です。

AI エージェントが自分でデータを探し、解釈し、そのまま次のアクションまでつなげる。
人はそれを監督する側に回る、という構図です。

少し極端に言うと、「倉庫番そのものが AI になる」 イメージです。

デモで見えた世界

基調講演のデモでは、こんなシーンが紹介されていました。

新商品のフローズンヨーグルトの市場投入判断
AI が社内の PDF レシピとサプライヤーの仕様書 PDF を自動で突合し、隠れた大豆アレルゲンを発見
続けて AWS 上にある顧客データと Google 上のアレルゲン情報を結合して市場規模を算出
最後に ROI 予測まで生成し、1,500 万ドル規模のビジネス判断を数分で提示

このプロセスの中で、分析者が SQL を書いたり、データエンジニアがパイプラインを組んだりする場面は出てきません。
エージェントがすべてを横断して処理しています。

初めて見たとき、正直ゾクッとしました。
1 年前、自分が「こういうデータ基盤を作りたい」と描いていた絵が、すでに別の会社のプロダクトデモとして動いていたからです。

未来像として語っていたものが、もう製品として並んでいる。
その距離感を実感したのが、今回の発表でいちばん衝撃だったところです。

構造をざっくり図にすると、こんな対比になります。

左側が「人間のためのデータ基盤」、右側が「AI エージェントのためのデータ基盤」。
やっていることは似ていますが、誰のために最適化するか が根本から違います。

何が一番重要なのか

今回の発表で一番重要だと感じたのは、この一言です。

Reasoning without context is just a guess.
（文脈なき推論は、ただの当てずっぽう）

AI にテーブルをそのまま渡しても、賢く動いてくれるわけではありません。
カラム名が u_id だけでは意味が分かりませんし、「売上」の定義がチームごとに違えば、簡単に誤解します。

つまり、

AI の性能よりも、「どんな文脈を渡せるか」の方が重要になる

ということです。

そしてその「文脈」を準備する装置が、これからのデータ基盤の中核になります。
ここが今回の発表の根っこにある認識で、ここを押さえると他の機能の意味が全部つながります。

変わる 3 つのポイント

今回の発表をシンプルにまとめると、変化は大きく 3 つです。

1. データに「意味」を持たせる

データをそのまま置いておくだけではなく、

このテーブルは何を表しているのか
この指標はどう定義されているのか
テーブル同士はどう関係しているのか

といった「意味」を基盤側で管理します。

Google ではこれを Knowledge Catalog として提供しています。
人間の頭の中にあった業務知識を、データ基盤側に持たせるイメージです。

さらに PDF や画像のような、従来「ダークデータ」と呼ばれていた非構造化データにも自動でタグ付けしてくれます。
AI がファイルの中身まで含めて、横断的に参照できるようになります。

2. AI との接続を標準化する

AI がデータにアクセスする方法も整理されました。

MCP（Model Context Protocol） という共通の仕組みに乗り、BigQuery や Cloud SQL、AlloyDB、Spanner といった主要な DB 製品すべてに、MCP 経由の接続口が正式に用意されました。

イメージとしては データベースの USB-C 化 です。
AI ツール側は「MCP に対応してさえいれば、どの DB にもそのまま繋がる」世界に近づいています。
Claude Code や VS Code、Gemini CLI からそのまま BigQuery を叩ける、という話は基調講演でもそのまま名指しで出ていました。

3. データを閉じ込めない

これまでのデータ基盤は、クラウドごとに分断されがちでした。
Google のデータは Google に、AWS のデータは AWS に、という状態です。

今回のアプローチでは、

「データはどこにあってもいい。取りに行く側を賢くする」

という考え方に変わっています。

具体的には Apache Iceberg というオープンなテーブル形式をベースに置き、どこのクラウドにあるデータでも横断して読める設計に切り替えました。
AWS の S3 にある Iceberg テーブルを、BigQuery から直接クエリできます。しかも転送料金（エグレス）もかかりません。

「データを Google に引っ越してくれ」ではなく、「データは好きな場所に置いたままでいい。こっちから見に行くから」というスタンスへの転換、と言えます。

すでに起きている変化

これらはまだ未来の話、というわけではありません。

基調講演と関連ブログで紹介された、すでに本番環境で使われ始めている事例をいくつか拾っておきます。

Virgin Voyages（クルーズ会社）: 大規模な旅程再予約処理が 6 時間 → 11 分 に短縮。1,000 を超える特化型エージェントが協調している
Macquarie Bank（オーストラリアの銀行）: BigQuery + Spanner を基盤に AI アシスタント "Q" を全社展開し、詐欺被害が半減
Vodafone（通信大手）: 数百のエージェントをデプロイ。年間数百万ユーロのコスト削減 見込み
Citadel Securities（金融）: 既存ワークロードを 2〜4 倍高速化、コスト 30% 削減。処理サイクルが週/日単位から時間/分単位へ
Seven-Eleven Japan: Spanner + BigQuery ベースのデータ基盤で 21,000 店舗のデータを統合運用

共通しているのは、人が分析していた部分を、エージェントが担い始めている という点です。
試験運用ではなく、もう基幹業務の中で効き始めています。

おわりに

1 年前、自分はデータスチュワードとして 「エージェントが自然にデータから示唆を引き出してくれる基盤」 を作ろう、と決めました。

ただ、その時点ではまだピースが揃っていませんでした。

セマンティクスをどう扱うか
安全にデータへ接続する方法
クラウドをまたいだデータの扱い

どれも課題としては見えていたものの、実装レベルではバラバラで、絵に描いた餅感が拭えませんでした。

それがこの 1 年で、MCP が標準として据わり、Knowledge Catalog が GA になり、エージェントが大手企業の本番業務に入り始めました。
自分が描いていた地図の白い部分が、一枚ずつ埋まっていっている感覚があります。

追いかけていた未来像が、毎週のように現実側から近づいてくる。
データ基盤を作る側の立場として、これほどやりがいを感じる時期はそうありません。

AI-native なデータ基盤は、もう「いつか来るもの」ではなく、少しずつ当たり前になり始めています。

詳しく知りたい方向け（Appendix）

本文では「3 つの変化」としてざっくり整理しましたが、もう少し解像度を上げたい方向けに、以下 3 つを置いておきます。

A. 4 層モデルで整理する Agentic Data Cloud

Google の公式ブログ群の表現を統合すると、Agentic Data Cloud は以下の 4 層で構成されます。

層	役割	代表コンポーネント
Layer 1: Agentic Workforce	エージェント群	Data Engineering Agent / Data Science Agent / Conversational Analytics / Deep Research Agent
Layer 2: Context & Memory	文脈と記憶（ハルシネーション防止）	Knowledge Catalog / Agent Memory Bank / AgentOps
Layer 3: Unified Orchestration & Action Plane	統合実行面	BigQuery / Spanner / AlloyDB / Cloud SQL / Bigtable / Looker（各 DB に Managed MCP Server）
Layer 4: Active Multimodal Engines	能動的データエンジン	Graph / Vector / Full-text Search / ObjectRef（非構造化）/ Lightning Engine for Spark

上位層（エージェント）が MCP や A2A（Agent-to-Agent）プロトコルで下位層にアクセスする構造です。
Layer 2 の Knowledge Catalog が「エージェントが嘘をつかないための構造的保証」を担う のが、従来アーキテクチャとの最大の違いです。

B. 主要機能の GA / Preview 一覧（抜粋）

GA（General Availability）は正式リリース・一般提供、誰でも本番利用 OK の状態です。Preview は試験提供段階で、使えるものの仕様変更や提供停止の可能性があります。

Next '26 時点で、多くの機能は段階的に GA しています。

カテゴリ	機能	ステータス
BigQuery コア	Fluid Scaling（秒課金、平均 34% コスト削減）	GA
	Managed Iceberg Tables	GA
	Cross-Cloud Interconnect for Lakehouse	GA
	BigQuery Graph	Preview
	BigQuery Measures	Preview
	AI.PARSE_DOCUMENT	Preview
ガバナンス	Knowledge Catalog（旧 Dataplex）	GA
	Business Glossary	GA
	エンドツーエンドデータリネージ	GA
	Automated Context Curation（Gemini 自動エンリッチ）	Preview
	LookML Agent	Preview
	Smart Storage（GCS 自動タグ付け）	Preview
エージェント	Data Engineering Agent	GA
	Data Science Agent	GA
	Conversational Analytics（BigQuery / Looker）	GA
	Database Observability Agent	Preview
	Data Agent Kit（VS Code / Claude Code / Gemini CLI 統合）	Preview
MCP	BigQuery / Cloud SQL	GA
	AlloyDB / Spanner / Looker	Preview
DB ゼロ ETL	Spanner Columnar Engine（200x 高速化）	GA
	BigQuery ↔ AlloyDB Query Federation	GA
	AlloyDB Lakehouse Federation	Preview
	Reverse ETL	Preview

Gemini 系のアシスティブ機能が、BigQuery や Looker の 既存料金に含まれる（追加課金なし） のも見逃せないポイントです。

C. 他社戦略との比較

観点	Google	Snowflake	Databricks	AWS
エージェント基盤	MCP ネイティブ、GA 最速	Cortex Agents（2025-11 GA）	Mosaic AI Agent Framework	Bedrock AgentCore
セマンティック層	Knowledge Catalog で自動化	Cortex Analyst（手動寄り）	Unity Catalog + Genie	Glue（弱い）
Lakehouse	BigQuery + Iceberg、Cross-Cloud	Iceberg + Polaris（自社完結寄り）	Delta 中心、Iceberg 互換	S3 + Lake Formation
OLTP 統合	AlloyDB / Spanner と zero-ETL	OLTP 非保有	OLTP 非保有	Aurora Zero-ETL
垂直統合	TPU → Gemini → BigQuery → Looker まで自社	IaaS 依存	IaaS 依存	分散（Redshift / Athena / EMR）

Google の差別化ポイントは、Knowledge Catalog によるセマンティクス自動付与 と、ハードウェア（TPU）から UI（Looker）まで一気通貫の垂直統合 です。
一方、データシェアリングや Marketplace のエコシステムでは Snowflake に分がある、という構図になります。

情報源

Agentic Data Cloud の新機能（日本語公式）
Architecting the Agentic Data Cloud / System of Action
The Future of Data Lakehouse for the Agentic Era
Introducing the Google Cloud Knowledge Catalog
Unveiling New BigQuery Capabilities for the Agentic Era
Google Cloud Next '26 Keynote (YouTube) — Agentic Data Cloud セクションは 0:49:44〜

You get articles that match your needs
You can efficiently read back useful information
You can use dark theme

What you can do with signing up