はじめに
Open Table Format は、データレイク上のファイル群を「テーブル」として扱うための仕組みです。
この記事では、OCI × Open Table Format / Open Lakehouse 関連の記事・ブログをまとめます。
対象技術の整理
| 技術 | 分類 | Oracle / OCIでの主な使いどころ |
|---|---|---|
| Apache Iceberg | Open Table Format | ADB外部表、Autonomous AI Lakehouse、Data Transforms、GoldenGate |
| Delta Lake | Open Table Format | OCI Data Flow、Oracle AI Data Platform、メダリオン構成 |
| Apache Hudi | Open Table Format | Oracle AI Data PlatformのDelta UniForm経由の互換性として登場 |
| Delta UniForm | 相互運用レイヤー | Delta LakeをIceberg/Hudiクライアントから読めるようにする仕組み |
| Delta Sharing | Open Data Sharing Protocol | ADB Data Share、Databricks連携、OAC連携、pandas連携 |
| Iceberg REST Catalog | Catalog Protocol | Polaris、AWS Glue、Unity Catalog、Gravitino、ADB Catalog連携 |
| DBMS_CATALOG | Oracle側Catalog管理 | 外部CatalogをADBにマウントしてSQL参照 |
| DBMS_SHARE | Oracle側Data Share管理 | Delta Sharingベースの共有をPL/SQLで管理 |
| GoldenGate | CDC / Replication | Iceberg / Delta / AI Data Platform / S3 Tables等へのリアルタイム連携 |
1. 全体像をつかむ
Open Table Format / Open Lakehouse を Oracle / OCI 目線で理解するための入口です。
1.1 Autonomous AI Lakehouse / Oracle AI Data Platform
-
Oracle Autonomous AI Lakehouse — Qiita / @fujid
Autonomous AI LakehouseとIceberg / Catalog / Data Lake Acceleratorの概要。 -
Oracle Autonomous AI Lakehouse 26ai がリリースされたので作成してみてみた — Qiita / @shirok
Autonomous AI Lakehouse 26aiの作成・確認記事。 -
Oracle AI Data Platform(AIDP) がリリースされたので作成してみてみた — Qiita / @shirok
AIDPの作成と、Delta Lake / IcebergなどのOpen Format活用の概要。 -
Oracle Autonomous AI Lakehouse Embraces Apache Iceberg to Deliver Open, Multicloud Data Access — Oracle Blog / Data Warehousing
Autonomous AI LakehouseとIceberg採用の発表ブログ。 -
Oracle Autonomous AI Lakehouse、Apache Icebergを採用し、オープンかつマルチクラウドなデータ・アクセスを実現 — Oracle Blog / Oracle for Engineer JP
上記発表ブログの日本語版。 -
Oracle Autonomous AI Lakehouse — Oracle Blog / Database
Lakehouse、Iceberg、Catalog、Data Lake Acceleratorの全体像。 -
Leading Analysts Highlight the Advantages of Oracle Autonomous AI Lakehouse — Oracle Blog / Data Warehousing
Autonomous AI Lakehouseに対するアナリストコメントまとめ。 -
オラクル、AI時代のイノベーションを支えるOracle AI Data Platformを発表 — Oracle Press Release JP
Oracle AI Data Platformの発表資料。Delta LakeやIcebergなどのオープンフォーマットに言及。 -
Oracle AI Data Platform: OCI上で、よりスマートなインサイトとスケーラブルなAIを実現 — Oracle / AI Data Platform
AIDPの製品紹介。Open FormatデータストアとAI活用の位置づけ。 -
Overview of Oracle AI Data Platform and Workbench — Oracle Docs / AI Data Platform
AIDPの公式概要。Delta Lake、Delta UniForm、Iceberg/Hudi互換を確認できる。 -
Data Platform - Data Lakehouse — Oracle Architecture Center
OCIでのData Lakehouse参照アーキテクチャ。
2. OCI上でOpen Table Formatを作る・操作する
OCI Object Storageを保存先にし、OCI Data Flow / Spark / Oracle AI Data PlatformでIcebergやDelta Lakeを扱う分類です。
2.1 IcebergをOCI Object Storage + Data Flowで扱う
-
OCIでApache Iceberg入門:Object StorageとData Flowで動かしてみる — Qiita / @yushibats
OCI Object StorageとData FlowでIcebergを動かす入門。 -
OCIで試すApache Iceberg:Parquetとの比較でわかる4つの特徴 — Qiita / @yushibats
Parquet比較でIcebergの特徴を整理。 -
Iceberg テーブルを Apache Spark & OCI Data Flow で操作する — Qiita / @tkote
Spark / OCI Data FlowでIcebergを操作する実践記事。 -
OCI Data Flow Overview — Oracle Docs / OCI Data Flow
OCI Data Flowの公式概要。 -
OCI Object Storage Amazon S3 Compatibility API — Oracle Docs / OCI Object Storage
S3互換APIでOCI Object Storageを扱うための公式情報。 -
oracle-dataflow-samples — GitHub / Oracle Samples
OCI Data Flowのサンプル集。Iceberg / Delta Lakeの検証に使える。
2.2 Delta LakeをOCI Data Flowで扱う
-
Oracle Cloud Infrastructure (OCI) Data Flow で Delta Lake を試してみた — Qiita / @tkote
OCI Data FlowでDelta Lakeを操作する入門記事。 -
Data Flow and Delta Lake — Oracle Docs / OCI Data Flow
OCI Data FlowでDelta Lakeを使う公式ドキュメント。 -
Data Flow now supports Spark 3.2.1, Conda Packs, and Delta Lakes — Oracle Release Notes / OCI Data Flow
OCI Data FlowのDelta Lake対応リリースノート。
2.3 Oracle AI Data Platformでメダリオン構成を作る
-
生成AIによるデータ加工でメダリオン・アーキテクチャを構築できるOracle AI Data Platform (AIDP) を使ってデータ分析してみた — Qiita / @ssfujita
AIDPでDelta Lakeを使い、メダリオン構成を作る実践記事。 -
メダリオンアーキテクチャをOracle AI Data Platformで実装してみる — Qiita / @ksonoda
AIDPでBronze / Silver / Gold構成を実装する記事。 -
〖OCI〗新サービスのAIデータ基盤「Oracle AI Data Platform (AIDP)」を試す:ADBと連携してデータ結合 — Qiita / @yushibats
AIDPとADBを連携し、管理テーブルや外部カタログを使う記事。 -
Consolidate Oracle Fusion AI Data Platform and E-Business Suite Data with Oracle AI Data Platform — Oracle Blog / Analytics
AIDPでIceberg / Delta Lake形式を使う業務データ統合例。
3. Autonomous AI DatabaseからOpen Table Formatを読む
ADBからIcebergテーブルやDelta UniFormテーブルを外部表として読む分類です。
3.1 Iceberg外部表として読む
-
Object Storage 上の Iceberg テーブルを Autonomous AI Database の外部表にする — Qiita / @tkote
OCI Object Storage上のIcebergをADB外部表として参照。 -
SnowflakeのIcebergテーブルをOCI Autonomous DatabaseからSELECT AIで自然言語検索してみた — Qiita / @yushibats
Snowflake IcebergをADB外部表化。 -
S3 Iceberg外部表とOracle DBローカル表を統合し、SELECT AI(NL2SQL)で顧客分析してみた — Qiita / @yushibats
Iceberg外部表とOracleローカル表を統合分析。 -
SnowflakeのデータにApache IcebergとADBを使って自然言語(NL2SQL)で問い合わせてみた — Qiita / @ssfujita
Snowflake Iceberg表を外部表化。 -
Iceberg Tables: A New Data Source for Oracle Autonomous Database — Oracle Blog / Autonomous AI Database
ADBからIcebergを読む基本パターン。 -
Query Apache Iceberg Tables — Oracle Docs / Autonomous AI Database
ADBでIcebergをクエリする公式ドキュメント。
3.2 Delta Lake / UniFormをIceberg互換で読む
-
Query Apache Iceberg Tables — Oracle Docs / Autonomous AI Database
Delta Lake UniFormテーブルをIcebergメタデータ経由で読む説明を含む。 -
Overview of Oracle AI Data Platform and Workbench — Oracle Docs / AI Data Platform
Delta Lake、Delta UniForm、Iceberg/Hudi互換の位置づけを確認できる。
4. Catalogで管理・発見する
Catalogでテーブルを管理・発見・参照する分類です。
4.1 DBMS_CATALOG / ADB Catalog
-
Announcing Open Enterprise Data Access with the Oracle Autonomous AI Database Catalog — Oracle Blog / Autonomous AI Database
ADB Catalogと外部Catalog連携の発表ブログ。 -
ADB のカタログを使ってIceberg テーブルに自然言語検索(Select AI)してみた — Qiita / @yushibats
PolarisをADB Catalogに登録し、Select AIで検索。 -
Introducing the Autonomous Database Catalog — Oracle Blog / Autonomous AI Database
ADB Catalog / Catalog Toolの初期紹介。 -
New Autonomous Database Multi-Catalog Data Discovery and Integration — Oracle Blog / Autonomous AI Database
複数Catalogからデータを発見・統合する考え方。 -
Manage Catalogs with DBMS_CATALOG — Oracle Docs / Autonomous AI Database
DBMS_CATALOGの公式ドキュメント。 -
DBMS_CATALOGの概要 — Oracle Docs JP / Autonomous AI Database
DBMS_CATALOGの日本語ドキュメント。
4.2 Data Studio / Catalog Tool
-
ADB の Database Actions で使える「Catalog Tool」とは? — Qiita / @yushibats
ADBのCatalog Toolで外部データを探す方法。 -
〖ADB〗IcebergカタログをData StudioからGUIで登録する — Qiita / @yushibats
Data Studio GUIでIceberg Catalogを登録。 -
Discover Remote Data Faster with ALL_REMOTE_TABLES in Autonomous Database Serverless — Oracle Blog / Autonomous AI Database
ADBからリモートデータを発見するビュー紹介。 -
リモート・カタログの問合せの概念図 — Oracle Docs JP / Autonomous AI Database
Autonomous AI DatabaseからリモートCatalogを問い合わせる構成の概念図。Database Link、AWS Glue、OCI Data Catalog、Delta Sharing、Iceberg Catalogなどの接続パターンを俯瞰できる。
5. Delta Sharingで共有・消費する
Delta SharingはOpen Table Formatそのものではありませんが、Oracle / OCIにおけるOpen Lakehouse相互運用で重要なデータ共有プロトコルです。
5.1 ADBのData Share / DBMS_SHARE
-
Unlimited data-driven collaboration with Data Sharing of Oracle Autonomous Database — Oracle Blog / Autonomous AI Database
ADB Data SharingとDelta Sharingの概要。 -
The Data Share Tool — Oracle Docs / Autonomous AI Database
ADB Data Share Toolの公式ドキュメント。 -
Overview of the Data Share Tool — Oracle Docs / Autonomous AI Database
Data Share Toolの概要。 -
Manage Shares with DBMS_SHARE — Oracle Docs / Autonomous AI Database
DBMS_SHAREで共有を管理する公式ドキュメント。 -
Consume Share — Oracle Docs / Autonomous AI Database
Delta Sharingで共有されたデータをADB側で消費する手順。
5.2 ADBの共有データを外部ツールで読む
-
[Autonomous Database] データ共有で共有した表をpandasで読み込む — Qiita / @wahagon
ADBのData Shareをpandasから読む実践記事。 -
Oracle Analytics Cloud で Delta Sharing (データ共有)で Autonomos Database に接続してみた — Qiita / @s-nori
OACからADBのDelta Sharingに接続する記事。
5.3 DatabricksとADBをDelta Sharingでつなぐ
-
How Oracle Autonomous Database Connects with Databricks Across Clouds — Oracle Blog / Data Warehousing
ADBとDatabricksをDelta Sharingでつなぐ例。 -
Seamless, Open Data Sharing Between Oracle Autonomous Database and Databricks — Oracle Blog / Data Warehousing
Oracle ADBとDatabricksのOpen Data Sharing連携。 -
Enable Oracle Autonomous Database Data Share provider Private Endpoint for Multi-cloud — Oracle Blog / Autonomous AI Database
マルチクラウド環境でADB Data Share ProviderをPrivate Endpoint化する記事。
6. 外部Lakehouse製品とOracleをつなぐ
Snowflake、AWS Glue、Databricks Unity Catalog、Apache Gravitinoなどの外部Catalog / Lakehouse製品とOracleをつなぐ分類です。
6.1 Snowflake Iceberg / Polaris / Horizon
-
Breaking Silos: Integrating Snowflake and Oracle Autonomous Database with Iceberg Tables — Oracle Blog / Data Warehousing
Snowflake IcebergをADBから参照する基本例。 -
Connecting Oracle Database to Snowflake Iceberg Tables Through Polaris Catalog — Oracle Blog / Autonomous AI Database
ADBからPolaris経由でSnowflake Icebergを参照。 -
Connecting Oracle Database to Snowflake Iceberg Tables Through Horizon Catalog — Oracle Blog / Autonomous AI Database
ADBからSnowflake Horizon Catalog経由でIcebergを参照。 -
Bridging Oracle Autonomous AI Database and Snowflake: Reading Iceberg Tables with Open Catalog Integration — Oracle Blog / Database
Snowflakeで作成したIcebergテーブルを、Polaris Open Catalog経由でAutonomous AI Databaseから参照する実践例。DBMS_CATALOG.MOUNT_ICEBERG、OAuth認証、AWS S3上のIcebergデータ参照までの手順を確認できる。 -
SnowflakeのIcebergテーブルをOCI Autonomous DatabaseからSELECT AIで自然言語検索してみた — Qiita / @yushibats
Snowflake IcebergをADB外部表化しSelect AIで検索。 -
ADB のカタログを使ってIceberg テーブルに自然言語検索(Select AI)してみた — Qiita / @yushibats
PolarisをADB Catalogに登録し、Select AIで検索。
6.2 AWS Glue Catalog
-
Oracle Autonomous AI Database CatalogsでGlueデータのクエリ — Qiita / @jiangqiandlut
AWS Glue上のIcebergをADB Catalogから参照。 -
Iceberg Tables: A New Data Source for Oracle Autonomous Database — Oracle Blog / Autonomous AI Database
Glue管理IcebergをADBから扱う例を含む。 -
Query Apache Iceberg Tables — Oracle Docs / Autonomous AI Database
ADBで対応するIceberg Catalog構成を確認。
6.3 Databricks Unity Catalog / Delta UniForm
-
Query Apache Iceberg Tables — Oracle Docs / Autonomous AI Database
Databricks Unity CatalogとDelta UniForm経由の参照構成を確認。 -
Seamless, Open Data Sharing Between Oracle Autonomous Database and Databricks — Oracle Blog / Data Warehousing
Delta SharingでADBとDatabricksをつなぐ記事。
6.4 Apache Gravitino
-
[OCI]Oracle Autonomous AI DatabaseのData Transformsを活用したOCI Object StorageへのIcebergデータ書き込み — Qiita / @misafu
Gravitino REST Catalog経由でOCI Object StorageへIceberg書き込み。 -
Announcing Open Enterprise Data Access with the Oracle Autonomous AI Database Catalog — Oracle Blog / Autonomous AI Database
Gravitinoなど外部Catalogとの連携に言及。
7. Open Table Formatへ書き込む・同期する
Oracle / OCI側からOpen Table Formatへ書き込む、またはCDCで継続同期する分類です。
7.1 Data Transformsで書き込む
-
[OCI]Oracle Autonomous AI DatabaseのData Transformsを活用したOCI Object StorageへのIcebergデータ書き込み — Qiita / @misafu
Data Transforms + GravitinoでOCI Object StorageへIceberg書き込み。 -
〖ADB〗Data Transformsを使ってSnowflake Iceberg表に書き込みを行う — Qiita / @yushibats
Data TransformsからSnowflake-managed Icebergへ書き込み。 -
Create an Apache Iceberg Connection — Oracle Docs / Data Transforms
Data TransformsのIceberg接続設定。 -
Data Transforms Enhancements — Oracle Release Notes / Autonomous Database
Data TransformsのIceberg関連機能強化。
7.2 SQLでIcebergテーブルを作成・書き込む
-
CREATE ICEBERG TABLE — Oracle Docs / SQL Language Reference
Oracle Database 26のCREATE ICEBERG TABLE文リファレンス。DBMS_CATALOGでマウントしたIceberg REST Catalog上にIcebergテーブルを作成するDDLで、Oracle SQLからOpen Table Formatへ書き込む構成を確認できる。
7.3 GoldenGateでIceberg / Delta / Open Lakehouseへ同期する
-
Oracle GoldenGate Now Certified for Oracle Autonomous AI Lakehouse and Oracle AI Data Platform — Oracle Blog / Data Integration
GoldenGateとAutonomous AI Lakehouse / AIDP / Iceberg / Delta連携。 -
Oracle GoldenGate、Oracle Autonomous AI LakehouseおよびOracle AI Data Platformをサーティファイ — Oracle Blog / Oracle for Engineer JP
上記GoldenGate記事の日本語版。 -
Announcing Apache Iceberg support with GoldenGate for Distributed Applications and Analytics 23ai — Oracle Blog / Data Integration
GoldenGate for DAAのIcebergサポート紹介。 -
Apache Iceberg on OCI Object Storage with GoldenGate for DAA 26ai — Oracle Blog / Data Integration
GoldenGate for DAA 26aiで、OCI Object Storage上のIcebergテーブルへCDCデータをリアルタイム連携する実践手順。S3互換API、Hadoop Catalog、s3a://構成を使った設定例。 -
Announcing Oracle GoldenGate for Distributed Applications and Analytics 26ai General Availability — Oracle Blog / Data Integration
GoldenGate for DAA 26aiのGA。OCI Object Storage + Iceberg連携に言及。 -
Apache Iceberg on OCI Object Storage with GoldenGate for DAA 26ai — Oracle Blog / Data Integration
GoldenGateでOCI Object Storage上のIcebergへCDC連携する実践記事。 -
Real-Time Data Replication to Oracle AI Data Platform Using OCI GoldenGate — Oracle Blog / Data Integration
OCI GoldenGateでOracle AI Data Platformへリアルタイム連携。 -
Accelerating AI and Analytics: Oracle GoldenGate 26ai Now Certified for Amazon S3 Tables — Oracle Blog / Data Integration
GoldenGate 26aiとAmazon S3 Tables / Iceberg連携。 -
Real-time Data Replication to Google BigLake Metastore with Oracle GoldenGate and Apache Iceberg — Oracle Blog / Data Integration
GoldenGateからGoogle BigLake Metastore / Icebergへ連携。 -
Oracle GoldenGate 23ai now supports Open Mirroring in Microsoft Fabric — Oracle Blog / Data Integration
GoldenGateでMicrosoft Fabric Open Mirroring / Delta Lake形式へ連携。
7.4 Kafka / ストリーミングデータをOpen Table化する
-
Oracle Autonomous Database & Confluent Tableflow: Real-Time Kafka Analytics Without ETL — Oracle Blog / Autonomous AI Database
KafkaデータをIceberg化し、ADBから分析する例。
8. Select AIでOpen Table Formatデータを活用する
Iceberg外部表や複数データソースを、ADBのSelect AI / NL2SQLで自然言語検索する分類です。
8.1 Snowflake IcebergをSelect AIで分析する
-
SnowflakeにADBから自然言語で問い合わせしてみた (SELECT AIを使ったADB Sidecar) — Qiita / @ssfujita
ADB Sidecar / Select AIの前段となる記事。 -
SnowflakeのデータにApache IcebergとADBを使って自然言語(NL2SQL)で問い合わせてみた — Qiita / @ssfujita
Snowflake × ADB × Iceberg × NL2SQLの実践。 -
SnowflakeのIcebergテーブルをOCI Autonomous DatabaseからSELECT AIで自然言語検索してみた — Qiita / @yushibats
Snowflake Iceberg外部表をSelect AIで検索。 -
ADB のカタログを使ってIceberg テーブルに自然言語検索(Select AI)してみた — Qiita / @yushibats
Catalog-managedなIcebergをSelect AIで検索。
8.2 Iceberg外部表とOracle内データを組み合わせる
-
S3 Iceberg外部表とOracle DBローカル表を統合し、SELECT AI(NL2SQL)で顧客分析してみた — Qiita / @yushibats
Iceberg外部表とOracleローカル表を統合分析。 -
Select AIで複数データソースを横断検索する:BaseDB 19c × Snowflake Iceberg — Qiita / @yushibats
BaseDB 19cとSnowflake Icebergを横断検索。
8.3 AI Vector Search
-
Apache Icebergで類似検索を実行する方法 — Oracle Blog / Oracle for Engineer JP
Oracle AI Database 26ai / AI Vector Searchを使い、Icebergテーブル上のベクトル埋め込みに対して、データをDBへコピーせずに類似検索を実行する方法。外部表、VECTOR_DISTANCE、ベクトル索引によるANN検索に触れている。 -
Oracle Unveils AI Database Agentic Innovations for Business Data — Oracle Press Release
Oracle AI Databaseのagentic AI関連機能発表。Apache Iceberg上のベクトルデータをAI Vector Searchで直接検索する「Oracle Vectors on Ice」に触れており、IcebergデータレイクとOracle AI Databaseの統合検索の位置づけを確認できる。
9. 性能・運用を考える
Open Table Formatや外部データをADBから使う際の、性能・キャッシュ・データ発見・運用に関する分類です。
9.1 外部データアクセスを高速化する
-
Introducing Data Lake Accelerator: Boosting External Data Performance with Oracle Autonomous AI Database — Oracle Blog / Autonomous AI Database
外部データ参照を高速化するData Lake Accelerator紹介。 -
Data Lake Acceleratorの紹介: Oracle Autonomous AI Databaseによる外部データ・パフォーマンスの向上 — Oracle Blog / Oracle for Engineer JP
Data Lake Accelerator紹介の日本語版。 -
Accelerate Your Analytics: Introducing External Table Cache in Oracle Autonomous AI Database — Oracle Blog / Data Warehousing
外部表データをADB側でキャッシュする機能紹介。
9.2 データを発見・運用する
-
Discover Remote Data Faster with ALL_REMOTE_TABLES in Autonomous Database Serverless — Oracle Blog / Autonomous AI Database
リモートデータ発見用ビューALL_REMOTE_TABLESの紹介。 -
ADB の Database Actions で使える「Catalog Tool」とは? — Qiita / @yushibats
Catalog Toolで外部データを検索・確認する方法。
10. まとめ
OCI × Open Table Format を理解するときは、以下の広い流れで整理すると分かりやすいです。
-
OCI上でOpen Table Formatを作る
- OCI Object StorageにIceberg / Delta Lakeのデータを置く
- OCI Data Flow / Spark / AIDPで処理する
-
ADBから読む
- Autonomous AI DatabaseでIcebergを外部表として参照する
- Delta LakeはDelta UniForm経由でIceberg互換として読む構成もある
-
Catalogで運用する
-
DBMS_CATALOGや Data Studioで外部Catalogをマウントする - Snowflake Polaris、Horizon、AWS Glue、Unity Catalog、Gravitinoと連携する
-
-
Icebergへ書き込む
- Data Transforms でOCI Object StorageやSnowflake-managed Icebergへ書き込む
- GoldenGateでCDCデータをIcebergへ連携する
-
同期する
- GoldenGateでIceberg / Delta / AIDP / S3 Tables / BigLake / FabricへCDC連携する
-
性能と運用を考える
- Data Lake Acceleratorで外部データスキャンを高速化する
- External Table Cacheでよく使う外部表データをキャッシュする
- Catalog ToolやALL_REMOTE_TABLESで外部データを発見しやすくする
Open Table Formatは、単なるファイル形式ではなく、データファイル、メタデータ、スナップショット、Catalog、共有プロトコル、実行エンジンが組み合わさるアーキテクチャです。
Oracle / OCIの文脈では、OCI Object Storage、OCI Data Flow、Autonomous AI Database、Autonomous AI Lakehouse、Oracle AI Data Platform、Data Studio、Data Transforms、DBMS_CATALOG、DBMS_SHARE、Select AI、GoldenGateを、用途ごとに整理すると全体像が見えやすくなります。