2
2

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?

OCI × Open Table Format / Lakehouse 関連記事・ブログまとめ

2
Last updated at Posted at 2026-05-06

はじめに

Open Table Format は、データレイク上のファイル群を「テーブル」として扱うための仕組みです。
この記事では、OCI × Open Table Format / Open Lakehouse 関連の記事・ブログをまとめます。

対象技術の整理

技術 分類 Oracle / OCIでの主な使いどころ
Apache Iceberg Open Table Format ADB外部表、Autonomous AI Lakehouse、Data Transforms、GoldenGate
Delta Lake Open Table Format OCI Data Flow、Oracle AI Data Platform、メダリオン構成
Apache Hudi Open Table Format Oracle AI Data PlatformのDelta UniForm経由の互換性として登場
Delta UniForm 相互運用レイヤー Delta LakeをIceberg/Hudiクライアントから読めるようにする仕組み
Delta Sharing Open Data Sharing Protocol ADB Data Share、Databricks連携、OAC連携、pandas連携
Iceberg REST Catalog Catalog Protocol Polaris、AWS Glue、Unity Catalog、Gravitino、ADB Catalog連携
DBMS_CATALOG Oracle側Catalog管理 外部CatalogをADBにマウントしてSQL参照
DBMS_SHARE Oracle側Data Share管理 Delta Sharingベースの共有をPL/SQLで管理
GoldenGate CDC / Replication Iceberg / Delta / AI Data Platform / S3 Tables等へのリアルタイム連携

1. 全体像をつかむ

Open Table Format / Open Lakehouse を Oracle / OCI 目線で理解するための入口です。

1.1 Autonomous AI Lakehouse / Oracle AI Data Platform

2. OCI上でOpen Table Formatを作る・操作する

OCI Object Storageを保存先にし、OCI Data Flow / Spark / Oracle AI Data PlatformでIcebergやDelta Lakeを扱う分類です。

2.1 IcebergをOCI Object Storage + Data Flowで扱う

2.2 Delta LakeをOCI Data Flowで扱う

2.3 Oracle AI Data Platformでメダリオン構成を作る

3. Autonomous AI DatabaseからOpen Table Formatを読む

ADBからIcebergテーブルやDelta UniFormテーブルを外部表として読む分類です。

3.1 Iceberg外部表として読む

3.2 Delta Lake / UniFormをIceberg互換で読む

4. Catalogで管理・発見する

Catalogでテーブルを管理・発見・参照する分類です。

4.1 DBMS_CATALOG / ADB Catalog

4.2 Data Studio / Catalog Tool

5. Delta Sharingで共有・消費する

Delta SharingはOpen Table Formatそのものではありませんが、Oracle / OCIにおけるOpen Lakehouse相互運用で重要なデータ共有プロトコルです。

5.1 ADBのData Share / DBMS_SHARE

5.2 ADBの共有データを外部ツールで読む

5.3 DatabricksとADBをDelta Sharingでつなぐ

6. 外部Lakehouse製品とOracleをつなぐ

Snowflake、AWS Glue、Databricks Unity Catalog、Apache Gravitinoなどの外部Catalog / Lakehouse製品とOracleをつなぐ分類です。

6.1 Snowflake Iceberg / Polaris / Horizon

6.2 AWS Glue Catalog

6.3 Databricks Unity Catalog / Delta UniForm

6.4 Apache Gravitino

7. Open Table Formatへ書き込む・同期する

Oracle / OCI側からOpen Table Formatへ書き込む、またはCDCで継続同期する分類です。

7.1 Data Transformsで書き込む

7.2 SQLでIcebergテーブルを作成・書き込む

  • CREATE ICEBERG TABLE — Oracle Docs / SQL Language Reference
    Oracle Database 26のCREATE ICEBERG TABLE文リファレンス。DBMS_CATALOGでマウントしたIceberg REST Catalog上にIcebergテーブルを作成するDDLで、Oracle SQLからOpen Table Formatへ書き込む構成を確認できる。

7.3 GoldenGateでIceberg / Delta / Open Lakehouseへ同期する

7.4 Kafka / ストリーミングデータをOpen Table化する

8. Select AIでOpen Table Formatデータを活用する

Iceberg外部表や複数データソースを、ADBのSelect AI / NL2SQLで自然言語検索する分類です。

8.1 Snowflake IcebergをSelect AIで分析する

8.2 Iceberg外部表とOracle内データを組み合わせる

8.3 AI Vector Search

  • Apache Icebergで類似検索を実行する方法 — Oracle Blog / Oracle for Engineer JP
    Oracle AI Database 26ai / AI Vector Searchを使い、Icebergテーブル上のベクトル埋め込みに対して、データをDBへコピーせずに類似検索を実行する方法。外部表、VECTOR_DISTANCE、ベクトル索引によるANN検索に触れている。

  • Oracle Unveils AI Database Agentic Innovations for Business Data — Oracle Press Release
    Oracle AI Databaseのagentic AI関連機能発表。Apache Iceberg上のベクトルデータをAI Vector Searchで直接検索する「Oracle Vectors on Ice」に触れており、IcebergデータレイクとOracle AI Databaseの統合検索の位置づけを確認できる。

9. 性能・運用を考える

Open Table Formatや外部データをADBから使う際の、性能・キャッシュ・データ発見・運用に関する分類です。

9.1 外部データアクセスを高速化する

9.2 データを発見・運用する

10. まとめ

OCI × Open Table Format を理解するときは、以下の広い流れで整理すると分かりやすいです。

  1. OCI上でOpen Table Formatを作る

    • OCI Object StorageにIceberg / Delta Lakeのデータを置く
    • OCI Data Flow / Spark / AIDPで処理する
  2. ADBから読む

    • Autonomous AI DatabaseでIcebergを外部表として参照する
    • Delta LakeはDelta UniForm経由でIceberg互換として読む構成もある
  3. Catalogで運用する

    • DBMS_CATALOG や Data Studioで外部Catalogをマウントする
    • Snowflake Polaris、Horizon、AWS Glue、Unity Catalog、Gravitinoと連携する
  4. Icebergへ書き込む

    • Data Transforms でOCI Object StorageやSnowflake-managed Icebergへ書き込む
    • GoldenGateでCDCデータをIcebergへ連携する
  5. 同期する

    • GoldenGateでIceberg / Delta / AIDP / S3 Tables / BigLake / FabricへCDC連携する
  6. 性能と運用を考える

    • Data Lake Acceleratorで外部データスキャンを高速化する
    • External Table Cacheでよく使う外部表データをキャッシュする
    • Catalog ToolやALL_REMOTE_TABLESで外部データを発見しやすくする

Open Table Formatは、単なるファイル形式ではなく、データファイル、メタデータ、スナップショット、Catalog、共有プロトコル、実行エンジンが組み合わさるアーキテクチャです。

Oracle / OCIの文脈では、OCI Object Storage、OCI Data Flow、Autonomous AI Database、Autonomous AI Lakehouse、Oracle AI Data Platform、Data Studio、Data Transforms、DBMS_CATALOGDBMS_SHARE、Select AI、GoldenGateを、用途ごとに整理すると全体像が見えやすくなります。

2
2
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
2
2

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?