はじめに
Oracle Autonomous AI Lakehouse が登場しました。
Oracle Cloud Infrastructure (OCI) では元々「Automonous Database」というマネージドかつ自律的なOracle Databaseサービスが提供されていましたが、こちらが「Automonous AI Database」に改名されました。
Automonous AI Databaseではワークロードに合わせて以下のタイプがあります
- Autonomous AI Transaction Processing
- Autonomous AI Lakehouse
- Autonomous AI JSON Database
- APEX Application Development
「Autonomous AI Lakehouse」は、 「Autonomous Data Warehouse」 と呼ばれていた分析・DWH向けデータベースが名称変更されたものになります。
AWS、Azure、Google Cloudでも利用可能です
レイクハウス向け機能強化
Autonomous AI Databaseはレイクハウスのための機能が強化されており、Apache Icebergのサポートなどがおこなわれています。
AWS Glue、Snowflakeなどへのアクセス(Autonomous AI Database Catalog)
- AWS GlueやDatabricks Unity、Snowflake Polarisなどのカタログを取り込むことができます(「カタログのカタログ」と呼ばれています)
- データをAutonomous AI Databaseに取り込むのではなく、統合ビューを作成してカタログ先のデータ(Icebirg表を含む)にアクセスするイメージになります
- SQLからはDBリンクと同じような形で簡単にアクセスできます
- SELECT xxx FROM xxx@<カタログ名>
Data Lake Accelerator
- Icebergなどのオブジェクト・ストアアクセス時に負荷に応じて起動され、追加のCPU割当てをおこなってパフォーマンスを向上させます
- 処理が終わると追加したCPUは解放されます
- プロビジョニング画面、クローン画面で機能の有効/無効と、割り当てるCPU数を設定できます
外部表キャッシュ
- Icebergデータ等が格納されている外部表のデータをキャッシュし、パフォーマンスを向上させます
- Autonomous AI DatabaseはExadataを利用しており、キャッシュによってExadata本来の性能を発揮できます
- アプリケーションからは透過的です
AI機能
- SELECT AIなどのAutonomous AI DatabaseのAI機能を用いて、自然言語でデータ分析をおこなうことができます
- Autonomous AI Databaseの機能ですが、カタログを通して様々なデータソースをAIの分析対象にすることができます
他のOCIのデータ分析基盤
OCI上でのみ利用できるサービスとして、「Oracle AI Data Platform」があります。
こちらはAIデータ分析のための統合環境になります。
Autonomous AI Lakehouse、Oracle Analytics Cloud、Oracle Object Storage、OCI Generative AIなどが統合されています。
また、Apache Spark、Delta Lakeといったオープンソーステクノロジも統合されています。
PythonやSparkSQLで分析をおこなうためのノートブックも用意されています。