2
1

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?

[Oracle Cloud] Autonomous Database ) Oracle Database 23ai表データをEmbeddingをGUIを使ってやってみた。 (2025/05/20)

Posted at

はじめに

Autonomous Databaseの付属ツールの1つであるデータ変換(Data Transforms)がOCI生成AIサービスを利用したベクトル埋め込みとの統合がサポートされました。
これにより、データ変換のデータフロー機能をつかってGUIでベクトル埋め込みの作業を行うことができるようになりました。

事前作業

  • Oracle Database 23aiベースのAutonomous Database
  • ネットワークACLの設定
    データベースユーザーにホストに対する接続権限を付与
BEGIN
 DBMS_NETWORK_ACL_ADMIN.APPEND_HOST_ACE(
 host => '*',
 ace => xs$ace_type(privilege_list => xs$name_list('connect'),
 principal_name => 'admin',
 principal_type => xs_acl.ptype_db));
END;
/
  • サンプル表、データの作成
    作業用の表を作成しデータを格納します。また、Embedding結果を格納するためにVector型の列を持つ表を作成します。
create table wikisample (title varchar2(30),TEXT CLOB);
insert into wikisample (title,text) values('San Francisco','San Francisco is in California.');
-- 省略
commit;

create table wikisample_v (title varchar2(30),TEXT CLOB,v vector);

データ変換( Data Transforms ) の起動とログイン

データ変換(Data Transforms)はデータベース・アクションから起動できます。
起動しているAutonomous Databaseの詳細から、「データベース・アクション」の「すべてのデータベース・アクションの表示」を選択

image.png
データベース・アクション起動パッド
image.png
データベース・アクションのメニューから「データ変換」を選択
image.png
データ変換(Data Transforms)にログイン
image.png
データ変換に関連付けられたVMがプロビジョニングされます。
image.png
プロビジョニングされるVMのサイズはOCI WebコンソールのAutonomous Databaseの詳細の「ツール構成」から確認することができます。
image.png
Data Transformsの起動の確認
image.png

接続の作成

Embeddingデータを格納するAutonomous DatabaseとOCI 生成AIへの接続を作成します。
データ変換(Data Transforms)から「Connections」を選択
Autonomos Databaseへの接続が確認できます。
「Create Connection」をクリック
image.png
Service Typeから「Services」~「OCI Generative AI」を選択
image.png
接続の名前とOCI生成AIを利用するためのクレデンシャル情報を入力し「Create」をクリック
image.png

プロジェクトとデータフローの作成

Embeddingを実施するデータフローとそのデータフローを格納するプロジェクトを作成します。
データ変換(Data Transforms)から「Projects」を選択
「Create Data Flow」をクリック
image.png
「Create Data Flow」の画面で、データフローの名前を入力
「Create New Project」を選択し、プロジェクトの名前を入力
image.png
データフローの画面で「Add a Schema」をクリックして、Autonomous Databaseの接続とスキーマを選択します。
image.png
接続したスキーマが所持する表のリストからEmbedding対象とする表を選択
image.png
データベース機能ツールバーから「MACHINE LERNING」を選択
image.png
「Text Embedding Vector」をデザイン・キャンバスにドラッグし、最初に選択した表から「コネクタ」アイコン(「コネクタ」アイコン)をドラッグして、コンポーネントを接続
image.png
デザイン・キャンパス内の「Text Embedding Vector」をクリックし、OCI生成AIに関する情報を入力

  • AI Service:「OCI Generative AI」
  • Connection: 接続の名前(例:OCI_GENAI_CONN)
  • AI Model:Embeddingに使用するモデルをリストから選択(例:cohere.embed-multilingual-v3.0)
    image.png

「Column Mapping」(列マッピング)でinput_textの編集アイコンをクリック
image.png
「Expression」(式)列にEmbedding対象とするテキスト列をドラッグ
image.png
デザイン・キャンバスにEmbeddin結果を格納する表をドラッグ(例:WIKISAMPLE_V)
image.png
選択した表の編集から「Column Mapping」(列マッピング)でベクトル列の編集アイコンをクリック
image.png
「Expression」(式)列にTextEmbeddingVectorのVECTOR_EMBEDDINGをドラッグ
image.png
列マッピングの確認
image.png

Embeddingの実施と確認

データ・フローを保存して実行します。
image.png
保存していない場合ダイアログが表示されます。
image.png
データフローを開始
image.png
ジョブの確認
image.png

image.png

image.png
Embedding結果をSQLで確認(例:データベース・アクションSQL)
image.png
ベクトル列の値
image.png

おわりに

Autonomous Databaseのデータ変換を使うことでGUIベースにEmbeddingのフロー作成・実行ができました。
データ変換の使用を開始すると、ツールに関連付けられたVMがプロビジョニングされ、データベースECPU数に加えてツールに割り当てられたECPU数の時間課金が発生します。
データベースインスタンスが停止または終了した場合、またはデータ変換が指定された最大アイドル時間(デフォルト10分)を超えるアイドル状態の場合、データ変換に割当て済ECPUの請求が停止します。

参考情報

2
1
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
2
1

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?