概要
AutoMLツールとして有名なDataRobotで、RAGを活用した生成AI機能が簡単に構築できると聞いたため使ってみた。
やること
DataRobotにてRAGを活用した生成AI機能を構築してみて、ツールの使用感を確かめる。
RAGに使用するデータは、効果がわかりやすいように、RAGなしのGPT-3.5では回答できない直近データを使用する。具体的には、2024/11/7に環境省より発表された「ブルーカーボンに関する重点調査について」の資料を利用することにした。
( https://www.env.go.jp/press/press_03968.html )
環境準備
DataRobotではDataRobot AI Platform フリートライアルという、30日間無料のトライアル環境が提供されるため、環境はそちらを利用。
無料トライアルは下記リンクから、氏名・生年月日・メアド・会社名等を記入してフォームを送信し、概ね10分程度で返信される登録メールからパスワードを設定することで使用可能になる。
https://www.datarobot.com/trial
用語
あまり聞きなじみのない用語がいくつか出てきたのでまとめておく。
用語 | 説明 |
---|---|
ワークベンチ | 複数のユースケ―スをまとめて管理する場所 |
ユースケ―ス | データセットやノートブックを管理するコンテナ |
データレジストリ | 格納したデータセットのカタログ |
ブループリント | テンプレートのようなもので、RAGや利用するLLMなどをテンプレートに沿って選ぶだけで、生成AI機能が実装できる |
手順
構築の手順は、大きく以下の流れ。ログインまでの手順は割愛する。
1. データ投入
2. ベクターDBの構築
3. LLMブループリントの構築
4. 検証
使ってみる
1. データ投入
・アップロード > ローカルデータをアップロード、を押下しデータレジストリにデータを設定する
・以上の手順で、RAGのインプットとなるデータがユースケ―スに配置される
2. ベクターDBの確認
・ベクターDBタブを選択し、「ベクターデータベースを作成」を押下
・ベクターデータベースの名前とデータソースを確定し、ベクターデータベースを作成、を押下(チャンクに関する設定も可能)
3. LLMブループリントの設定
・プレイグラウンドタブを選択し、「プレイグラウンドを追加」を押下
・設定>ベクターDBタブを選択し、先ほど作成したベクターDBを選択
・プロンプトタブにてシステムプロンプトを指定することも可能(ここでは指定せずに保存)
以上、たったこれだけの操作でRAGの作成からLLMの設定まで完了。 直感的かつ少ないステップで構築できる。
4. 検証
・作成したブループリント内で、プロンプトの送信が可能。RAGに設定したデータに関する質問をすると、データ通り回答される
・また、最大で3種類のブループリントの結果を比較することが可能。
例えば以下は、練習1がRAGあり、練習2はRAGなしの比較である。RAGのないGPT-3.5では適切な回答が返せていないことがわかる
感想
特に躓く点もなく、総計1時間もかからない程度で構築できた。
複数のブループリントを並べて評価できるのも便利。
今回はチューニング等は実施していないが、今後試してみたい。