はじめに
実は以前、AWSのBedrockでサクッとRAG構築はやったことがありました!社内のLT会でも紹介したのですが、信じられないくらい簡単でした・・・!
今回は機会があってGoogle Cloudでも簡単に出来るよ〜というお話をいただいたので、ちょこっと遊んでみました。その備忘録になります
※因みに僕はほぼGCP触ったことがなくて、手探りで頑張りました、至らぬ点があってもご容赦くださいませ><
使用サービス
- Google Cloud
- cloud storage
- Vertex AI Agent Builder
- cloud storageなどをデータソースとしたRAGが作れるみたいです!
Cloud Storageにデータソースを配置する
非構造化データであっても大丈夫そうなので、テキトーにテキストファイル作成して、保存します。
バケットの作成
コンソールからCloud Storageと検索して下記画像の通り、バケットを作成します
- バケット名はグローバルに一意な命名となります
- リージョンは、単一でOKだと思います、東京リージョンを選択
バケットにファイルをアップロード
データソースとなるファイルになります!
非構造化データで良いので、PDFとかテキストファイルとか好きなものを入れてください!
Agent Builder
Vertex AI Agent Builderは、Googleが提供しているAgent 開発をサポートするサーバーレスであり、フルマネージドなサービスです。(イメージで言うとAWSでいうBedrockに近いと思います(違っていたらすみません))
ノーコード・ローコードで Agent開発ができる便利屋さんです!
RAGを用いたチャットボットも割と簡単に出来るのだと思います!今回はしませんが、BigQueryと連携したりも簡単に出来るはずなので、スプシに色々まとめているケースなど便利なのかもしれないですね
因みに料金ではこちらを参照ください!
データストアの作成
データソースを選択する画面になりますが、
アプリ作成
いよいよアプリを作っていきます!
画像から「検索」を選択してください!
「構成」はデフォルトの「汎用」でOKです
データストアの選択
先ほど作成したデータストアを選択して「作成」をしてください
※5~10分くらい時間がかかると思いますが気長に待ちましょう!
アプリを動かしてみよう
ここまででRAGで遊ぶ準備ができました!
「プレビュー」を押して試してみましょう
データソースとして与えたファイルの内容を踏まえた回答になっていそうです!
しれっと選択肢がいっぱいあります!デフォルトのものからGeminiを選択することも可能です!
終わりに
本当はチャットやエージェントも使ってみたかったのですが、ドキュメントが英語過ぎて読むの時間かかりそうだったので次回に持ち込むことにしました!
業務でもAWSを使う機会が多かったのですが、Google Cloudも普通に使いやすかったです!
どちらが良いとかではなく、解決したい課題に対してどんなアプローチが効果的かを選択するだけだと思います。
スプレッドシートとかに依存している現場とかであればもしかすると「スプレッドシート->BigQuery->Vertex AI」という構図が威力を発揮するのかもしれないなぁ〜と思いました!
近日中に上記のフローでRAG組んでみようかなと思います!
参考
https://cloud.google.com/enterprise-search?hl=ja
https://cloud.google.com/products/agent-builder?hl=ja