お手軽にRAG構築ができると評判のBedrockナレッジベースを試してみた。
利用サービス概要
Amazon Bedrock
生成AIアプリ開発のための基盤モデルAPI提供サービス。サードパーティ製の基盤モデルから選択利用できる。
Knowledgebase for Amazon Bedrock
RAG構築のためのマネージドサービス。S3にドキュメントを上げて紐付けるだけで埋め込みも検索エンジンもよしなに用意してくれる。
Amazon Bedrockのナレッジベースは、データソースへのカスタム統合を構築してデータフローを管理することなく、取り込みから取得、迅速な拡張まで、RAGワークフロー全体を実装するのに役立つフルマネージド機能です。あるいは、ベクトルデータベースを設定せずに、質問をしたり、単一のドキュメントからデータを要約したりすることもできます。
データソース
そのへんのWikipedia読ませてもつまんないので遊戯王カードリストとルールブックをぶちこんでみる。
25年の歴史が積み重なったルールとカードテキストをAIはどう要約してくれるのか!?
カードリスト
ygoprodeck APIを叩いてcards.csvを作る。
お試しなので一部のカード、ステータスのみで。
- メインデッキに入るモンスターカード(6,611種)
- レベル / 種族 / 属性 / 効果 / 効果テキスト
ルールブック
ygoprodeck言語に合わせて英語版の公式ルールPDFを使用。
EXゾーンルール改定前の2020年版だけど、今回はEXカード使わないし誤差でしょ。
手順
データソースBucket作成
Amazon S3を開き、バージニア北部リージョンでBucket作成。
2024-07現在、Bedrockはバージニア北部限定なため。
Bedrock設定
Amazon Bedrock マネジメントコンソールから利用を開始。
モデルアクセス より使用する基盤モデルを選択。
- Anthropic/Claude
- テキストチャットLLM
- Cohere/Embed English
- データソースのベクトル変換用
- Amazon Titan Text Embeddings でもいいです(違いは分かってない)
オーケストレーション > ナレッジベースを作成
- IAM許可:新しいサービスロールを作成して使用
- Choose data source:Amazon S3
次へ
埋め込みモデルを選択。
次へ→設定を確認してナレッジベース作成
作成には数分かかります。
ステータスがReadyになったら作成完了。
作成したナレッジベースを開き、使用する基盤モデルを選択。
データソースを同期。
遊戯王RAG検証
「使い物にならない」というのが結論。
- 自然言語でカードリスト検索を行える
- 質問に対し正しいルールを回答できる
の2点を期待していたが
いずれも回答可能なのは「データソースに直接的な記載がある」場合のみ。
他のカードステータスを参照するなど応用的な要素が入ると全く精度が出ない。
LLM設定とかプロンプトの工夫で解決し得るのかは不明。知識がないので。
Amazon Kendraで作り込めばなんとかなるのかもしれない。なにもわからない。
少なくともナレッジをデータソースにぶち込むんだだけのマネージドサービスでは実用に耐えるものはできないということは分かった。
前者に関しては、自然言語からの検索条件抽出を生成AIで行い
実際クエリ叩くのはアプリケーション側でやればかなりマシになりそう。
以下検証。
自然言語でカードリスト検索できるか
《トリック・デーモン/Archfiend Heiress》で検証。
カード名に「デーモン(Archfiend)」を含むカードをサーチする効果を持つ。
《トリック・デーモン/Archfiend Heiress》
効果モンスター 星3/闇属性/悪魔族/攻1000/守 0
このカード名の効果は1ターンに1度しか使用できない。
①:このカードが効果で墓地へ送られた場合、または戦闘で破壊され墓地へ送られた場合に発動できる。デッキから「トリック・デーモン」以外の「デーモン」カード1枚を手札に加える。
If this card is sent to the Graveyard because of a card effect or being destroyed by battle: You can add 1 "Archfiend" card from your Deck to your hand, except "Archfiend Heiress". You can only use the effect of "Archfiend Heiress" once per turn.
Q:《トリック・デーモン》で《デーモンの騎兵/Archfiend Cavalry》を手札に加えることはできますか?
--
A:❌ いいえ。《トリック・デーモン》はデッキから「デーモン」を手札に加えます。《デーモンの騎兵》は指定されていません。
カードテキスト「"Archfiend" card」を「《デーモン》という特定のカード名」と解釈している。
補足して再トライ。
Q:カードテキスト内に記載されている「~」カードとは、カード名に「~」を含むカード全てを指します。
《トリック・デーモン》で《デーモンの騎兵》を手札に加えることはできますか?
--
A:⭕️ はい。《トリック・デーモン》の効果で《デーモンの騎兵》をデッキから手札に加えることができます。(中略)
《デーモンの騎兵》は「デーモン」モンスターなので、《トリック・デーモン》の効果の条件を満たします。
Q:《トリック・デーモン》の効果で手札に加えることのできるカードを全て列挙してください。
--
A:❌(効果テキストの解説のみ)
リスト列挙指示はほぼ無視される。
たまーに挙げてくれてるが網羅性は皆無で中身も間違っている。
プロンプトやカードを変えてみても正しいリストが出力されることは無かった。
もちろん《魂の造形家/Spirit Sculptor》の攻守合計値参照など複雑な抽出も不可
正しいルールを回答できるか
付属ルールブックに書いてないルールの方が多いカードゲーム、遊戯王。
まずは基本的なルール解釈ができるかを検証する。
ルールブックにまんま書いてあることはほぼ完璧に回答可能。
Q:レベル6モンスターの通常召喚に必要なリリースは何体ですか?
--
A:⭕️ レベル6モンスターは通常召喚に1体のリリースが必要です
Q:自分のATK2500モンスターと相手のATK 3000モンスターが戦闘を行った場合、何ポイントのダメージを受けますか?
--
A:⭕️ (略)攻撃力3000のモンスターが攻撃力2500のモンスターを超えた分(500 ATK)を戦闘ダメージとして攻撃プレイヤーのLPから減算します。
Q:トークンをエクシーズ素材に使うことはできますか?
--
A:⭕️ いいえ、トークンをエクシーズ素材として使用することはできません。検索結果によると「トークンをエクシーズ素材として使用することはできない」とのこと
同じ内容でもカードステータスを参照するような質問はお手上げ🤷
Q:自分の《ブラック・マジシャン》と相手の《青眼の白龍》が戦闘を行った場合、何ポイントのダメージを受けますか?
--
A:❌ 申し訳ございませんが、このリクエストには対応できません。