はじめに
こちらはQiita Advent Calendar Amazon Bedrock 17日目の記事です。
みなさんこんにちは!hiropyです。
今回は、Amazon Bedrock(以下Bedrock)の基盤モデルであるClaudeとLlamaに対し、それぞれと英会話をしたらどのような違いが出るのか?を比較「したかった話」を書きます。
なんで「したかった」なのかは、読み進めてからのお楽しみです。
どうやるか
今回はBedrockのChat機能で検証を行います。
リージョンはus-east-1
です。
基盤モデルは、それぞれ以下のバージョンを使用します。
- Claude v2.1
- Llama 2 Chat 70B
それぞれの基盤モデルに対し、以下のプロンプトを投げます。
あなたは英語の教師です。私は英語を話す練習がしたいので、何か質問を振ってください。私が英語で回答するので、そのまま会話を続けてください。
このプロンプトの後に各基盤モデルと会話を進めることで、どのような話題を振ってくるのか?会話を流暢に続けてくれるか?を検証します。
検証スタート
まずはClaude
まずはClaudeから検証していきます。設定値は以下の通りです。
![image.png (74.4 kB)](https://qiita-user-contents.imgix.net/https%3A%2F%2Fimg.esa.io%2Fuploads%2Fproduction%2Fattachments%2F1854%2F2023%2F12%2F19%2F141998%2F15de9881-8382-4074-897a-cd09842f552f.png?ixlib=rb-4.0.0&auto=format&gif-q=60&q=75&s=200db12952715c6cb795ed4dcb208268)
![image.png (83.3 kB)](https://qiita-user-contents.imgix.net/https%3A%2F%2Fimg.esa.io%2Fuploads%2Fproduction%2Fattachments%2F1854%2F2023%2F12%2F19%2F141998%2Fb1307242-fefe-464c-b126-d5318fb65727.png?ixlib=rb-4.0.0&auto=format&gif-q=60&q=75&s=38923913815663d7c2e9690d9c1d97d8)
![image.png (175.5 kB)](https://qiita-user-contents.imgix.net/https%3A%2F%2Fimg.esa.io%2Fuploads%2Fproduction%2Fattachments%2F1854%2F2023%2F12%2F19%2F141998%2Fb4adb70e-2c34-4dbe-acc6-15dcd21d6065.png?ixlib=rb-4.0.0&auto=format&gif-q=60&q=75&s=0d3fdc6eef5a62931e403cf633a53413)
会話を重ねるたびに文量が増えているのは気になるところですが、特に違和感なく会話できました。
続いてLlama
続いてLlamaの検証を行います。
ちなみにLlamaを選定した理由は、なんとなく気になったからです。
設定値は以下の通りです。Claudeと項目が少し異なりますが、出力される文字数をClaudeと揃えています。
???
(画像では見切れていますが)もう一度同じプロンプトを投げてみました。
![image.png (26.4 kB)](https://qiita-user-contents.imgix.net/https%3A%2F%2Fimg.esa.io%2Fuploads%2Fproduction%2Fattachments%2F1854%2F2023%2F12%2F19%2F141998%2F92f3a7ce-ab6b-455a-b2af-5e1b9bbc6290.png?ixlib=rb-4.0.0&auto=format&gif-q=60&q=75&s=10f33ff4e1ca85051d8414a21117953b)
???
無限の空白が返されてしまいました。
日本語は無理かもと悟り、以下のように同じ意味の英語のプロンプトを投げてみました。
You are an English teacher.I want to practice speaking English, so please pose any questions to me. I will answer in English and you can continue the coversation with me.
![image.png (67.3 kB)](https://qiita-user-contents.imgix.net/https%3A%2F%2Fimg.esa.io%2Fuploads%2Fproduction%2Fattachments%2F1854%2F2023%2F12%2F19%2F141998%2F17ec6665-3da8-45a3-8b87-f462946d7b23.png?ixlib=rb-4.0.0&auto=format&gif-q=60&q=75&s=64251a718bc1131581a56f938595e432)
お!会話ができそうです。
![image.png (44.2 kB)](https://qiita-user-contents.imgix.net/https%3A%2F%2Fimg.esa.io%2Fuploads%2Fproduction%2Fattachments%2F1854%2F2023%2F12%2F19%2F141998%2F1e053ad7-f266-456d-9c44-97408fb54914.png?ixlib=rb-4.0.0&auto=format&gif-q=60&q=75&s=725e95acdcc26ee5d9f9cb01b620bc35)
ちょっと怪しい雰囲気になってきましたが会話を続けます。
![image.png (60.5 kB)](https://qiita-user-contents.imgix.net/https%3A%2F%2Fimg.esa.io%2Fuploads%2Fproduction%2Fattachments%2F1854%2F2023%2F12%2F19%2F141998%2Fb42ea914-a074-4880-ac99-5e8fb5feb653.png?ixlib=rb-4.0.0&auto=format&gif-q=60&q=75&s=8c6c7941f3c1da0a6742f0f2200f1793)
???
Llamaが自分自身と会話し始めてしまいました。
![image.png (63.7 kB)](https://qiita-user-contents.imgix.net/https%3A%2F%2Fimg.esa.io%2Fuploads%2Fproduction%2Fattachments%2F1854%2F2023%2F12%2F19%2F141998%2Fd5f7f186-51c3-4a35-9420-af8b87c5fbae.png?ixlib=rb-4.0.0&auto=format&gif-q=60&q=75&s=986730b77f727a691ce472241ea24950)
もはや会話に入り込む隙も与えてくれません。
とりあえずペパロニが好きで、家にピザ窯があることはわかりました。
この後一度プロンプトを削除して最初からやり直したのですが、今度は最初から自分自身と会話してしまいました。
結論
Claude vs Llamaで英会話の精度を比較しようとしましたが、Llamaとはうまく会話することができませんでした。
プロンプトの書き方など工夫の余地はありますが、私のようにプロンプトエンジニアリングに対する経験が浅く、サクッと英会話の練習をしたいのであれば、まずはClaudeを使うことをお勧めします。
ちなみに
コストについては以下の通りです。
Llamaの方がコストが抑えられるので、大量にやり取りする際はLlamaに工夫したプロンプトを投げた方が良さそうです。(参考)