はじめに
昨今のプログラマーのお供といえば、AIチャットだと思います。
有名どころはやっぱりChatGPTですが、先日 「Mistral Large」 というモデルが話題になっていました。
GPT-4に次ぐ性能? LLM「Mistral Large」が登場 Azureでも利用可能:多言語対応、文化的背景理解に強み - @IT
あまり良くわかっていませんが、とりあえずベンチマークとしては
- ChatGPT 3.5:70.0%
- Mistral Large:81.2%
- ChatGPT 4:86.4%
ということで、かなり強そう。
(そもそもこれ何のベンチマークなんだろう・・。)
そこで、しばらくそちらのモデルを使ってみてわかったことや感じたことを纏めておきます。
前提
どちらもブラウザ上で利用する。
大して小難しい事は聞かないので、プログラミングのお供としての使いやすさを評価する。
- ChatGPT 3.5
- Mistral Large(beta)
良く質問する内容:
- 「XXX」という意味の変数名を考えて
- 「XXX」これを訳してほしい
- XXの言語で、XXXという動きをするコードを書きたいときはどうしたら良い?
感想
結論
ChatGPTのほうが使いやすい。
けどMistralのほうが回答が好み・・。
理由
プロンプトを設定出来る
ChatGPTではプロンプトを設定しておくことが出来ます。
画面左下の自分のアカウントをクリック > ChatGPTをカスタマイズする
これによって、どのチャットでも一律で適用される前提を設定出来ます。
この機能がMistralだとないので、別のチャットで伝えたことが他のチャットだと反映されなかったりすることがしばしばあります。
例)日本語で回答してほしいと伝えてあるのに、英語で回答される。
キャメルケースが好みなのにスネークケースで回答される。
特に英語で回答されるのはそこそこ回数が多い上に、やり直しが必要になるのでちょっと面倒・・。
回答の生成速度がChatGPTのほうが早い
調べていて気付いたのですが、そもそもMistral Largeはまだ日本語に正式対応していない・・?
そのためなのかわかりませんが、日本語の文章を出力する速度が少し遅いです。
ちょっと遅いな、と思う程度で実用に不便があるわけではないのですが、減点は減点!
回答の内容は少しだけ特色あり
上にも書いた通り、普段大して小難しい内容を聞いていません。
なので、「Mistral Largeじゃないとこんな回答出せねえぜ・・!」みたいな経験はほぼありません。
(これはChatGPTでは無理だったかもしれない)
ただ、改めてChatGPTを使ってみて思ったのは、多少それぞれの特色がありました。
ChatGPT
- ユーザーの意見がかなり尊重される
- 問題ない場合に、他の案を出してくれない
Mistral
- 割とユーザーの意見は置いておいて、自分の意見を出してくれる
- 問題ない場合でも、他の案を出してくれる
なんかMistralは新進気鋭でズケズケ物言う若者で、ChatGPTがだいぶ世渡りこなれてきてしまった中年に見えてきた。
おわりに
使い勝手の面では敗れてしまったMistralですが、こちらのサイト現在beta版とのことです。
なので、まだまだ伸びしろはたっぷり・・!
今後も時折確認してみようと思います。
おまけ
いくつかの質問と回答を比較してみました。