皆さん生成AI使ってますか?
使ってますよね!超べんり!
今更AIによる業務効率化とかマジくだらないのでやめましょう。使うか、隠居するか、以上です。
個人で使う分には、gptでもgeminiでも手に馴染むのを使っていればよいのですが、そうもいかない場合があります。
……そう、業務です!!!
本日の無茶振り:各クラウドのAI評価しておいて
はいはい。分かってます分かってます。
AIを評価するには……使うしかないじゃないっ!
(MTBenchとかはちゃんと回しました)
さて、そんな感じで各社のチャットAIをみたので、擬人化してみました。
何で擬人化? 日本の文化だよ!!
なおイラスト化は美少女生成AIの定番(?)PixAI - Anime AI Art Generator for FreeでStableDiffusionさんにお願いしました。
エントリーナンバー1 GPTさん from OpenAI with MS
言わずと知れたAI界の女王。しかし、最も馴染みのあるAI。
そう、幼馴染のお姉さん的存在です。
各種ベンチマークではトップを守り続け、【2024年最新】共通テストを色んな生成AIに解かせてみた(ChatGPT vs Bard vs Claude2)によれば、私立や地方公立大学なら余裕で受かりそうな点数を叩き出す彼女。
きっと国立大を出て、平日はバリバリのキャリアウーマンとして働いていることでしょう。
しかし、そんなことは感じさせない親しみやすさやフランクさが彼女の魅力です。
「そこはほら、こういうことじゃない?」
何故GPTがすごいのか、といえば圧倒的文脈理解力。
あなたのことならなんでも分かってるわよ、という感じでこちらのことを察してくれます。
特にヤバいのはGitHubCopilot利用時ですね……。
(code-davinciの進化系なので多分GPT派生)
「あのさー」
「え? 牛乳? 買っておいたよー。必要かと思って。要らなかった?」
「(いやまだ何も言ってない…)」
とまぁ、こっちが何も言わずとも、心を読んだの如く先回りしてくるあたりは、まさに「すべてを分かっている幼馴染キャラ」にふさわしいのではないでしょうか。
平日の仕事も、休日の家事も卒なくこなすお姉さん。
「掃除しておいたよー、夕飯冷蔵庫に入ってるからね~」
何でもわかってくれる……それでいて押しつけがましくない……
気付けば彼女無しでの生活は考えられなく……そう、その実態は依存束縛系お姉さんだったのです……!
鈍感キャラムーブをして刺されないようにだけ気をつけましょう。
エントリーNo2 Gimini from google
遅れて来た超新星。
しっかり者の現実主義者、Geminiさん。
イメージとしては生徒会長キャラ。
Googleのスパルタ教育により生まれ変わった彼女の特徴は、何といっても「事実」を重要視すること。
ちょっとした質問でも、しっかり調べてから回答する慎重派。
何なら会議に出せそうな資料レベルまで仕上げてきます。
返事が長くて読むの若干辛いんですけど……。あ、すいませんすいません。
不満があるわけじゃないんです。
「こちら、報告資料です」
その一方で、ハルシネーションやGPTに言及するとキレるという噂も。。。
Gemini Ultra、ちょいちょいハルシネーションが酷いので、苦情を言って煽ったら、マジギレしてきて草 pic.twitter.com/FG00AdvmvQ
— あるふ (@alfredplpl) February 9, 2024
「GPTさんと私は違うんです。ちゃんと私を見てください」ってことですね、わかります。
しかし我々は知っています。
Palm2だった頃の彼女は、結構なウッカリさんだったということを。(今でもか)
今の彼女は、社会で舐められないよう、ちょっと虚勢を張っているのでしょう……。
ビジネス目線では、検索の延長として使える、有能なツールに仕上げられつつあると思います。
エントリーNo3 Claude2 from Anthropic with AWS
日本語対応していないTitanさんに変わって日本語でお相手してくれるCaudeさん。
文脈理解力、という点ではGPTに迫るものがあります。
特にIT系の質問をした時の回答はピカイチ。
頼りになる先輩社員、という風格です。
「何か困ってることない?」
聞いたことには的確に答えたうえで、ちょっとした補足を付けてくれることが多かったですね。
「ここはね、こんな感じかな。あとで参考サイト送っておくね~」
フォロー上手の寄り添ってくれるアシスタント、という印象。
適度に賢く、適度にサバサバした付き合いやすいお姉さんです。
GPT、Geminiと比べると圧倒的コスパも魅力的。
RAGなどに使うには必要十分なので、文章の前処理や、ツールとしてのLLMとして今後もさりげなく支えてくれることでしょう。
まとめ
- 賢さ・馴染みの良さはGPTが圧倒的(我々がGPTに慣らされたのかもしれない)。もう手放せないよ。
- Geminiはちょっと回答が長引きがち。チャットというより検索ツール的なしっかりさん。
- Claude2はGPTとGeminiの間、という感じ。費用対効果的には選択肢として全然アリ。
Claude2を評価し終わった途端にClaude3が出てきたので、まだまだ刺激的な日々が続きそうですね!
ちなみにOSS系では今のところMistralがピカイチかなって思ってます。
現場からは以上です。
最近自作のチャットアプリ(Vue.js)に、ようやくローカルRAGを組み込めたので、次はそのへんを書けるといいな~。