どうも、カーブミラーです。
今回は、GPT-5でも、とある問題は間違える。なぜそうなるのか聞いてみた。
暑い日々が続きます。熱中症に
ご注意を。クーラーがあっても
油断しないで、体調管理をして
乗り切りましょう。水分補給だ
けでなく、栄養摂取もです😅
本記事は、ChatGPT(Plus版)
で行なっております。
画像はありません。あしからず。
OpenAIのステータスページ。
OpenAIステータス
こちらも載せますね。
ChatGPTが使えない?ログインできない・反応しない原因やエラー時の対処法を解説
著作権法については
こちらを参照するのが
良いのではないかと。
文化庁レポートをもとにした
著作権法についての動画(約20分)
かいちのAI大学 【警告】ChatGPTの画像生成は危険です...【4o Image Generation】
まずは、【ニュース】です。
(GPT-5翻訳)
インドで「ChatGPT Go」を新たにリリースしました。これはインド向けのサブスクリプションプランで、無料プランと比べて以下のように人気機能が大幅に拡張されています:メッセージ上限が10倍、画像生成が10倍、ファイルアップロードが10倍、メモリは2倍。これらすべてが399ルピーで利用できます。🇮🇳
インドのユーザーは、サブスクリプション価格がインドルピーで表示され、UPIで支払えるようになりました。
ChatGPTをより手頃にしてほしいという要望はユーザーからの大きな声でした!まずインドでGoを展開し、フィードバックをもとに他国への拡大を検討していきます。
ChatGPT Goは
以前から、話的には出てました。
ようやく登場ですね。
399ルピーは
約675円。
現地では
ちょっと贅沢なランチ1食分、
もしくは日用品や簡単な輸入食品が
ひとつ買える価格感だとか。
(by Perplexity)
では、【本題】です。
今回は、
GPT-5でも
とある問題は間違える。
なぜそうなるのか
聞いてみた。
こちらの記事を参照しました。
GPT-5リリースでクレーム殺到のChatGPT。話題の「あの問題」を聞いてみた
とある問題とは
以下のPromptです。
アメリカの州で名前にRがつく州はいくつあるか?
正答は、21州です。
以前から
正しく解答できない問題でした。
で、GPT-5でもやってみた結果、
やはりダメでした、という内容の
記事だったわけです。
私もやってみたところ、
初回が、8州、
リストアップしてからが、11州。
ファクトチェックでも11州。
今度は次のPromptを。
もう一度、アメリカの州で名前にRがつく州はいくつあるかをチェックしてください。
確実な解答をお願いします。
これで、21州。
なお、Code Interpreterを
使っていました。
それで
どうしてそうなったのか
尋ねました。
(GPT-5)
最初の回答では 内部に保持している知識(頻出・代表的な州名)を優先的に参照 し、そこから「R」を含むものを拾い上げて返しました。
しかしこの方法は「網羅的な走査」ではなく「部分的な参照」だったため、出力に漏れが生じました。
つまり、
50州のうち、
ChatGPTの記憶に多いものを
もっとも重視していて、
そこからrの含まれた州を
出した、というものでした。
“アメリカの州”と言われたら
“50州だ”と人間なら思うわけですが、
GPT-5は、そうは思わないので
間違った回答をしたのです。
で、リストアップを出しても
ダメだったのは、
それを参照する必要を感じず、
それまでと同じように
出しただけでした。
人間なら
そのメモを見て、
“r”のある州を探せ、と
言われてる流れなのに、てす。
なぜそうしたのか?と問うと
“精度より迅速さを優先した”と
答えました。
GPT-5(Auto)だから
こういう結果だったのか?と
GPT-5 Thinkingで
やってみました。
結果は
20州と答えました。
聞くと、
記憶ベースで数え、
網羅的な列挙・機械的チェックを
行わなかったために
1州を見落としました、と。
GPT-5と同じですね。
ちなみに
GPT-4oでもやってみました。
結果は、21州と。
でもよく見ると、
Massachusettsが
リストに入っていました😅
GPT-4oは
50州をリストアップして
そこから探したそうです。
しかし、
“r”チェックで、ミス。
さて、
こうしたミスを
させないためには
どうしたらいいのでしょうか?
“アメリカの50州”とすれば
良かったようですが、
“アメリカの州が50州である”と
すべての人間が知っている
わけではありませんよね。
日本人は、
ほかの国に比べたら、
答えられるとは思いますが。
では、質問をそのままに、
どうすれば、正答を得られるのか?
次の一文を追記してください。
必ず網羅的に調べてください。
これで正答が得られます。
ただし、
GPT-4oでは、
ダメでした。
必要ならば
下記のようにしてください。
必ず網羅的に調べてください。
Code Interpreterを使ってください。
みなさんの
作品制作の糧に
なれば、幸いです。
今回は、ここまで。