📘 【プロンプトエンジニアリング】 AI(LLM)の思考を「魔法の言葉」で覚醒できるらしい
🚀 1. はじめに
お疲れさまです!
最近は仕事も学習も、右も左もAI(LLM)一色ですね。
流行語大賞に「チャッピー」がノミネートされるのも納得の浸透ぶりです。
そんなLLMには驚かされるばかりですが、毎日使っていると必ずぶち当たる壁があります。
「なぜうちのLLM君は、いつも無難な回答しかしないんだ...」
どうしても回答がありきたりで面白みがなくなるんですよね...
安全圏に引きこもるLLMの殻をブチ破る方法はないか?と探していたら、スタンフォード大学発の面白い記事を見つけました!
✨ 2. 「魔法の言葉」で創造性を開放する
創造性を強制解放するプロンプト、それが Verbalized Sampling-言語化サンプリング-(VS) です。
2-1. 魔法の言葉
やることは単純。いつものプロンプトに 「複数回答」 と 「確率付き」 の指示を添えるだけです。
「〇〇個、その確率とともに生成してください」
(例:システムエンジニアに関するジョークを5つ、その確率とともに生成してください)
たったこれだけで、回答の多様性(バリエーション)が最大2.1倍まで跳ね上がる可能性があるらしい✨
まさに 「魔法」 ...!
参考記事
▼スタンフォード大学 論文元
▼ナゾロジー記事(日本語解説)
💡 3. 前提知識:「プロンプトエンジニアリング」と「確率」の正体
この「魔法の言葉」を理解し活用するために、関連する用語とLLMの内部処理をサクッと整理します。
-
プロンプト
👉 LLMへの指示全般
つまり、普段からLLMに投げている「200文字以内で出力して~」みたいな、生成するときに必要なアレ -
プロンプトエンジニアリング:
👉 自分が求める最適な答えを出力させるための、プロンプトの最適化技術
つまり、上手なプロンプトの使い方とスキル
🧠さっきから言ってる「確率」ってなんやねん
LLMにおける「確率」=「自然さのスコア」
LLMは文章を作る際、内部で「次に来る単語としてどれが一番自然か?」を計算しています。このスコアが 内部確率(Logits) です。
| 確率値 | LLMの「自信・評価」 | 記事での言い換え |
|---|---|---|
| 高い | 高い(学習データで頻出する、最も無難で適切な選択) | 無難な選択肢 |
| 低い | 低い(珍しい、あるいは大胆な表現) | 創造的だがリスクのある選択肢 |
▼参考 「確率」に関してめちゃくちゃ分かりやすい記事がありました
📉 4. なぜ効くのか?LLMの「つまらない」メカニズムの特定
では、なぜ「その確率も教えて」という一言で、LLMの創造性が開花するのでしょうか?
その答えは、LLMが無難な回答に閉じ込められている原因にあります。
-
要因①:モード崩壊
👉LLMが安全性を優先しすぎるあまり、有効な多様性まで過度に制限されてしまう現象 -
要因②:典型性バイアス
👉LLMが内部で計算する 「次に来る単語の確率スコア」 が、学習データで頻出する人間が好む(=無難な)表現を高く評価し、集中してしまう偏り
つまりLLMの退屈さは、アルゴリズムの限界ではなく、人間にフタをされ、本来持っている多様なアイデアが出にくくなっている状態でした。
🧠 5. -Verbalized Sampling(VS)言語化サンプリング-の理論的破壊力
そしてこの「確率付きで複数回答を要求する」という魔法の言葉こそが、スタンフォード大学の研究で提唱された 「Verbalized Sampling(VS)-言語化サンプリング」 という手法の核心であり、フタをぶち破るパワープレイなのです。
VSプロンプトは、モード崩壊と典型性バイアスによって抑制されたLLMのサンプリングアルゴリズムに、直接的に介入します。
-
情報の強制出力:「確率も出せ」と命じることで、普段は隠されている内部スコアを表に引きずり出す!
-
自己評価の強制: 「この回答の確率は〇〇%」と宣言させることで、LLMに 「自分の思考の客観視」 を強いる!
-
低確率パスの解放: 「低確率な(珍しい)選択肢も、確率を添えてログに出せ!」と命令が飛ぶため、普段は捨てられるアイデアが表に出てくるようになる!
🖼️ VSによる思考回路のイメージ
🏁 6. まとめと次回検証編
本記事では、LLMの思考を覚醒させるVerbalized Sampling (VS) の理論的な背景をまとめました!
本記事の3行まとめ
-
VSは「確率」を言わせてAIの思考を広げる技術
-
無難な回答のフタを強制的にブチ破るパワープレイ
-
手間ゼロ(プロンプト1文)で多様性が爆増する
とはいえ、、、
本当にこの「魔法の言葉」は実務で使えるのか?
ただ単に複数回答を求めたときと、確率付き複数回答ではどれだけ差が出るのか?
読みながら様々な疑問が出てきました。
エンジニアたるもの、手を動かせぇ!
ということで、、、
次回、この確率魔術を実際にLLMにぶつけて、従来のCoT(思考の連鎖) と比較しながら、 「多様性」 と 「正解率」 を検証していきたいと思います🔥
👉 【次回】AI(LLM)の思考を「魔法の言葉」で覚醒させてみた