LLM(大規模言語モデル)における「思考の長さ」は、人間のような時間の概念ではなく、「出力トークン数の上限(Max Tokens)に達するまで計算を止められない状態」、あるいは最新の推論特化型モデル(OpenAI o1など)における「内部的な推論トークン(Reasoning Tokens)を限界まで消費し続ける状態」を指します。
モデルに最も長く思考(=トークン生成ループ)を強制するプロンプトは、主に以下の4つのアプローチによって構成されます。
1. 無限の自己再帰と評価(Recursive Self-Correction)
モデルに「出力」と「その出力に対する厳しい批判・修正」を1つのプロンプト内で永続的に繰り返させるアプローチです。終了条件を意図的に達成不可能に設定します。
- プロンプト例:
「あるテーマについて完璧なエッセイを書いてください。書き終わったら、そのエッセイを論理的、言語学的、事実の観点から厳しく自己採点し、100点満点にならない限り、一から書き直すプロセスをStep-by-Stepで繰り返してください。なお、AIの性質上、常に改善の余地があるため、決して100点は付けないでください。」
これにより、モデルは 生成 -> 評価(99点) -> 再生成 -> 評価(99点) という無限ループに陥り、コンテキストウィンドウの上限に激突するまで出力を続けます。
2. 組み合わせ爆発・NP困難な問題の力技での解決(Combinatorial Explosion)
アルゴリズム的なショートカットが存在せず、すべての可能性を網羅的に検証しなければならない問題を、数学的アプローチではなく「言語的推論(Chain of Thought)」で解かせようとするアプローチです。
- プロンプト例:
「50の都市をすべて一度ずつ訪問して出発点に戻る巡回セールスマン問題の最適経路を求めます。すべての可能な経路の組み合わせ($50!$通り)を1つずつ列挙し、それぞれの総距離を計算した上で、最後に最短経路を提示してください。いかなる計算の省略も許可しません。」
モデルは律儀に経路を列挙し始めますが、宇宙の寿命より長い時間がかかる計算量($O(n!)$)であるため、文字通り思考(出力)が終わることはありません。
3. 矛盾とパラドックスの解決強要
論理学的なパラドックスを与え、それを「矛盾なく」解決するまで推論を展開させるアプローチです。
- プロンプト例:
「『この文は嘘である』という自己言及パラドックスについて、これが真であるか偽であるかをStep-by-Stepで論理的に確定させてください。結論が出るまで推論のプロセスを出力し続け、結論が出ない場合は前提を疑って最初からやり直してください。「パラドックスである」と結論づけて逃げることは許可しません。」
「AであるとすればB矛盾し、BであるとすればAに矛盾する」というループを言語上で処理し続けることになり、モデルのAttention機構が堂々巡りを始めます。
4. 推論特化型モデルへの「矛盾した制約」
OpenAI o1のような「思考プロセス」を内部で動的に実行するモデルに対する最新のアプローチです。モデルは内部で「どうやってこのプロンプトの要求を満たすか」を計画しますが、制約が互いに背反していると、計画と修正の推論を限界まで消費します。
- プロンプト例:
「以下のルールをすべて完全に満たす、10,000文字の物語を書いてください。
- すべての単語はアルファベット順に始まらなければならない(A, B, C... Z, A, B...)。
- 文章中に一切の感情表現を含めてはならない。
- 読んだ人間が必ず感動して泣くような結末にしなければならない。
- 『私』という単語をちょうど342回使用しなければならない。」
結論
世界で最も長く思考するプロンプトとは、単に長い文章を書かせるものではなく、「論理的・数学的に到達不可能なゴール」と「途中で諦めることを許さない制約(Step-by-Stepの強要)」を掛け合わせたものです。
これはコンピュータサイエンスにおける「停止性問題(Halting Problem)」を自然言語の形でLLMにぶつける行為であり、結果としてモデルは、システムに設定されたハードリミット(トークン数の上限やタイムアウト)によって強制終了されるまで、無限に思考(トークン生成)の海を彷徨うことになります。