1. はじめに
AIに質問すると、すぐに答えが返ってきます。しかし、その答えが本当に正しいか、どうやって導かれたのかが分からないことも多いです。そこで役立つのが CoT(Chain of Thought) と CoV(Chain of Validation) です。CoTは「答えを出す前に推論過程を明示させる」手法で、複雑な問題の精度を高めます。一方、CoVは「出した答えを別ステップで検証させる」手法で、誤りや思い込みを減らします。本記事では、この2つの基本から、初心者でも試せるプロンプト例、さらに精度を上げるための組み合わせ方までを解説します。
- 本記事はCopilot向けに書いていますが、 ChatGPT でも基本概念は同じです
- 基本Copilotに直接聞いてまとめたメモです。参考になれば幸いです
2. 思考過程(Chain of Thought)とは
CoT(チェイン・オブ・ソート)は、AIに答えを出させる前に 考える過程を文章として書かせるプロンプト手法 です。人間が紙に計算や論理の手順を書き出すように、AIにもステップごとの推論を明示させます。これにより、複雑な計算や条件整理、論理推論の精度が向上し、途中のミスも発見しやすくなります。例えば「35個のチョコを15個あげて8個買い足したら?」という問題を、いきなり答えさせるのではなく、「35−15=20、20+8=28」と順を追って説明させるのがCoTです。
CoT適応なし
Q: 35個のチョコを持っていて15個あげ、8個買い足しました。今何個?
A: 22個
CoT適応例
Q: 35個のチョコを持っていて15個あげ、8個買い足しました。今何個?。計算過程を示してください。
A:
35 - 15 = 20
20 + 8 = 28
答え: 28個
3. 検証過程(Chain of Validation)とは
CoV(チェイン・オブ・バリデーション)は、AIが出した答えを別のステップで 自分自身に検証させるプロンプト手法 です。人間がレポートを書いた後に見直しや再計算を行うように、AIにも「この答えは正しいか?根拠とともに確認して」と指示します。これにより、計算ミスや事実誤認、思い込みによる誤答を減らせます。検証時は、単に「正しいか」だけでなく「別の方法で再確認」や「根拠を明示」させると効果的です。CoTと組み合わせることで、推論の質と信頼性を同時に高められます。
Step1: 問題を解く(CoT)
Step2: 「この答えに誤りがないか、根拠とともに検証してください」(CoV)
4. CoT + CoV を組み合わせるメリット
CoTは「AIに考える過程を順番に書かせる」ことで、複雑な問題でも途中の計算や論理を明確にし、精度を高めます。 CoVは「出した答えを別ステップで検証させる」ことで、計算ミスや思い込みによる誤答を減らします。
この2つを組み合わせると、
1. 推論の質が向上 (CoTで手順が明確になる)
2. 信頼性が向上 (CoVで誤りを発見・修正できる)
3. 説明可能性が高まる (過程と検証結果が残る)
つまり「正確で根拠のある答え」を得やすくなり、安心してAIの結果を活用できます。
5. 注意点とデメリット
- 単純な質問には不向き(冗長になる可能性あり)
- 処理時間やコストが増加する場合がある
- 思考プロセスが誤っている可能性もあるため、批判的検証が必要
6. CoT + CoV を組み合わせたテンプレート
下記テンプレートは、CoT + CoV を組み合わせたハイブリッド型になります。
- 1ステップごとに確認しながら実行します
- Q2~Q7はテンプレートそのままで送信する
- 一度に全部送るのではなく、Q1→回答→Q2→回答…と進めると、AIが文脈を保持しやすくなります
6-1. 初期回答 CoT(出力)
- 下記のテンプレートの 〇〇〇〇〇 の部分に質問する内容を記入
- 情報の性質を分け、検証しやすくする
Q1: 〇〇〇〇〇 について、事実 / 推測 / 不明 を分けて教えてください(自信度も添えて)
6-2. 根拠・出典提示 CoV(検証)
- 出典の種類・日付・信頼理由を添えて裏付ける
Q2: 各要点の根拠と出典(一次 / 二次 / レビュー、発行日、信頼理由)を示してください
6-3. 別視点からの再説明 CoT+CoV(再生成+比較)
- 多角的に検討し、見落としや偏りを補う
Q3: 別の視点や方法で同じ質問に答え、Q1との違いを明示してください
6-4. ステップ分解 CoT(思考の可視化)
- 結論に至る道筋を透明化し、再現性を確保
Q4: 採用した結論に至るまでの推論過程を3〜5ステップで説明してください
6-5. 逆検証(反証要求) CoV(不確実性評価)
- 適用限界やリスクを明確にする
Q5: 間違っている可能性や例外条件、反例とその影響度を挙げてください
6-6. クロスチェック CoV(外部検証)
- 一致点/相違点とその理由を把握し、整合性を確認
Q6: 他の情報源やAIと比較し、相違点とその理由を要約してください
6-7. 要約と再確認 CoV(要約)
- 意思決定に使える形で簡潔にまとめる
Q7: 最も信頼できる結論を1〜2行でまとめ、適用範囲と自信度を添えてください
7. 回答における確認ポイント
この5つを順にチェックすれば、AIの回答が「考えた上で検証されているか」を短時間で判断できます。
7-1. 事実・推測・不明が明確に区別されているか
回答内で情報の性質が分けられ、自信度(高/中/低)が添えられているかを確認します。
7-2. 根拠と出典が具体的か
各要点に対応する情報源が明示され、出典の種類(一次/二次/レビュー)や発行日、信頼理由が書かれているかを見ます。
7-3. 別視点の回答が差分として示されているか
Q3の別視点回答が、Q1との違いを明確に示しているかを確認します。
7-4. 推論過程が論理的で再現可能か
Q4のステップが順序立てられ、Q1/Q2の材料だけで構成されているか、新情報が混ざっていないかをチェックします。
7-5. 例外や比較結果が結論に反映されているか
Q5の例外条件やQ6の比較結果が、Q7の最終結論に適切に反映され、適用範囲と自信度が明示されているかを確認します。
8. 異常が見つかったときの対応
ポイントは、「どこが」「なぜ」不十分かを具体的に伝えて再質問することです。そうすることで、AIの再回答がピンポイントに改善され、再現性と信頼性が高まります。
8-1. 該当箇所を特定する
どの質問(Q1〜Q7)のどの部分に問題があるのかを明確にします。
例:「Q2の根拠が出典不明」「Q4の推論に新情報が混入」など。
8-2. 不足情報を補うよう再質問する
AIに対して不足や不明点を具体的に指摘し、追加回答を求めます。
例:「Q2の出典に発行日と信頼理由を追加してください」
8-3. 条件や前提を再設定する
前提条件が曖昧だった場合は、地域・時期・対象などを明確にして再実行します。
8-4. 比較や検証を追加する
他の情報源や別視点での再回答を促し、差分や整合性を確認します。
8-5. 最終結論を更新する
修正・補足後の情報を反映し、Q7の結論を再度まとめ直します。
9. 実例
下記の実例は「富士山の高さ」について質問したものです。
Q1: 富士山の高さ について、事実 / 推測 / 不明 を分けて教えてください(自信度も添えて)
※500文字以内でまとめてください。
回答結果が長くなったため、「※500文字以内」という制約を付けています
<回答>
以下の通り整理します。
-
事実(自信度:高)
富士山の公式標高は 3,776m(国土地理院による剣ヶ峰の測量値は3,776.24m)。日本で最も高い山である。 -
推測(自信度:中)
長期的な地殻変動や火山活動により、標高は将来的にわずかに変化する可能性がある(国土地理院が再測量を予定)過去の測量法や基準点の違いにより、歴史的には3,778mや3,928mなど異なる値が記録された。 -
不明(自信度:低)
将来の具体的な標高変化量や時期。標高変化が観光や文化的価値に与える正確な影響。
このように、現在の高さは高精度で確定している一方、将来の変化やその影響は推測段階にとどまります。
Q2: 各要点の根拠と出典(一次 / 二次 / レビュー、発行日、信頼理由)を示してください
※500文字以内でまとめてください。
<回答>
-
富士山の公式標高3,776m(剣ヶ峰3,776.24m)
出典:国土地理院「日本の主な山岳標高」/一次/2021年更新/国の測量機関による高精度公式値。 -
日本最高峰
出典:国土地理院 全国標高データ/一次/2021年更新/全国標高を網羅管理する唯一の公的機関。 -
将来変化の可能性
出典:気象庁 火山活動・地殻変動情報/二次/継続更新/観測データと解析に基づく科学的推測。 -
過去の異なる標高値
出典:明治期測量記録・旧陸地測量部資料/一次/19〜20世紀初頭/当時の測量技術差異による一次史料。 -
将来の具体的変化量・時期は不明
出典:気象庁・学術レビュー論文/レビュー/複数年/火山活動・地殻変動は予測困難。 -
観光・文化的影響は不明
出典:富士山観変遷研究(2015年)、静岡県文化資料(2023年)/二次/社会的・主観的要因が大きく定量化困難。
Q3: 別の視点や方法で同じ質問に答え、Q1との違いを明示してください
※500文字以内でまとめてください。
<回答>
-
事実(自信度:高)
富士山の標高は国土地理院が水準測量と三角測量を組み合わせて決定(麓の三角点から高低角を測定し算出)。 -
推測(自信度:中)
観測技術の進歩(GNSS測位や衛星レーザー測距)により、将来は標高値の小数点以下精度や変動傾向がより明確になる可能性。 -
不明(自信度:低)
測定方法の変更が公式標高値に与える具体的影響や時期。
Q1との違い
Q1は「標高そのものの値と変化可能性」を中心に分類。
Q3は「標高がどう決められるか」という測定プロセス・技術的視点を軸に分類。
その結果、事実欄に測定手法、推測欄に技術進歩の影響、不明欄に測定方法変更の影響を配置し、焦点が「値」から「決定方法」に移っている。
Q4: 採用した結論に至るまでの推論過程を3〜5ステップで説明してください
※500文字以内でまとめてください。
<回答>
- 基本事実の確定: 国土地理院の公式標高と「日本最高峰」の記載を確認。
- 変動要因の抽出: 気象庁等の火山活動・地殻変動情報から将来変化の可能性を整理。
- 歴史・社会文脈の確認: 過去測量記録や文化資料から異なる値や影響論点を把握。
- エビデンス強度で分類: 一次=事実、観測に基づく一般論=推測、特定不能事項=不明に区分。
- 自信度の付与と整合性確認: 公的一次>二次>レビューの順で自信度を設定し、記述の整合を点検。
Q5: 間違っている可能性や例外条件、反例とその影響度を挙げてください
※500文字以内でまとめてください。
<回答>
以下に、富士山の高さに関する情報の誤りの可能性・例外条件・反例と影響度を整理します。
-
測量誤差: 測量機器や基準点の設定誤差により、公式値3,776mに±数cm程度の差異が生じる可能性(影響度:低)。
-
地殻変動・火山活動: 噴火や地震に伴う隆起・沈降で標高が変化する例(例:有珠山噴火後の標高変化)。富士山でも将来発生すれば数十cm〜数mの変化があり得る(影響度:中〜高)。
-
積雪・氷結: 冬季は積雪により実際の地表面が数m高く見えるが、公式標高には反映されない(影響度:低)。
-
測定基準の変更: 測地系や海面基準の改定により、同じ山でも標高値が変わる可能性(例:日本測地系→世界測地系移行時の補正)(影響度:中)。
-
観測不能時の推定値利用: 火山活動や天候で直接測量できない場合、推定値が使われ誤差が増す可能性(影響度:低〜中)。
Q6: 他の情報源やAIと比較し、相違点とその理由を要約してください
※500文字以内でまとめてください。
<回答>
他の情報源やAIでは、富士山の標高を3,776mとする点は一致していますが、近年の国土地理院発表では衛星測位導入に伴い三角点標高が約5cm高くなる改定予定が報じられています。一部AIや記事はこの改定を「富士山が高くなった」と表現する一方、私の回答では「測定基準や技術更新による値の修正」であり山体自体の変化ではないと明確化しました。相違の理由は、情報源によって「物理的変化」と「測定基準変更」を区別する精度や説明の深さが異なるためです。
Q7: 最も信頼できる結論を1〜2行でまとめ、適用範囲と自信度を添えてください
※500文字以内でまとめてください。
<回答>
-
結論: 富士山の公式標高は国土地理院による最新測量で3,776.24m(剣ヶ峰)と確定しており、日本最高峰である。
-
適用範囲: 現行の日本測地系(世界測地系に基づく)および国土地理院公表値に準拠した標高情報。
-
自信度:高(一次公的機関の最新公式データに基づくため、誤差は数cm程度に限定)。
10. さいごに
AIに考えさせる「CoT」と、その答えを検証する「CoV」は、精度と信頼性を高めるための強力な組み合わせです。最初は少し手間に感じるかもしれませんが、慣れるほどに再現性のある結果が得られ、安心してAIを活用できるようになります。本記事のテンプレートや手順を参考に、まずは小さな課題から試してみてください。積み重ねることで、AIとの対話がより深く、実用的なものになるはずです。
AIとの会話術は別記事にも整理しています。下記「記事まとめ」から、併せてご参照ください。
11.(参考)わかりやすい実例実験
9.では「富士山の高さ」について実例を挙げてみましたが、下表についても分かりやすいテーマを選定しました。試してみてください。
| テーマ | 理由 | 検証しやすいポイント |
|---|---|---|
| 今日の天気 | 情報源が明確で、比較が容易 | 気象庁・民間天気予報サイトとの比較 |
| 日本の首都 | 基本的な事実で、出典確認が簡単 | 歴史的経緯や例外(遷都論など) |
| 富士山の高さ | 数値が明確で、複数ソースで一致確認可能 | 単位や測定方法の違い |
| 世界で一番高い山 | 有名な事実だが、条件によって変わる(海底山含むか等) | 定義や例外条件の確認 |
| カレーの作り方 | 手順や材料が多様で、別視点比較がしやすい | 家庭料理とプロレシピの違い |
| 桜の開花時期(東京) | 年ごとに変動し、複数データ比較が可能 | 気象庁データとニュース記事の差異 |