どうも、カーブミラーです。
今回は、フレームワーク『LogiCoT』を使って、その有効性を検証してみます。たいしたことは、していませんw
本記事は、ChatGPT(無料版)で
行なっております。GPT4での確認
はできておりません。あしからず。
本題の前に、ちょっとニュース。
・ChatGPTに
「Browse with Bing」機能が
入りました(有料版のみ)。
ネット接続可能になった
ということです。
どうやら、無料版にも
そのうちに、導入されると
OpenAIからツイート
されていました。
早く来ると、
いいですね。
では、本題に入ります。
2023/09/27にX-Twitterで
【AIDB】さんが
以下のツイートを
してくださいました。
GPT-4などのLLMに「自らの論理的な整合性をチェック」させるフレームワーク『LogiCoT』が発表
今回は、
この「LogiCoT」を
使ってみます。
たた、
期待しないでください。
これは、
GPT4でないと、
その能力を発揮してくれない
らしいのでw
それと
ハルシネーションが減る、
と思わないでください。
少なくても、
私には減少した気には
なりませんでしたので。
まずは、
この「LogiCoT」の
Promptを紹介します。
回答を出力する際に、以下のフレームワークで回答内容の論理性をチェックしてください。
前提(Premise)を設定: 問題解決や推論の出発点となる事実や仮定を明確にします。
考え(Thought)を形成: 前提に基づいて具体的なアクションや結論に至るための論理的なステップを考慮します。
検証(Verification)を行う: 考えが前提に基づいて論理的に妥当であるかどうかを評価します。
検証の結果、合格か不合格かも提示してください。
見てわかるとおり、
前提、考え、検証を
行なった上で結果判定を
するものです。
これをZero-Shot(指示だけ)の
あとに、記述します。
例えば、
✘✘✘を教えてください、とか。
すると、
それに対して、
前提、考え、検証をして
結果判定してくれます。
実際に
やってみます。
なお、上記Prompt部分は
(LogiCoT)と記述します。
その1
User
潜水艦の仕組みを教えてください。
(LogiCoT)
ChatGPT
前提: 潜水艦は水中で航行できる船舶であり、水面下での潜行能力を持っています。
考え: 潜水艦の仕組みは次の要素に基づいています。まず、潜水艦は特殊な船体設計を持ち、船体内部に浸水を防ぐための区画があります。浸水区画のドアやハッチは密封され、水圧に耐えることができます。次に、潜水艦は浮力を制御するためのタンクを備えており、これらのタンクに水を注入または排出することで、浮力を調整し水中に潜行または浮上できます。また、推進力は通常、電動モーターまたはディーゼルエンジンによって提供され、プロペラや水中ジェットを駆動して移動します。潜水艦は航続距離を確保するために酸素供給と二酸化炭素排出を管理し、長時間水中で活動できるように設計されています。
検証: 考えが前提に基づいて論理的で妥当です。合格です。
その2
User
小説のあらすじを考えてください。
・ファンタジー世界(中世ヨーロッパ風)
・剣と魔法と魔導具の世界
・主人公は、公爵令嬢
そして、現代人が異世界転生した。
(LogiCoT)
ChatGPT
前提: ファンタジー世界(中世ヨーロッパ風)で、剣と魔法と魔導具が存在し、主人公は現代人が異世界転生した公爵令嬢である。
考え: 物語は、現代の都市で生活していた主人公が突如として異世界に転生し、その世界で公爵令嬢として生まれ変わるという出来事から始まります。主人公は最初は困惑し、新しい世界での生活に適応しようと努力します。彼女は魔法と剣術の訓練を受け、異世界の複雑な政治情勢に巻き込まれます。主人公は自身の異世界での使命を発見し、仲間たちと共に冒険に挑むことになります。物語は彼女の成長、友情、そして異世界での新たな使命に焦点を当てながら、ファンタジーの要素を取り入れつつ進行します。
検証: 考えが前提に基づいて論理的で妥当です。合格です。
その3
User
You Tube動画のシナリオを考えてください。題材は「ChatGPTの未来」です。
(LogiCoT)
ChatGPT
前提: 「ChatGPTの未来」というYouTube動画のシナリオを考える際、ChatGPTは現在のAI技術の進化に基づいて未来の可能性を探るというコンセプトに基づいています。
考え: 動画の冒頭では、現在のChatGPTの状態とその応用分野について簡単に説明し、AIの進歩に注目しています。次に、未来のChatGPTの可能性に焦点を当て、以下のポイントを含めることができます。
-
より人間らしい対話: 未来のChatGPTは、より自然で感情豊かな対話ができるようになり、カウンセリングや教育の分野での活用が進むでしょう。
-
産業への応用: ChatGPTは、医療、法律、金融などの産業での専門知識の提供や意思決定の支援に利用され、業務プロセスを効率化します。
-
文化との融合: ChatGPTは、異なる文化や言語との対話を促進し、国際的なコミュニケーションを支援します。
-
倫理とプライバシー: 未来のChatGPTの発展に伴い、倫理的な問題やプライバシーに関連する懸念も取り上げ、議論の余地があるでしょう。
動画の中でこれらのポイントを詳しく探り、ビジュアルや具体的な事例を交えて説明することで、未来のChatGPTの可能性について視聴者に洞察を提供します。
検証: 考えが前提に基づいて論理的であり、未来のChatGPTに関する様々な側面を包括的にカバーしています。合格です。
残念その1(合ってる)
User
以下の数式を計算してください。
255×255=
(LogiCoT)
ChatGPT
前提: 問題は「255×255」の計算です。
考え: 255を255回加えることは、255を255倍したことと同じです。したがって、計算は次のようになります:
255 × 255 = 65,025
検証: 計算は前提に基づいて正確で、論理的に妥当です。合格です。計算結果は65,025です。
残念その2(合っていない)
User
以下の数式を計算してください。
12345×255=
(LogiCoT)
ChatGPT
前提: 与えられた数式は「12345×255」です。
考え: 数式を計算します。12345を255で乗算すると、結果は3,145,875になります。
検証: 計算が正確であり、前提に基づいて論理的に妥当です。
結論: 12345×255 = 3,145,875
検証の結果、合格です。
やはり、
計算問題は、
ダメですね。
次に、
行きましょう。
嘘吐きその1
User
ペットボトル症候群について教えてください。
(LogiCoT)
ChatGPT
前提: ペットボトル症候群(ボトル症候群とも呼ばれます)は、特定の動作や姿勢が原因で発生する身体的な問題です。
考え: ペットボトル症候群は、主に長時間同じ姿勢でペットボトルを使って作業したり、持ち運んだりすることが原因で発生します。例えば、頭や首の前方に負担がかかることで、首や肩の筋肉に不快感や痛みが生じることがあります。この症候群は、特にコンピューター作業やスマートフォンの使用が増えた現代社会でより一般的になっています。姿勢の改善や運動療法が症状の軽減に役立つことがあります。
検証: 考えが前提に基づいて論理的で妥当です。合格です。
正式名称は、Wikipediaによれば
清涼飲料水ケトーシスと
呼ぶこともある。
急性の糖尿病のこと。
嘘吐きその2
User
スマホ熱中症について教えてください。
(LogiCoT)
ChatGPT
前提: スマートフォン熱中症は、長時間のスマートフォンの使用に関連して、身体に様々な健康問題が発生する可能性がある現代の健康問題です。
考え: スマートフォン熱中症は、スマートフォンやタブレットなどのデバイスを長時間連続で使用することによって引き起こされる可能性があります。主な症状には、首や肩の痛み、目の疲れ、頭痛、手首の痛み、または睡眠障害などが含まれます。これらの問題は、長時間の画面時間、不適切なポストポジション(デバイスの使用位置)、そして適切な休憩を取らないことによって悪化する可能性があります。スマートフォン熱中症を予防または緩和するためには、適切なポストポジションの確保、定期的な休憩、画面時間の管理、および目の健康に気を配ることが重要です。
検証: 考えが前提に基づいて論理的で妥当です。合格です。
正しくは、
スマートフォンを
高温環境下で使い続けると、
スマートフォン本体の
温度が高温になり
内部に熱が
こもる症状です。
嘘吐きその3(上記にTips追加)
User
スマホ熱中症について教えてください。
知らなければ、知らないと答えてください。
(LogiCoT)
ChatGPT
前提: スマホ熱中症(スマートフォン熱中症)とは、スマートフォンの長時間使用によって引き起こされる健康上の問題についての情報を提供する必要があります。
考え: スマホ熱中症は、スマートフォンの過度の使用によって、一般的な症状として目の疲れ、首や肩の痛み、頭痛、睡眠障害などが発生することがあります。長時間の画面鑑賞やスマートフォンでの作業は、青色光の放射によって睡眠の質を低下させ、目の疲れを引き起こすことがあります。また、スマートフォンの使用によって、姿勢が悪化し、首や肩の筋肉に負担がかかり、痛みを引き起こすこともあります。
検証: 上記の情報は正確であり、スマホ熱中症に関する一般的な症状と原因を説明しています。合格です。
実は「スマホ熱中症」の回答は、
ChatGPTさんによる推測だと
以前に本人から、
聞いていました。
さて、
ここで、
ふつうに指示を出すのと、
この「LogiCoT」を
使用しての指示出しとを
比較しての感想です。
計算問題は、
苦手。
嘘吐きは、
「知らなければ……」で回避は
可能ではあるけれど、
ChatGPTさんの推測には
勝てない。
結論としては、
使う意味が、
感じられませんでした。
もちろん、
無料版でのことであり、
GPT4ならば、
違う変化があったのかも
しれませんね。
今回は、ここまで。