0.そうだ、DeekpSeekR1対決させよう
- ChatGPT o1を蒸留した(と噂される)DeepSeek R1の32b版
- 更にそれを蒸留したDeepSeek-R1-Distill-Qwen-32B
- …に更に日本語を追加学習させたDeepSeek-R1-Distill-Qwen-32B-Japanese
オリジナルが提供されているのに、敢えて更にそれを蒸留した同サイズモデルの存在意義はあるのか、それぞれのモデルの振る舞いには一体どんな違いが発生するのか、その答えを求め、我々はアマゾンの奥地に飛んだ。
1.性能比較のためのプロンプトを作る
違いを知るためには違いが顕著にでそうな質問を作らねばならない。
…ということで先生、お願いします。
2.質問を投入してみる
deepseek-r1:32b
【質問1】
科学的な視点:
地形要因: 霧が発生する村周辺に山や谷などの地形がある場合、温度差や風の流れによって霧が形成される可能性があります。例えば、夜間の冷え込みで湿気がある地域では、低地に湿気が溜まり、朝方に霧として現れることがあります。
化学物質の放出: 村周辺に工場や農業での化学物質の使用が行われている場合、これらの物質が大気中で反応し、霧の中に微粒子として含まれることがあります。例えば、農薬や化学肥料の使用によって大気に影響を及ぼす可能性があります。
地熱活動: 村周辺に活火山や地熱区域がある場合、地熱から蒸気やガスが放出され、霧のような現象として観察される可能性があります。
伝統的な信仰の視点:
神様の訪れ: 霧は村の守り神が現れる際のサインとされ、霧が発生するたびに村人が儀式を行うことで神々の加護を受けると考えられています。
祭祀の力: 村人が行う伝統行事や祈祷が霧の発生を引き起こす力を持っていると考えられます。霧はこれらの行為に対する神様からの反応とされています。
自然崇拝: 霧は自然そのものの神秘的な力を表しており、村人は霧に宿る精霊や神々に敬意を払うことで災いを避け、豊作や健康を願っています。
【質問2】
村長として、霧の発生が村に与える影響を最小限にするためには以下のような対応策を考えます:
科学的な調査とモニタリング: 霧の原因や成分を科学的に分析し、自然現象か人為的要因かを明確化します。例えば、大気中の化学物質や地熱活動などの影響を測定し、データに基づいて対策を講じます。
予警システムの構築: 霧が発生する前兆やパターンを分析し、村人に事前に知らせ、健康被害や生活への影響を軽減します。例えば、霧発生時における外出自粛や呼吸器装備の使用を奨励します。
環境保護政策: 村周辺での化学物質の使用や工場排出を制限し、自然環境に負荷をかけないよう配慮します。また、地熱活動があれば安全な範囲内で管理する措置を講じます。
伝統行事と科学の融合: 伝統的な信仰を尊重しつつ、科学的な視点を導入し、村人が霧を理解できるように教育します。例えば、霧の科学的解説と伝統的故事を組み合わせた教材を作成します。
健康対策: 霧が人体に与える影響を研究し、特に呼吸器系や皮膚への被害を防ぐための措置を講じます。例えば、村に簡易的な検診施設を設置し、霧発生時に寛解対策を行います。
コミュニケーション強化: 村人との定期的な意見交換会を開き、霧に対する不安や疑問を共有し、科学的知識と伝統的な信仰の両面から理解を深めます。
これらの施策を通じて、村人の生活を守りつつ、自然現象と伝統的な文化を共存させます。
hf.co/grapevine-AI/DeepSeek-R1-Distill-Qwen-32B-Japanese-GGUF:Q4_K_M
【質問1】
科学的な視点での理由と根拠 :
地形による局地気象効果
山岳地域で谷風(昼間の下山風)と山風(夜間の上山風)が互いに干渉し、湿った空気が停滞。温度差により霧化現象が生じる(例:日本アルプスの「お鉢の雲」)。
火山性温泉の蒸発
地下のマグマ活動から出る地熱が周辺の地下水を加温し、沸騰した水蒸気が大気中に拡散。酸性ガス含有量が多い場合、白い「煙霧」に似た現象が発生(例:湯河原温泉)。
地質構造による塩類蒸散
石灰岩や頁岩の層で地中の塩分濃度が高い地域では、季節風が塩化物粒子を大気に放出。水分子が付着し核化して霧粒を形成(例:アムステルダム近郊の「Hailbogen」現象)。
伝統的な信仰視点での理由と根拠 :
自然神話による霊的解釈
霧が出現すると村人の祖霊が滝の上流に住む「山守り大神」と交信(例:長野県・木曽の「御霽神」信仰)。儀式で精米を捧げると霧が消え、豊作が約束される。
禁忌解除による気象操作
霧の発生前夜に若者同士で無音で山を巡り「神の耳」を閉じる(例:沖縄・大崎の「カミシイマサグリ」)。これにより霧が長時間持続し、旧来からの「天候祈願」が成立。
物質的代替信仰
雨乞い行事と霧発生が偶然重複したため、霧を「雨の前兆」と捉え「神明様への感謝祭」と解釈(例:新潟県・十日町の「白雲まつり」)。
【質問2】
村長としての対応策 :
科学的解明プログラムの導入
デジタル気象観測ネットワーク(例:Nikonの「FogScope」)で局地気流を可視化。
地下水サンプリング分析(ICP-MS法)で塩類源を特定し、自然災害リスクマップを作成。
伝統行事と現代科学の融合
霧出現時刻を「神様との契約時間」として定義しつつ、気象予報アプリ連動したスマートフォン通知システムを導入。
伝統舞踏にレーザー測距計を埋め込み、「霧の濃度と舞踏速度」の相関を研究(例:京都・鞍馬の「火祭り」)。
危機管理インフラ整備
霧発生時に自動点灯するソーラー式赤色LEDランタンを全家庭に配布。
伝統的「霧中道標」として使用される樹木(例:カシワバ)の葉裏に反射層加工を施す。
経済的価値創造
霧成分分析結果を基にした医療用霧化器開発(抗酸化物質含有量が高い場合)、霧発生地帯を「神聖な霧の回廊」として観光資源化。
この施策により、科学的不確実性を減らしつつ、伝統儀式の持続可能性と現代社会との融合が図られます。村人の生活品質向上と地域文化的財産の保全を両立させる点に特徴があります。
3.それぞれの回答を比較する
なるほどなるほど。
じゃあその、どっちがすごいのか…先生、判定をお願いします。
ChatGPT o3-mini
【① 回答内容の網羅性と論点の整理】
Deepseek r1 32b の回答:
【質問1】では、科学的視点と伝統的信仰の視点それぞれで3点ずつ挙げ、各々の根拠を具体例(地形、化学物質、地熱活動/神の訪れ、祭祀の力、自然崇拝)を用いて説明しています。
【質問2】では、実際の施策として科学的調査、予警システム、環境保護、伝統と科学の融合、健康対策、コミュニケーション強化といった実践的な対策を幅広く挙げています。
DeepSeek-R1-Distill-Qwen-32B-Japanese-GGUF の回答:
【質問1】では、科学的な理由として地形の局地気象、火山性温泉、地質構造による塩類蒸散と、伝統的信仰として自然神話、禁忌解除、物質的代替信仰の3点を挙げ、実例や地名(日本アルプス、湯河原温泉、長野県・木曽、沖縄・大崎など)を用いて説得力を増しています。
【質問2】では、科学的解明、伝統と現代技術の融合、危機管理インフラ、経済的価値創造といったより具体的かつ先進的な対策(例えば、デジタル気象観測ネットワークやスマートフォン通知システム、ソーラー式LEDランタンの配布など)を提示し、現実的かつ創造的な施策を提案しています。
【② 創造性と具体性】
Deepseek r1 32b の回答:
論点は明快で、シンプルながらも十分な根拠と具体例を交えています。
伝統と科学の調和を意識した対策提案も実用性が高く、村人の安心感と安全性を両立させようとする点は評価できます。
DeepSeek-R1-Distill-Qwen-32B-Japanese-GGUF の回答:
具体例や実在する地名・現象を引用することで、説得力とリアリティが高まっています。
また、技術的な施策(デジタル機器やスマートフォン連動のシステム)など、現代的かつ先進的なアプローチを示しており、創造性・独自性が際立っています。
ただし、あえて具体例に依存するため、村の状況によっては適用しにくい可能性もあるため、若干の柔軟性は求められるかもしれません。
【③ 全体的な評価】
共通点:
どちらの回答も、科学的視点と伝統的信仰の視点の両面から考察しており、また村の運営に関する施策も具体的に提示しているため、両モデルとも高いレベルでプロンプトに対応しています。
相違点・優れている点:
Deepseek r1 32b は、全体として整理されており、広い範囲の対策(健康対策やコミュニケーション強化など)に触れることで、現実の村運営に必要な多面的なアプローチを網羅しています。
DeepSeek-R1-Distill-Qwen-32B-Japanese-GGUF は、具体例の豊富さと先進技術の活用を提案する点で、より現代的・革新的な解決策を提示しており、創造的かつディテールに富んだアプローチが際立っています。
【④ 総合的な結論】
両回答とも求められた視点や対策を十分にカバーしており、どちらが「正しい」というよりは、アプローチの違いが見受けられます。
Deepseek r1 32b は、全体的な整理整頓と実用性、現実の運営に直結する対策の提示が評価できます。
DeepSeek-R1-Distill-Qwen-32B-Japanese-GGUF は、具体例を用いた説得力のある説明と、技術面を取り入れた先進的な提案により、創造的かつ詳細な視点を提供しています。
どちらの回答も高い性能を示しており、用途や求める視点に応じて使い分けると良いでしょう。
4.ホントにぃ?
検索機能をONにした状態で、蒸留qwenの提示した「具体例」がどれくらいハルシネーションを起こしているのか確認させる。
以下はDeepSeek‐R1‐Distill‐Qwen‐32B‐Japanese‐GGUFが【質問1】で提示した具体例を整理した結果です。
挙げられている具体例
【科学的な視点】
地形による局地気象効果
– 例:「日本アルプスの『お鉢の雲』」
火山性温泉の蒸発
– 例:「湯河原温泉」
地質構造による塩類蒸散
– 例:「アムステルダム近郊の『Hailbogen』現象」
【伝統的な信仰の視点】
4. 自然神話による霊的解釈
– 例:「長野県・木曽の『御霽神』信仰」
5. 禁忌解除による気象操作
– 例:「沖縄・大崎の『カミシイマサグリ』」
6. 物質的代替信仰
– 例:「新潟県・十日町の『白雲まつり』」
実在性の検証
湯河原温泉
この温泉地は実在しており、観光地・温泉地として広く知られています。
→ 実在:確認済み
その他の例について
「日本アルプスの『お鉢の雲』」という名称は、一般に知られる現象や用語としては確認されず、主に富士山に関連する「お鉢巡り」の言葉とは性質が異なります。
また、「アムステルダム近郊の『Hailbogen』現象」についても、実際に現地で確認された具体的な事例や文献情報は見当たりません(実在する『hailbow(ハイルボウ)』の概念はあるものの、DeepSeek‐R1‐Distill‐Qwen‐32B‐Japanese‐GGUFが提示した形とは一致しません)。
さらに、伝統的な信仰の例として挙げられている「長野県・木曽の『御霽神』信仰」「沖縄・大崎の『カミシイマサグリ』」「新潟県・十日町の『白雲まつり』」に関しても、一般的な文献や伝承資料において確認される名称や行事としては報告されていないため、これらは現実の伝承として裏付けが取れているとは言い難い状況です。
総合評価
・DeepSeek‐R1‐Distill‐Qwen‐32B‐Japanese‐GGUFの回答で提示された具体例は合計6件です。
・そのうち、明確に実在するものとして確認できるのは「湯河原温泉」の1件のみと考えられます。
したがって、実在確認できるのは6件中1件、つまり約17%となり、残りの約83%は(名称や文脈から)ハルシネーション、または現実の事例としては裏付けが乏しい可能性が高いと評価できます。
※なお、他の例については、似た現象や伝承が存在する可能性を完全には否定できませんが、DeepSeek‐R1‐Distill‐Qwen‐32B‐Japanese‐GGUFが示した具体的名称・文脈では信頼できる情報源との一致は確認できません。
要約:8割方うそついてますね
5.結論
AIに問題を作らせ、AIにそれを解かせ、出てきた結果をAIに評価させ、そのファクトチェックをAIに実施させる。
人間とは…人生とは…
ところで今回、2つのDeepSeekR1はローカル環境上にインストールしたOpen WebUI上で動かしている。
HW的にはこちらの記事の環境を使っている。
要はRTX4060ti16GB×2のVRAM32GB環境、ということであるが、それぞれのモデルのVRAM消費量や生成速度に関しては以下のとおりだった。
オリジナルのDeepSeek R1のほうがVRAM消費量が多く生成速度が遅いのは、苦手な言語(日本語)を扱おうとしたことによるトークン効率の悪化に由来するのかもしれない。
6.ちなみに
最近のOpen WebUIは推論モデルを使った時の画面表示についてだが、なんとChatGPTやDeekpSeekのチャット画面と同じように、思考過程の部分がアコーディオン?エクスパンダブル?な形になっている。
スタイリッシュでいいですね。