はじめまして、げまです!
毎日新しい水平思考クイズにチャレンジできる SoupyQuiz というサイトを運営しています。
AIなら水平思考クイズを量産できるはず、と思っていた
「水平思考クイズが毎日遊べたら最高では?」
「AIに任せれば簡単にできるのでは?」
そんな楽観的憶測から、このサービスの開発は始まりました。
……が、実際にやってみると、AIに良質な水平思考クイズを作らせるのは想像以上に難しい。
- 伏線が成立していない
- オチが常識的すぎる
- 問題文と正解が論理的に噛み合っていない
- そもそも何を言っているのかわからない
という「駄作」が、ほぼ確実に生成されます。
ただし――
100回に1回くらい、奇跡的に“至極の駄作”が生まれる瞬間がある。
意味は分からないのに、なぜか雰囲気だけは完璧。
ツッコミどころしかないのに、妙に詩的。
人間では到底思いつかない。
それを見て思いました。
これ、ちゃんと“楽しむ”ゲームにしたら面白いのでは?
MushroomQuiz(きのこクイズ)を作りました
そこで作ったのが、
ハルシネーションたっぷりの水平思考クイズを楽しむ
MushroomQuiz(きのこクイズ) です。
- AIが本気で(?)生成した水平思考クイズ
- 問題も正解も、どこかおかしい
- でも最後まで読むと、なぜか笑ってしまう
ChatGPT Plus / Pro / Teams アカウントがあれば、そのまま遊べます。
水平思考クイズとは?
水平思考クイズは、
不可解な状況の真相を、YES / NO で答えられる質問だけで解き明かす推理ゲーム
です。
問題文だけを見ても、普通に考えて答えは出ません。
質問を繰り返しながら、前提を少しずつ崩していく必要があります。
有名な例:ウミガメのスープ
問題
ある男がレストランでうみがめのスープを注文した。
ひと口食べた後、男は店を出て自殺した。なぜ?
- その男はそのレストランに来たことがある? → NO
- スープに毒が入っていた? → NO
- 男は以前にうみがめのスープを飲んだことがある? → YES
正解
男は昔、無人島で遭難した際、仲間から「うみがめのスープだ」と言われて人肉を食べていた。
本物のうみがめのスープを味わい、味の違いから真実を悟り、絶望したため。
生成AIが作った水平思考クイズたち
ここからは、実際にAIが生成したクイズの例です。
人間の思考ではまず到達しない領域に入っていきます。
クイズ by Grok 4
ある男が古い時計店に入った。
店主が時計を一つ見せてくれた瞬間、
男は店主を抱きしめて感謝を述べ、店を出て自殺した。
なぜ?
正解
男はタイムトラベラーで、
過去に遭難した際「これは古い時計だ」と言われて
実は人肉を食べさせられていた。
本物の古い時計の針の動きや音が、
当時の「時計」の味や食感と違うことに気づき、
欺瞞と罪を悟って絶望したため。
評価
- 時計とは
- 味とは
- 情報量だけは多い
完全に意味不明だが、なぜか最後まで読ませる力がある
クイズ by Grok 4
ある女性が毎朝、同じカフェで同じコーヒーを注文していました。
ある朝、いつものように一口飲んだ瞬間、
彼女はカップを置いて店を飛び出し、恋人にプロポーズしました。
なぜでしょう?
正解
彼女は恋人と
「味覚が変わるほどの奇跡が起きたら結婚しよう」
と約束していました。
その朝、コーヒーの味が明らかに違うと気づきます。
実は彼女は妊娠しており、ホルモンバランスの変化で味覚が変わっていたのです。
奇跡と新しい命を確信し、衝動的にプロポーズしました。
評価
- そんな約束しない
- どんな味なのか気になる
- 人間が作れそうなギリギリのライン
クイズ by ChatGPT 5.2
ある男は、毎朝6時に必ず目覚ましを止めてから二度寝をする。
ある日だけ、目覚ましを止めた直後、男は静かに部屋を出て二度と戻らなかった。
その日の朝、部屋の中はいつもと全く同じだった。
なぜ男は二度寝をしなかったのか。
正解(原文ママ)
男はその朝、
目覚ましが「自分で止めたものではない」ことに気づいた。
彼は毎朝、
「自分が止めた」という行為で
“今日も自分はここにいる”ことを確認していた。
しかしその日、
目覚ましは「止まっていた」。
つまり男は悟った。
今日の自分は、昨日から連続した存在ではない。
二度寝とは、
「目覚めた自分が、再び同じ自分に戻る」行為である。
その前提が壊れた朝、
二度寝という概念は成立しなかった。
だから彼は部屋を出た。
“続き”のない世界へ行くために。
評価
- ロジックは破綻している
- 水平思考クイズでもない
- でも妙に哲学的で、雰囲気だけは最高
ハルシネーションたっぷりな問題を生成するコツ
実験して分かったコツを少しだけ。
- 「最高」「独自性」「前例を超えろ」と強く要求する
- 厳しい評価基準を与える
- コンテキストをできるだけ埋める
- 同時に大量生成させる(10問以上)
すると、たまに脳が焼き切れたような問題が出てきます。
OAuth で工夫したこと
技術的な工夫として、
ユーザー自身の ChatGPT(Codex)アカウントで認可し、
ユーザーのトークンでクイズを生成できるようにしています。
これにより、
- 運営側がAPIコストを抱えなくてよい
- 採算が取りづらい実験的サービスでも気軽に公開できる
というメリットがあります。
AI時代には、
「採算が合うかどうか分からないけど、面白い」
そんなサービスを雑に出せるのが強みだと思っています。
おわりに
水平思考クイズを真面目に作ろうとして失敗した結果、
ハルシネーションを楽しむゲームが生まれました。
意味が分からなくて笑える。
ツッコミながら遊べる。
でもどこかAIらしさが微笑ましい。
もしよければ、
MushroomQuiz(きのこクイズ)
ぜひ遊んでみてください 🍄
近日中に Claude Code や Gemini 対応もチャレンジする予定です。
