個人開発したIQテストが炎上した。「問題が難しすぎて自尊心が傷ついた」とレビューされた

Last updated at 2026-03-29Posted at 2026-03-29

作ったもの

IQテストという無料のIQ測定サイトを個人開発した。

論理的思考・パターン認識・空間把握・数的処理・言語理解の5分野で、15分でIQスコアが出る。認知科学の文献をベースに問題を設計して、統計的にIQスコアを算出する仕組み。

公開してから2ヶ月で月間1万PVに到達した。個人開発としてはまあまあの数字。

問題はレビューだった。

レビュー1：「自尊心が傷ついた」

公開3日目。Googleフォームで設置したフィードバック欄に最初のレビューが来た。

「問題が難しすぎます。途中で心が折れました。IQを測るつもりが自尊心を測られました。」

一瞬笑った。でも同じ日にもう1件来た。

「パターン認識の問題、後半から意味がわかりません。これ人間が解けるんですか？」

解ける。自分は解ける。でもそれは自分が問題を作った側だからだ。

レビュー2：「100を超えられない」

1週間後。フィードバックが10件を超えた。内容を分類すると：

「難しすぎる」系：5件
「スコアが低くて凹んだ」系：3件
「面白かった」系：2件

ポジティブなレビューが2割しかない。 しかもポジティブな2件は両方ともIQ 120以上の人だった。

つまり高スコアの人は褒めて、低スコアの人は怒る。 これはIQテストの宿命なのか。

難易度調整の沼

ここから難易度調整の地獄が始まった。

第1回調整：簡単にした

「難しすぎる」というフィードバックを素直に受けて、問題の難易度を全体的に下げた。パターン認識の後半問題を2段階簡単にして、数的処理の数列を短くした。

結果：平均IQが118になった。

IQの平均は100でなければならない。118は高すぎる。全員が「自分は頭がいい」と思ってしまう。気持ちいいかもしれないが、テストとしては破綻している。

第2回調整：正規分布に戻した

統計的に正しい難易度に戻した。平均が100、標準偏差が15になるようにキャリブレーション。

結果：「前より難しくなった！」という苦情が殺到。

前回簡単にした時に受けた人が再テストして、スコアが下がった。「前は112だったのに今日は103。バグじゃないですか？」

バグじゃない。前がおかしかったんだ。

第3回調整：諦めた

IQテストの難易度を「ユーザーが気持ちよくなる」ように設定するのは、統計的に正しいテストを作ることと矛盾する。

この2つは両立しない。選ぶしかない。

自分は正確さを選んだ。平均100、標準偏差15。半分の人は100以下になる。それがIQテストだ。

一番多かったフィードバック

2ヶ月で集まったフィードバック87件の中で、最も多かった内容。

「頭が良くなると思ったのに、ただの測定でした」

これが12件あった。全体の14%。

IQテストは測定ツールだ。受けてもIQは上がらない。体重計に乗っても痩せないのと同じ。

だが「IQテスト」というワードに、多くの人は「脳トレ」のイメージを持っている。やれば頭が良くなると思っている。

これは自分のマーケティングの失敗だ。 「測定」であることを明示していなかった。

対策：導入文を変えた

テスト開始前の説明文を書き換えた。

Before：

「5つの分野であなたのIQを測定します」

After：

「このテストはIQを測定するツールです。受けてもIQは上がりません。結果が低くても、それはあなたの全てではありません。IQは認知能力の一部を数値化したものです」

我ながら防御的すぎる文章だが、これを入れてからネガティブなフィードバックが40%減った。

エンジニアは高スコアが出やすい

2ヶ月分のデータを分析して気づいたこと。

流入元がQiitaやZennの場合、平均IQが112だった。一般流入（Google検索）の平均が101なので、11ポイント高い。

これは選択バイアスもあるが、エンジニアが日常的にやっている作業（論理的思考、パターン認識、抽象化）がIQテストの出題分野と重なっているからだと考えられる。

逆に言えば、エンジニアがIQテストで100を下回ったら、睡眠不足かストレスを疑った方がいい。 コンディションの問題で本来のスコアが出ていない可能性が高い。

IQテストを個人開発して学んだこと

ユーザーは正確なスコアを求めていない。 「自分は頭がいい」という確認を求めている。これにどこまで寄り添うかが設計判断
半分の人は平均以下になる。 IQの定義上、避けられない。平均以下の人が「バグだ」と言ってくる設計は、説明不足
「測定」と「トレーニング」は別物。 これを分かっていないユーザーが14%いた。導入で明示すべき
レビューはスコアに比例する。 高スコア→褒める、低スコア→怒る。フィードバックを鵜呑みにすると、全員が高スコアになるインフレテストが完成する

まとめ

個人開発したIQテストは、月間1万PVまで伸びた。でも一番学んだのは技術じゃなくて、「数字を見せられた人間がどう反応するか」 だった。

IQテストは鏡だ。見たくない数字を見せてくる。その鏡に怒る人がいる。鏡を使って自分を知る人もいる。

開発者としてできるのは、鏡の精度を上げることだけだ。映る像をいじったら、それは鏡じゃなくなる。

You get articles that match your needs
You can efficiently read back useful information
You can use dark theme

What you can do with signing up