0
0

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?

個人開発したIQテストが炎上した。「問題が難しすぎて自尊心が傷ついた」とレビューされた

0
Last updated at Posted at 2026-03-29

IQテストの結果画面 — IQ 112

作ったもの

IQテスト という無料のIQ測定サイトを個人開発した。

論理的思考・パターン認識・空間把握・数的処理・言語理解の5分野で、15分でIQスコアが出る。認知科学の文献をベースに問題を設計して、統計的にIQスコアを算出する仕組み。

公開してから2ヶ月で月間1万PVに到達した。個人開発としてはまあまあの数字。

問題はレビューだった。

レビュー1:「自尊心が傷ついた」

公開3日目。Googleフォームで設置したフィードバック欄に最初のレビューが来た。

「問題が難しすぎます。途中で心が折れました。IQを測るつもりが自尊心を測られました。」

一瞬笑った。でも同じ日にもう1件来た。

「パターン認識の問題、後半から意味がわかりません。これ人間が解けるんですか?」

解ける。自分は解ける。でもそれは自分が問題を作った側だからだ。

レビュー2:「100を超えられない」

1週間後。フィードバックが10件を超えた。内容を分類すると:

  • 「難しすぎる」系:5件
  • 「スコアが低くて凹んだ」系:3件
  • 「面白かった」系:2件

ポジティブなレビューが2割しかない。 しかもポジティブな2件は両方ともIQ 120以上の人だった。

つまり高スコアの人は褒めて、低スコアの人は怒る。 これはIQテストの宿命なのか。

難易度調整の沼

ここから難易度調整の地獄が始まった。

第1回調整:簡単にした

「難しすぎる」というフィードバックを素直に受けて、問題の難易度を全体的に下げた。パターン認識の後半問題を2段階簡単にして、数的処理の数列を短くした。

結果:平均IQが118になった。

IQの平均は100でなければならない。118は高すぎる。全員が「自分は頭がいい」と思ってしまう。気持ちいいかもしれないが、テストとしては破綻している。

第2回調整:正規分布に戻した

統計的に正しい難易度に戻した。平均が100、標準偏差が15になるようにキャリブレーション。

結果:「前より難しくなった!」という苦情が殺到。

前回簡単にした時に受けた人が再テストして、スコアが下がった。「前は112だったのに今日は103。バグじゃないですか?」

バグじゃない。前がおかしかったんだ。

第3回調整:諦めた

IQテストの難易度を「ユーザーが気持ちよくなる」ように設定するのは、統計的に正しいテストを作ることと矛盾する。

この2つは両立しない。選ぶしかない。

自分は正確さを選んだ。平均100、標準偏差15。半分の人は100以下になる。それがIQテストだ。

一番多かったフィードバック

2ヶ月で集まったフィードバック87件の中で、最も多かった内容。

「頭が良くなると思ったのに、ただの測定でした」

これが12件あった。全体の14%。

IQテストは測定ツールだ。受けてもIQは上がらない。体重計に乗っても痩せないのと同じ。

だが「IQテスト」というワードに、多くの人は「脳トレ」のイメージを持っている。やれば頭が良くなると思っている。

これは自分のマーケティングの失敗だ。 「測定」であることを明示していなかった。

対策:導入文を変えた

テスト開始前の説明文を書き換えた。

Before:

「5つの分野であなたのIQを測定します」

After:

「このテストはIQを測定するツールです。受けてもIQは上がりません。結果が低くても、それはあなたの全てではありません。IQは認知能力の一部を数値化したものです」

我ながら防御的すぎる文章だが、これを入れてからネガティブなフィードバックが40%減った。

認知プロファイル — HIGH判定の結果

エンジニアは高スコアが出やすい

2ヶ月分のデータを分析して気づいたこと。

流入元がQiitaやZennの場合、平均IQが112だった。一般流入(Google検索)の平均が101なので、11ポイント高い。

これは選択バイアスもあるが、エンジニアが日常的にやっている作業(論理的思考、パターン認識、抽象化)がIQテストの出題分野と重なっているからだと考えられる。

逆に言えば、エンジニアがIQテストで100を下回ったら、睡眠不足かストレスを疑った方がいい。 コンディションの問題で本来のスコアが出ていない可能性が高い。

IQテストを個人開発して学んだこと

  1. ユーザーは正確なスコアを求めていない。 「自分は頭がいい」という確認を求めている。これにどこまで寄り添うかが設計判断

  2. 半分の人は平均以下になる。 IQの定義上、避けられない。平均以下の人が「バグだ」と言ってくる設計は、説明不足

  3. 「測定」と「トレーニング」は別物。 これを分かっていないユーザーが14%いた。導入で明示すべき

  4. レビューはスコアに比例する。 高スコア→褒める、低スコア→怒る。フィードバックを鵜呑みにすると、全員が高スコアになるインフレテストが完成する

まとめ

個人開発したIQテストは、月間1万PVまで伸びた。でも一番学んだのは技術じゃなくて、「数字を見せられた人間がどう反応するか」 だった。

IQテストは鏡だ。見たくない数字を見せてくる。その鏡に怒る人がいる。鏡を使って自分を知る人もいる。

開発者としてできるのは、鏡の精度を上げることだけだ。映る像をいじったら、それは鏡じゃなくなる。

0
0
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
0
0

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?