この記事は、統計学習ツール StatPlay を開発する中で学んだことをまとめたものです。AIと協業して開発していますが、数学的な実装の正確性は自分なりに理解・検証しています。完璧かと言われると、まだ学びの途中です。
自分で作ったコンテンツを、自分でも飛ばしていた
統計を学び直していて、第一種・第二種の過誤のあたりで何度か止まりました。
帰無仮説 H₀ が「差はない/効果はない」、対立仮説 H₁ が「差がある/効果がある」。冤罪が第一種の過誤、真犯人逃しが第二種の過誤。そこまでは大丈夫だったんです。
でも、「H₀ が真のときに棄却域に入らない確率は?」のように具体の問いに直面すると、α と β と「棄却する/しない」と「真/偽」が頭の中で踊り始めて、結局どこを選べば正解か分からなくなる。過誤は、統計を独習する多くの人が同じところでつまずく定番の難所として知られているようです。
そしてここからが本題なのですが、私の作っている StatPlay というサイトの中にも、過誤を扱うセクションがあります。「α はここ、β はここ、ほら動きます」と名前を貼って動かしてみせるだけのコンテンツでした。自分で作ったのに、自分でも見ても通り過ぎてしまっていたんです。
「触って直感を立てる」という目的のサイトのはずなのに、過誤のセクションについてはそれができていないんじゃないか、とずっと気になっていたコンテンツでした。「作り直したほうがいい」と思って、Claudeに相談しながら本格改修したのが今回の話です。
混乱の正体は3つの「ねじれ」
最初にやったのは「何がどう混乱しているか」を言語化することでした。Claudeに「過誤の問題でなぜこれほど揺れるのか」を整理してもらいながら、出てきたのが次の3つの構造です。
ねじれ1:1本の確率として語ろうとしている
「第二種の過誤は、棄却域に入らない確率」と説明したくなる。間違いではないんですが、「H₀ が真のときの話か、H₁ が真のときの話か」の前提が抜け落ちている。文章にすると、この前提条件がスルッと落ちて、結果として揺らぐ。
ねじれ2:α と β は「別の世界」の確率
α は「H₀ が真の世界」での棄却率、β は「H₁ が真の世界」での不棄却率。別々の前提条件の下で定義された確率なので「α + β」には意味がありません。違う仮説の下で計算された量を足しても、解釈できる確率にはなりません。
それまでは「α と β はトレードオフ関係にあって、足すと…」とぼんやり考えていたんですが、そもそも足し算が成立する関係ですらなかったわけです。
ねじれ3:検出力は「βの裏返し」、新キャラじゃない
検出力 = 1 − β。同じ H₁世界の確率を裏から見ているだけ。「α・β・検出力」の3つを並べて覚えようとしていたんですが、本当は「α と β(とその裏返し)」の2つでしかなかった。
3つ並べてみると、結局は「H₀真/偽 × 棄却する/しない」の2軸で、2×2マトリクス1枚で全部表せる。場合分けすればよかったわけです。
| H₀ 棄却しない | H₀ 棄却 | |
|---|---|---|
| H₀ が真 | 正解 (信頼度 1−α) | 第一種の過誤 α |
| H₀ が偽 | 第二種の過誤 β | 正解 (検出力 1−β) |
グラフを動かすんじゃなくて、面積で見せる話なんだと思った
3つのねじれを言語化したあとに考えたのが、「ではどう見せるか」でした。最初は「分布を動かして α・β の山がどう変わるかを見せれば、それで足りるだろう」と思っていたんですが、整理し直すと、それでは足りない。
α と β は別の前提の下にある確率です。「H₀ が真の世界」と「H₁ が真の世界」は、同じ図に重ねて描かれていても、起きている話が違う。グラフの形が動くのを眺めても、世界の違いまでは伝わらない。
特に β は、H₁ をどこに置くか(効果量 δ がどれくらいか)を仮定しないと描けない量で、α が H₀ の分布だけで事前に決め打ちできるのとは対照的です。この「片方だけが先に決まる」という非対称性も、別世界として並列に置いて見せると素直に伝わります。
そこで、グラフを動かすことをメインにするのではなく、「H₀真の世界」「H₁真の世界」という別世界の出来事を、面積として見せる設計に切り替えました。2×2 の各マスを色分けされた領域として置き、それぞれが分布のどの面積に対応するかを連動させる。グラフはあくまで補助です。
技術的な工夫というより、「α と β の違いをどう翻訳するか」という設計判断の話でした。
整理した結果
過誤の問題で詰まった場所と、自分の作ったサイトで自分が飛ばしていた場所が、同じ構造だったんだな、と振り返って分かりました。「分かった気になっているけど、実は分かっていない」場所には、自分の頭の癖がそのまま現れる。AI と整理を進めると、その癖が浮き彫りになります。
今回の改修を通して、教材設計の判断軸として明確になったのは、何でもかんでもグラフにして動かすことが、必ずしも理解には繋がらない、ということでした。
グラフや動的な表現が効くのは、たとえば標準化のように「データがググッと変化していく様子」を見せる場合や、中心極限定理のように「試行を繰り返した結果が分布として立ち上がっていく」場合です。時間軸や試行の積み上げに沿って何かが動いていく現象を扱うときには、動かす表現が強い。
一方、今回のように「2つの世界(概念)が並んで存在する」という構造を示したい場合は、複雑に動かすよりも、シンプルなボタンやマスのクリックで「こっちの世界はこう、こっちの世界はこう」と切り替えて見せるほうが、実感としてつかみやすかった。並列の構造は、動的な動きより静的な並びと、それを切り替える小さな操作のほうが効きます。
動的でリッチな見せ方が常に正解とは限らない、扱う対象が「動き」なのか「構造」なのかを見極める、というのが今回の判断軸として残りました。
整理した結果は 第一種・第二種の過誤って何が違うの? というコラムの形になりました。仮説検定の世界で同じところに引っかかっている方がいたら、グラフを触ってみてもらえると嬉しいです。
関連
- StatPlay — この記事で扱った統計学習ツール
- 第一種・第二種の過誤って何が違うの? — 今回作り直したコラム
- GitHub — コード全文(CC BY-NC 4.0)
Jumpei Sasai / Sasai Lab — 2026.05