1. はじめに
AI開発・データ分析業務にかれこれ3年関わっているが、体系だった知識を習得して業務効率を上げたいので、統計検定2級を受験し、無事に合格できた。
試験勉強の期間は4週間。
月〜土曜日に2h/日で勉強。なお、土曜日は月曜日〜金曜日の復習に注力。
前提として、業務で統計分析をしていたり、統計検定3級をすでに持っていたので、統計用語・単語は”名前だけ”は知っている状態からのスタートだった。
受験体験記や試験のコツは、諸先輩方の素晴らしい記事がすでにあるが、私自身が四苦八苦したポイントを公開することで役に立てればと思い、本記事を残す。
2. 参考文献
本とWebサイトを活用した。
2.1 図書
a) 統計検定2級過去問題集
・1番使った。テスト慣れも兼ねているので、最初は試験時間90分で一通り解くことを推奨。計算問題は絶対に自分で計算して解くこと。
・解説は時折端的すぎるので、他の図書で統計学・確率論の理論は勉強した方が良い。
b) 完全独習統計学
・統計的推定・点推定・区間推定の肝がわかる。悩むくらいだったら、買って読むべき。
c) 入門統計学
・過去問などを解く中で出てきた疑問点を解消するために参照。
・独立性検定・適合度検定の説明が丁寧。
d) 統計学入門
・入門統計学と同様に、辞書がわりに使用。
・確率分布ごとの期待値・分散の計算過程が網羅的に書かれている。
2.2 Webサイト
a. 統計学の時間
・過去問と同じくらい使った。
・練習問題をとにかくとく。
b. 統計検定2級チートシート
・過去問などでわかった”自分の苦手なところ”を網羅的に書き出すために使用。
3. 勉強のスケジュール
1週目:
・過去問を一通り解く。
2〜3周目:
・過去問のうち、
- 統計的検定(帰無仮説の棄却可否)
- 平均・分散・比率といった値を点推定・区間推定
- 独立性検定・適合性検定
- 回帰分析
の問題だけ集中的に解き直す。3年分を3周くらいとき直した。
・解いていると、なぜこのケースでこの統計量・式を使うのか、疑問が出てくるので、辞書的な図書で調べる。
4周目
フィッシャーの三原則など覚える系の問題を解きまくる。
4 コツ
1つ1つの問題がある程度のスピードで解けるようになるためのコツと、試験で合格点をとるためのコツの2点ある。
a) 問題を解けるようになるためのコツ
・統計学の最初の難関は、点推定・区間推定。ここだけでも理論がわかった上で解ければ、統計的検定や適合度・独立性検定・回帰分析はその応用。
・最初は、以下の認識で問題を解いていくと良い。
推定対象 | 使う分布 |
---|---|
平均 | Z分布、t分布 |
分散 | カイ二乗分布、F分布 |
・不偏分散と言うサンプル数nから1だけマイナスする曲者がいるが、統計検定2級の範囲内の統計量計算の大半は、自由度=(サンプル数n)がほとんど。
n-1を使って直接割り算・掛け算をするケースは
- 「母分散が未知、もしくはサンプル数が少ない(目安として20以下)場合の対応のない2郡の差の検定」の時の、t統計量の計算。
- 分散の区間推定時の上限値・下限値の計算
くらい。
なお、確率分布の自由度はn-1を使うケースが多い。例えばt分布やカイ二乗分布の時など。
b) 試験で合格点をとるためのコツ
・90分以内に全ての問題をきちんと回答するのは困難。難しい問題も出題されている。
・特に統計的検定や点推定・区間推定の問題は、計算量を多くするなどで簡単に難易度を上げる事ができる。
・難しい問題だと思ったら、時間を使いすぎず、次の問題に進むべき。簡単、もしくは基礎的な問題を素早く確実に回答する事が合格点を超える最短ルート。
・難しい問題にハマって、時間がなくなり焦って簡単な問題も間違えるのが最悪。
5 まとめ
・検定・推定は教科書を読むだけだと理解が進まない。とにかく問題を解く。
・問題を解けるようになるコツと試験で合格点をとるコツは別。後者は、試験数日前から対策すれば十分。
・統計的検定の有用性を知る事ができたので、もっと数学的な側面を知りたくなった。次は、準一級を取得したい。