#初めに
7月中頃より仕事の合間にぽちぽちと統計検定2級の勉強を進め、10月頭にCBT試験で無事合格したため勉強の流れを備忘録として残しておきます。
他の方があまりレビューされてないと思われる本で学んだので、統計検定2級合格を目指す方への参考書レビュー位にはなるかな、と思います。
#勉強開始前のスペック
- 10年以上前は元高専生でした。数学に苦手意識はないが、別段得意でもないです。
- 仕事で統計学を使ったことは全くない。初学者。
- 趣味のテーブルゲームで確率・期待値の計算をしたつもりになってはいる。が、精度は恐らく皆無。勝てない…。
#参考にした書籍・Webサイト
##マンガでわかる統計学
マンガでわかる統計学
一番最初の入り口として。
「あー、なるほどねー。統計ってそういう感じねー。ふーん。へー」くらいの達成度。
数学や統計に対して苦手意識を持ってる人が、最初触ってみるには丁度いいかもしれない。
##大学4年間の統計学が10時間でざっと学べる
大学4年間の統計学が10時間でざっと学べる
だいたいざっくり範囲を網羅してると思う。
多少の過不足もあるかもしれない。数式と文章のバランスが個人的には肌に合った感じ。
数式の導出が余り細かくないので、「なんでこの式がこうなるの?」って思うと大変かもしれない。
統計WEBとこの本を中心に学習しました。
##統計WEB
統計WEB
偉く評判の良い統計講座サイト。2級の範囲がほぼ網羅されてる。
確かに大体これでいいかもしれない。無料でこれだけの情報量。
統計WEBだけで受かったら格好良いなぁ。
個人的には説明が分かりづらい部分がいくつかあったので、先述「大学4年間の〜」と突き合わせてました。
##改訂版 日本統計学会公式認定 統計検定2級対応 統計学基礎
偉く評判の悪い公式参考書。
数式周りは全部手で導出してみたら理解はとても深まりそう。
確かに言われているように情報量がとても多く数式もガンガン出てくるため、苦手な人は苦手そう。
学習を始めたばかりの人にこれを渡してもきっと嫌になる。
重箱の隅をつつくような疑問点や、細かい部分が気になった時に見る用。最後の最後の詰め、かなぁ。
##統計検定2級公式問題集 日本統計学会公式認定 2017~2019年
過去問集。
解説の式だったり考え方が分からない部分は、先述「統計WEB」のブログを漁ると過去問解説がある。
同じ問題でも考え方や解法が異なるので、どっちも見てました。
#結果
ギリギリ65点での合格でした。
過去問で8割理解(易問のみ理解) → 新しく見る問題の中で易問の8割正解→64点。
勿論運に任せた5択もあったので、落ちていた世界線も存在したと思います。
当日電卓の持参を忘れていたために会場近くの100均で購入したら、たまたま不良品を掴んでしまい慌ててレジまで戻り、別のものと交換してもらう…というハプニングもありました。
#私が得た統計検定2級のコツ
##濃度の薄い周回プレイを重ねて濃くする
統計WEBと公式参考書で言葉が違う…確率関数…?分布関数…?密度関数…?と、頭の中に疑問符が沸き上がってきたら一旦思考を止めて、「(今はまだ)よくわからないけど(2周目、3週目できっとわかるようになるので)ヨシ!」と考えてページを進める事が大事だと思います。
参考書を読み進めて、理解できない部分や疑問点があった時、
- 現状知識が足りてない
- 参考書の説明が伝わりづらい
のどちらかだと思います。
1のパターンは、周回数を重ねる事によって、他の箇所で得た知識が後々理解を助けると思います。
2のパターンは、他の参考書で違った言い回しや捉え方をしている部分が、あなたにとって理解しやすいものかもしれません。
実際、「初見、2周目ではわからなかったけど、3週目で前後の知識が繋がってようやく理解できた」こともありました。(パターン1)
「初見、2周目の統計WEBでは理解できなかったけど、公式参考書を読むとあっさり理解できた」ようなこともありました。(パターン2)
私がもう一度統計検定2級を受けるなら、中古で統計検定2級範囲に凡そ合致する参考書を複数種類買って、それらを何度も読むと思います。
##全体像の把握
「結局この節の知識はどういう風につながるのか」「この知識が無いと、どれが解けなくてどこが理解できないのか」と、前後の関係性を捉えるのにずいぶんと時間がかかりました。
統計検定2級範囲のマッピングを行うと理解が進むかもしれません。
検定も推定も同じ推定量を用いてる…!と気が付いてからは進みが加速しました。
そのうち統計検定2級範囲ワールドマップでも投稿しようかな。
##意味の理解
みんな大好き母分散未知の母平均推定です。1.96とか。
\bar{x} - t_{\frac{a}{2}(n-1)} \times \sqrt{\frac{s^2}{n}} \leq \mu \leq \bar{x} + t_{\frac{a}{2}(n-1)} \times \sqrt{\frac{s^2}{n}} \\
一方こちらは、母平均の検定を行う際の統計量tです。
t = \frac{\bar{x}-\mu}{\sqrt{\frac{s^2}{n}}}
実は両者はどちらも同じものを違う視点で見てますよね。
- 推定:母平均$\mu$が存在するであろう範囲
- 検定:母平均$\mu$が〇〇だと仮定(帰無仮説)した時にtの取りうる値。「母平均($\mu$)が〇〇だとしたら、××の確立でこの標本が出てくるよ」→「その確率はありえんから仮説の母平均が間違ってたんだな」
あとは統計量tの中の意味ですが、「標本平均と母平均の差を、標準誤差で割ったもの」になってますね。
以降割愛しますが、標準化との関係や統計量tって何なの?といった所も遡って意味を見ていくと、それぞれの分布の関係性が理解しやすくなるかと思います。
#総括
正直、合格はしたものの統計学の正しい理解には程遠いです。細かい部分の理解が甘かった。過去問を選択肢無しで満点取れるくらいまで周回できたらもっと余裕をもって合格できたと思います。
「1か月で余裕!」「統計WEBと過去問だけで受かった」といった強い方々との差を思い知らされました。
ただ、それでも「なんで全部開票してないのに当確が出るの?」といった疑問がしっかり納得できた所から、何かしら知識として身についてはいるんだろうと感じます。
いつか、1級の高みまで登り詰めてみたいですね。