はじめに
今から1年ほど前の話ですが、統計検定2級に3回目でようやく受かった話を記事にしました。
書きたくなったきっかけは、友人が受験することを知り社内の勉強会用に準備したのですが、結局発表しなかったので、何かしら形にしたかったのが1つ。もう1つは、先日AWSのCloud Practitionerに1発で受かった記事を書き、この失敗が1発合格に生きた面もあったので、その振り返りになります。
(追記) 友人にこの学習法を教えたところ1発で合格してました!
取得した経緯と自分の実力
[経緯]
・上司が新人の頃から、「この部署でやっていくなら最低でも統計検定2級レベルは知っておく必要がある」と言っていたので
・社外のサイエンティストとチーム開発をした際に、メンバーの数人が2級を持っていた
・今後この業界で生きていく上でも若手のうちに押さえておく必要があると思い、受験
[自分の実力]
・データサイエンティスト社会人2年目(当時) 学生時代に計量経済学をメインで勉強
・回帰などの統計分析はある程度長けていたが、逆に検定や分布に関しては初心者に近い状況
・機械学習周りも、半分思考停止的に勾配ブースティングを使っている程度の実力
統計検定2級てそもそも何?
公式のHP を見たところ
・大学基礎課程(1・2年次学部共通)で習得すべきことについて検定
との記載がありました。また具体的な内容に関しても....
(公式のHPより抜粋)
内容からしても、データサイエンティストをやっていく上で「知らなくても業務にはなるが、知っていた方が分析に厚みが出る」内容だと感じています。なので、まだ年次の浅い自分がチャレンジしたにはちょうどいい頃合いだと思います。
準備期間
1st try: 2021年12月中旬〜2022年1月30日(約1.5ヶ月) >不合格
2nd try: 1回目の不合格時〜2022年2月12日 (約2週間)>不合格
3rd try: 2回目の不合格時〜2022年3月4日(約3週間)>合格
合格までかかったトータル時間:2.5ヶ月強
1回目のチャレンジ
大学受験等の知見を意識し、「出題範囲を網羅的に把握」「過去問に触れておく」を念頭に、
・統計学大百科辞典で試験範囲の箇所をざっと1周しました。
・過去問(2019,2018年の1回2回の計4回)を実施
→この結果, 過去問を解いても半分も行かず..公式の暗記中心になっていて基本的な考えが不足していると判断したため、試験日2週間前ぐらいから
・完全独習 統計学入門
を活用し、基礎的な概念の理解に徹しました。ネット上でも「これで合格した!」というのが多数で、やってみると公式丸暗記から脱却できたような気がしました。(ただし、あくまで基本中の基本の理解)
テキストを1周すると、過去問もPBT時代の70%に届くか届かないかぐらいのスコアを推移しておりましたので「受かるかもな」ぐらいの心づもりにはいました。
1回目の結果
100点満点中60点が合格ラインで結果52点(あとちょっと...!!)
敗因
・基礎に関して理解はしていたが、それを公式を当てはめて解くというフェーズには至っていなかったです。
不合格を受けて2回目の受験を決意
合格点まで残り8点....ということもあり、ネットの情報からも「不合格の場合はすぐに受けた方がいい」というのを鵜呑みにして、「まあ次受ければ受かるでしょ」という姿勢で2週間後に再受験を決意しました。
この時期やった勉強として
・統計webから出るとの噂を聞き、ざっと目を通す
・試験を受けた感じ、過去問はあてにならなそうと思い、統計webの内公式のみを暗記
の2つだけをやってました。やっていた時は正直手応えがなく、半分「受かって欲しいな」という神頼み状態になってました..
2回目の結果
47点、前回よりも落ちる...
敗因:
・アウトプットの時間が取っていなかったことで「なんとなく理解した気分」になっており,「完全独習 統計学入門」をやっていた時にわかっていた理屈の部分が段々と忘れていました..
不合格を受けて3回目の受験を決意
2回目落ちた時に「これに受かって何の意味あるのか....」と思い、最初はやめようと思いました。しかし、せっかくお金をかけて参考書も設えたのにもったいないと考え、約1ヶ月かけて3度目のトライをすることにしました!前回の反省を踏まえ「根本的な理解の充実」と「圧倒的な問題量」を意識をし、以下4つを期間中に実施しました。
①Udemyのいちばん理解できる統計学ベーシック講座その1【確率分布・推定・検定】
→完全独習だけでは、カバーできなかった基本の理解を部分を徹底的に詰めました。何回も動画を見返して、「ここ丸暗記になってたな...」と痛感しながら理解しました。
②過去問も徹底的にやり込み、理解した物をアウトプットした
→一番古い年度(2011年)まで遡って実施。落ちた時に出てきたような類似の問題を発見しながら、本番でミスらないことを意識しました。
③公式の教科書にも触れ、出題範囲の抜け漏れがないか確認
→最初受けた時は丸暗記だった公式が、この教科書を通じて自分で導けるようにまで成長していたので、最初の導入というよりは総ざらい用でオススメだと思います。
④44の例題で学ぶ統計的検定と推定の解き方を活用し、類題にも触れる
→ギリギリの合格ラインを狙うのではなく、余裕を持って受かる(7割以上)ことを意識させるためにも、問題量を増やす意味で実施しました。
3度目の正直
合格の勝因は...
・理論の理解:単なる公式暗記になってない
・徹底的な演習:過去問は、遡れるまで遡った
・類題までやれたこと:試験形式とは少し異なる問題集まで解いたこと
の3つかなと思います。
大変だったこと&合格してよかったこと
今回検定取得後に実感した辛かったことと、合格してよかったことを纏めておきたいと思います
(辛かったこと)
・社会人になって、資格試験の勉強と業務の両立の大変さを実感
→3回目受ける直前は、平日2時間、休日4時間の勉強を捻出
(合格してよかったこと)
・標本の抽出方法や分布への理解が高まったことで、分析の前段階の仮説の設定や予測モデルの成り立ちに関しての理解が深まった実感
・検定の過誤と標本抽出の考え方は、分析の結果をみたり、設計をたてたりする上で役立った
・文系出身特有の「数式アレルギー」も少しづつとれた気がした
・特に「完全独習 統計学入門」は中学生でも理解できるような書き方だったので、ギリシャ文字への抵抗も大幅軽減
最後に
振り返ってみると、1回目と2回目の姿勢が若干舐めていたこともありましたが、2ヶ月半で取れたことを加味すれば上出来だったのでは?と思います。とはいえ、2回目落ちた時は結構ショックだったので、辛い過去は笑い飛ばそうと思います。