はじめに
この記事はマナビDX Questで得たもの Advent Calendar 2023 9日目の記事です。
(昨日は@MiyaKrmt さんの記事でした)
今回は、マナビDXQuestで知った「統計検定2級」に挑戦したことについて、合格までの道のりや感想についてお話ししたいと思います。
統計検定2級とは?
「統計検定2級」は統計に関する知識や活用力を評価する「統計検定」の中の1つで、一般的に仕事で使えるレベルはこの2級からと言われています。
統計検定2級は、大学基礎レベルの統計学の知識と問題解決力に焦点を当てており、主に以下のような内容が出題されます。
- 1変数データ
- 2変数以上のデータ
- 推測のためのデータ収集法
- 確率
- 確率分布
- 標本分布
- 推定
- 仮説検定
- 線形モデル
合格水準は、100点満点で60点以上です。
また、CBT方式で1年を通していつでも受験が可能であり、一度不合格になっても最終的に合格までたどり着くことが出来るようになっています。
統計検定2級合格までの道 概要
-
合格までまでのチャレンジ回数は?
2回。 1度落ちました -
合格までにかかった時間は?
合計1ヶ月強 (GWを挟んだこともあり、60~80時間は勉強した気がします) -
受験に掛かった費用は?
合計 14,000円
1回 7,000円で2回分
初学者の場合、1ヶ月以内での合格はなかなかハードルが高いと感じた。
統計検定2級受験前の私
職業
理系の修士卒で電機メーカーで自動運転の車両制御アプリの開発をしています。
ただ、データ分析の実務経験はありませんでした。
持っている資格
G検定2023#1
社外活動経験
経済産業省主催のマナビDXQuestに参加
データ分析コンペに2回参加(テーブルデータ1回、画像データ1回)
使用したコンテンツ紹介
コンテンツの取り組み方
1つのコンテンツのみでinputを行うと、どうしても情報や考え方に偏りが生じるため、複数のコンテンツでinputを行うことをお勧めします!
また、効率的に知識を定着させるには、取り組むコンテンツの順番が大切です!
具体的には簡単なコンテンツや丁寧に説明してくれるコンテンツから徐々に難易度を上げていくような取り組み方が良いと思います。
初学者の方は、いきなり過去問に手を出すのではなく、input系のコンテンツを一通り終え、統計検定2級シラバスの内容を概ね理解した状態になってから過去問に取り組むことをお勧めします!
いきなり過去問に挑むと、問題文はもちろん解答を見ても書いてあることが分からないということが往々にしてあるためです。(折角の多くのことが学べるの過去問がよく分からないで無駄になってしまう)
これから紹介するコンテンツについて、個人的に1→2→3→4の順番に取り組むのがオススメです!
コンテンツ紹介
1.Udemy 統計検定®2級対策講座
特に推測統計の分野の説明が非常に丁寧で、私が拠り所としていたコンテンツです
仮設検定の分野では、どんな仮定を使って「どの変数がどの確率分布に従うか」から検定統計量の式にたどり着くまでの説明を順を追って丁寧に説明してくれます。 他のコンテンツでは、「〇〇検定の検定統計量は××です。」といったようにいきなり公式が出てくるものもあります。
上記の流れが分かれば暗記しなくても公式を導くことが出来ます。
また、先に本コンテンツに取り組んでいれば、他のコンテンツで唐突に公式××が出てきても、流れが分かっているので公式暗記よりも定着しやすい状態になっていると思います。
他にも推測統計の分野で、なぜ不偏分散はn-1で割るのか等の各種証明について分かりやすく説明してくれるところも良かったです。
これから紹介するコンテンツ2や3よりも難易度が低く、こちらを先に取り組むと学習が進めやすいと個人的に思います
2.とけたろうチャンネル 統計検定2級講座
これから紹介する中で、特に確率の分野の説明が非常に分かりやすいコンテンツだと感じました
確率の和・積の基本から、「互いに排反」「独立である」等の今後重要になる概念を丁寧に説明してくれます!
また、練習問題が充実しており力試しや復習に役立ちます。
私は過去問を通じて確率統計の分野の実力が不足していると感じた時に、確率の練習問題で復習していました。
とけたろうさんはブログもあり、以下の「【完全網羅】統計検定2級チートシート」は本試験前の暗記で使用していました。
3.統計WEB 基礎編
試験範囲の網羅率が非常に高いと感じたコンテンツです
網羅率が高いため、他のコンテンツでは深く語られてない細かい内容までしっかり説明が書かれています。
仮設検定における検出力、多重性の問題、対応のある/ない/Welchのt検定の使い分け方等、
細かい内容まで理解を深めたいと思ったときに拠り所としていたコンテンツです!(細かい内容とはいえ、本試験では十分に出題される可能性があります)
4.公式問題集(過去問)
input系のコンテンツを理解した後でも、「点数が伸びない」、「点数をもう少しあげたい」という時に役に立つのが過去問を何度も解くことです
統計検定2級の問題に慣れることは重要で、私が初めて過去問にチャレンジした時は、理論は分かるけど全然問題が解けないという事態に陥りました。
問題を解くには、試験問題固有の知識の使い方が必要になることがあり、これは過去問を繰り返し解くことで身につけられます!
また、自分の苦手分野や実力の把握にも繋がり、
苦手分野を知った後で苦手分野を重点的に復習することや、統計検定2級のチャレンジ時期を決めることにも役立ちます。
余談ですが、私は2015~2021年度の公式問題集を使用していました。
5.ヨビノリ 確率統計
統計検定2級対策用のコンテンツではないですが、推測統計を理解したいけど本を読んでも理解が難しいと感じる場合はこちらの動画がオススメです
推測統計を知らない私が最初に取り組んだコンテンツで、とても分かりやすいため推定・検定でやることのイメージを掴むことができました。
動画が程よい長さであることや、冒頭にギャグが挟まれていて和むので、気持ちよく進められると感じました!
また、推測統計で区間推定や検定を行う際に、母分散が既知の場合は〇〇、母分散が未知の場合は〇〇、更に母集団分布が未知の場合は〇〇といった流れで説明が進むため、
今回の問題は〇〇を知りたくて××が未知だから△△の分布を使うのかという手法の使い分け方が身についたと思います。
6.完全独習 統計学入門(副読本として)
1.のUdemyのコンテンツを見ても理解出来ない、知らない概念が多いと感じる場合はこちらをオススメします
記述統計の平均とは?分散とは?から解説してくれて、推測統計の推定・検定の考え方まで超基本を分かりやすく丁寧に解説してくれます!
統計検定2級対策用のコンテンツではないですが、副読本として活用していたコンテンツです。
7.データ分析に必須の知識・考え方 統計学入門(副読本として)
統計検定2級の範囲外の内容も多く含まれますが、2級用のコンテンツよりも分かりやすく解説してくれる箇所もあり、イマイチ分からないところやイメージできない分野の理解に役立ちました
本コンテンツは図が非常に多くて分かりやすくなっています!
例えば、多重共線性は図を用いてとても分かりやすく解説されていて、
多重共線性とはどんな状態になっているのかのイメージ理解にとても役に立ちました。
統計検定2級の対策としては向いていないかもしれませんが、
本コンテンツに取り組んで、仮設検定にはp-hacking等の落とし穴があり取り扱い注意なのだと教訓を得たり、サンプルサイズの決め方が解説されていたり等、より実践的な事が学べるコンテンツだと感じました!
複数のコンテンツに取り組むことで偏りを回避。
簡単なコンテンツから徐々に難易度を上げていくような取り組み方が良い。
input系のコンテンツを一通り終えてから過去問に取り組むこと。
合格までのスケジュール
統計検定2級合格までのザックリとしたスケジュールです。
1stチャレンジまでは、inputに予想以上の時間がかかり、過去問に取り組める期間を1週間しか確保することが出来ませんでした、、、
2度目のチャレンジまでは、1stチャレンジでの基礎の理解が怪しいという感覚から、まずinput系のコンテンツで復習を行いました。その後、これまで以上に多くの過去問に取り組む時間を増やしたことで、合格を勝ち取ることができました
本試験1stチャレンジ
以下の表は、1stチャレンジまでに取り組んだ過去問の得点率です。
2017年11月 | 2015年6月 | 2016年6月 | 2018年6月 | 2019年6月 | 2018年11月 |
---|---|---|---|---|---|
47% | 62.8% | 68.6% | 58.9% | 71.4% | 70.6% |
7割を取れるようになってきた一方、6割を切ることもある若干不安な状態で本試験にチャレンジしました。
受験した結果、1点足らずで不合格でした、、、
あと少しの所まで行ったのに、また振り出しに戻されたような感覚。
そんな絶望感に打ちひしがれながら帰りの電車で景色を眺めていました。
時間が足りなかった訳では無いのにも関わらず、「推定・検定・線形モデルの分野」の正解率が低いため、推測統計の分野を基礎から重点的に勉強し直すことにしました。
初見の過去問で1、2回程度7割取れたとしても本試験で合格出来るとは限らない。
2度目の正直
2度目の正直までに取り組んだ過去問の得点率です。
2016年11月 | 2021年6月 | 2015年11月 | 2017年6月 | 2019年11月 | 2019年6月 (2週目) |
---|---|---|---|---|---|
61.7% | 68.6% | 67.6% | 77.1% | 62.9% | 85.7% |
2018年11月 (2週目) |
2016年11月 (2週目) |
2015年6月 (2週目) |
2016年6月 (2週目) |
2015年11月 (2週目) |
2017年6月 (2週目) |
---|---|---|---|---|---|
82.3% | 73.5% | 91.1% | 76.5% | 94.1% | 88.6% |
1stチャレンジまでに取り組んだ過去問の2倍の数の問題を解きました。
初見の問題は6割を切る事はなくなり、2週目に解く問題であれば7割中盤〜9割は取れるようになった状態で2度目の本試験にチャレンジしました。
点数はギリギリですが、2度目の正直!リベンジを果たすことができました
この2週間はかなり追い込んで勉強した割に6点しか上がっていませんが、1回目の時と全然違うくらいに理解深まった感触があります
inputに目が行きがちだが過去問を繰り返し解くこと(output)は深い理解に繋がる。
統計検定2級受験を通じて得たもの
今回は特に推測統計という分野を学ぶことで、世論調査、視聴率を出す際に行われている事を知ることや、実験結果の示し方についての考え方が変わりました。
具体的には、
私はこれまで実験等で2つの試作の優劣を示す時に、2つのグラフの比較だけで結論を出していました。
統計検定2級受験後は、それだけで結論を出すのは気持ち悪いと感じるようになり、検定を行なって2つに差があることを数学的に示す必要があると感じるようになりました。
他にも学会等の聴講で「分散分析」、「p値」、「被験者30人は欲しい」といったような用語や議論が出てきた際に、統計検定2級を受ける前は理解出来なかったり(あるいはスルーしていたり)したと思いますが、受験後は内容がすんなり頭に入ってくるようになりました!
統計検定2級の学習をしてきて良かったと思います
実験結果の示し方の考え方が変わった。
学会等の聴講で理解できることが増えた。