はじめに
1回目は58点で不合格に惜しくも不合格になってしまいましたが、猛勉強の結果、一週間後に最優秀賞合格することができました!この試験を通して自分なりに考えたことや思ったことがあるので、誰かのために(将来の自分のためにも)なればと考え記事に残します。
結果からわかる通り、多変量解析法に関してはまだまだ理解が薄い部分も多いので、今後も研鑽を積んでいきます!
小話
2回目の試験当日に「確率と確率分布」が60点、それ以外のセクションではすべて満点という夢を見ました。もう少しで正夢にできましたね。
想定する読者
- 受けてみたいけど明確なメリットがわからない…
- 勉強はしているけど難しすぎると感じている…
メインターゲットとしては、
「少し数学はできるけど統計検定準1級は難しいよなあ…でも取得しておくべきと言われているしなあ…」
と考えている人に向けた記事です。
自己紹介
- 23歳(25卒)
- 国立理系大学院生(ネットワーク系専攻)
- データサイエンティスト職で内定取得済
- 統計検定2級は2023年2月(約一年前)に合格
- その他データサイエンティスト系の資格取得済
つまり「少しデータサイエンティストをかじった理系」と考えていただけたらと思います。試験勉強の前までは難解な数式に対してはかなり苦手意識があり、今考えれば資格取得へのハードルがやや高かったのではないかと思います。
今回はそのようなが感じた 資格取得するメリット と 勉強方法 を記述します。
※ 少しラフ目に書いています、ご了承ください。
目次
- 統計検定準1級とは
1.1 概要
1.2 合格に必要な能力
1.3 私が考えるメリット - 1回目の試験までの勉強法
- 反省
- 2回目の試験までの勉強法
- まとめ
1. 統計検定準1級
1.1 概要
統計検定準1級は、一般財団法人統計質保証推進協会が実施している統計検定の中で、1級に次ぐ難易度の高い資格で、2021年よりCBT方式で行われています。
出題範囲などは以下の通りです。
出題範囲 | 「変数と確率分布」「統計的推測」「多変量解析法」「種々の応用」 |
合格水準 | 100点満点で60点以上 |
合格率 | 約20% |
詳しくは以下の統計検定のサイトを確認してください。細かな出題範囲や問題数などが記載されています。
統計検定準1級
1.2 合格に必要な能力
統計検定準1級では非常に複雑な式や概念的で理解しにくい説明が多数あります。それらを乗り越えるために必要な能力があります。ここではそれらについて主観を交えつつ紹介していきます。
わからない言葉をすぐ調べる力
ほぼこれに尽きます。 統計検定準1級の公式ワークブックではすべての出題範囲を網羅的に説明しているのですが、ひとつひとつ語句や式の説明が少なく、知識が何もない状態で読むと何も理解できません。 わかる人は統計検定準1級ノー勉で合格できます。 ここで特に大切になると思ったのは、 「自分に嘘をつかずわからないことはわからないと割り切って調べること」が大切です。
行列の基本知識
数式を理解する上でこの能力が必要になってきます。基本的にワークブックではベクトルではなく行列で話が進んでいくためこの能力が必須と言えます。行列を完全に理解しきれていなくても、わかりやすく説明されている本がありますので、後ほど紹介いたします。
アウトプットする能力
自分でいくら理解していると感じていても、問題は解けないことが多いです。実際に言葉に出したり説明したり、問題を実際に解いてみたりすることで、正しく理解できていない部分が多くあると感じることができると思います。
「わからない言葉をすぐ調べる力」を強調したいがために作ったといっても過言ではないです。それほどまでに重要ですので、今後勉強される方は参考にしてみてください。
1.3 私が考えるメリット
一番のメリットは 「統計学の入り口に立つことができる」 ことだと考えています。私自身、統計検定2級のみを持っていた時にはわからなかったような話でも、準1級を勉強することで理解することができるようになったと感じています。特に分析手法(主成分分析や時系列解析)に関しては「Pythonで実行できるものの、仕組みは理解していない」状態だったものが、「こういう仕組みでこのような出力が得られているのか」と理解できるようになりました。
統計の話がわかるようになれば以下の3つのメリットが生まれてきます。
- プログラミングの出力結果から解釈の説明ができるようになる。
- 最新の論文や記事などの数式や語句を理解することができる。
- 統計学の面白さに触れることが出来る。
資格はあくまで資格であり、 「実際に生かすことができなければ意味がない」 ので、上記の1つ目のメリットは特に重要だと考えています。この資格を通じてどのようにビジネスに貢献できるかを考えることは難しくないと思います。
2. 1回目の試験までの勉強法
1回目の受験は2024年の3月の終わりに受験しました。勉強の開始は同年1月からでした。
使用した書籍等を記載したのち、それらを用いた勉強法を記載します。
使用した書籍等
1. 統計学実践ワークブック
ワークブックがすべてであり、最大の難関です。しかし逃げてはいけません。このワークブックからしか出題されません。
2. 統計検定 準1級 公式問題集
過去問が全6年分収録されています。ただし、この過去問はCBT方式ではなくPBT方式の問題です。また、本書のみでは解説が分かりにくい部分も多いので、 「あつまれ統計の森」 を参考にすることを強くおすすめします。
3. 多変量解析法入門
多変量解析についての本です。行列ではなくベクトルで記載している部分が多く、理解しやすい一冊です。多変量解析の知識が不足しているならばこれをとりあえず読みましょう。
4. 入門 統計学(第2版)
統計学全体の雰囲気を学ぶことができます。初学者でも理解しやすい内容のため、必ず読みたい一冊です。これを読むのが早ければ早いほど、この後の理解が楽になると思います。
5. データ解析のための統計モデリング入門
通称「緑本」です。一般化線形モデルや確率分布に関する知見を広げることができる一冊です。
6.Yuya Kawaguchi
ワークブックの例を基にわかりやすく解説しています。ホワイトボード一枚にとても分かりやすくまとめられており、簡単に理解することが出来ます。
7.【完全網羅】統計検定準1級チートシート
神のチートシートです。 見ればわかります。
勉強の進め方
まずワークブックを1周したのですが、何もわかりませんでした。 諦めることも脳裏にちらつくほどでした。 まずは、「尤度関数」や「モーメント母関数」など「よく登場するな~
~」と感じたワードに注目し、それらの理解から始めてみました。「わからない言葉をすぐ調べる力」を発揮しつつ理解してますね。
ワークブック2周目はそのおかげか、比較的早く読むことができました。
ワークブック2周目が終わった後は過去問を解いてみました。が、 まったく解けません。 そこでますは、3年分くらいの過去問でどのような問題が出るかの傾向把握のために全く解かずに眺めました。
その分析結果から、 すべての語句や式をもっと深いレベルで理解する必要がある ことに気が付きました。
そこで上記3~5で紹介した本を読みました。ワークブックに記載されていないようなことまで学ぶことが出来ました。
その後はワークブックをひたすら反復して読みつつ、過去問の傾向や解法などを理解していきました。2015年の過去問は模擬試験として解いたのですが、70点程度取れたため少し慢心していました。
本番直前にはとけたろう先生のチートシートで、モーメント母関数や共役事前分布などの覚えにくい事項を確認していました。
3. 反省
結果は…
2点届かず…ガーン。
自信があっただけにかなりショックを受けました。 油断したせいだぞ、俺。
セクション分析を見てわかる通り、「確率と確率分布」と「多変量解析法」が60%を下回っています。この2セクションを強化すれば必ず受かると考え、次回までにこの点を強化すると決めました。
「統計的推測」は何とかなるだろうし、「種々の応用」も覚えるだけなので重視しなくても上がるだろうという楽観的観測で勉強しています。
4. 2回目の試験までの勉強法
2回目は1回目の受験の1週間後に受験しました。
1回目の結果を受けて以下のサイトを使って重点的に勉強しました。
使用したサイト
1.AIcia Solid Project
日本で最もデータサイエンスに貢献しているVtuberです。解説動画は非常にわかりやすく何回も視聴しました。時系列解析や主成分分析の動画はとても良いコンテンツです。
2.Able Programming
サポートベクタ周りはこちらで学習しました。導出の方法や理論等がわかりやすく解説されています。
勉強の進め方と結果
「多変量解析法」は、上記2つの動画を中心に 多変量解析の気持ち を理解していきました。特に最小二乗法の導出方法やその特性、意味合いなど理解することに大きく勉強時間に割きました。
「確率と確率分布」は、ネット上で大学の試験の過去問や、ここに書ききれないほどたくさんの本の問題を解きました。例えば、東北大学の統計学の期末試験問題を解きました。
その他のセクションに関してもワークブックを細かく読むことで復習しました。この勉強をしていて感じたのですが、 重要な語句の説明だけでなく、その説明が終わった後の一言が重要 だと感じました。例えば、第13章「ノンパラメトリック法」内の「ウィルコクソンの順位和検定」に関して、サンプル数が大きい場合には正規分布近似が使えるといったことです。
本番直前はとけたろう様のチートシートを食い入るように見ていました。
結果は最初にも示した通り85点で合格することが出来ました。
細かい特性の理解ができた結果、大きく点数を伸ばすことが出来たことが分かりますね。
5.まとめ
最後にメリットと学習ポイントをまとめたいと思います。
メリット
- モデルの説明ができるようになる。
- 最新の統計の論文などの話についていくことが出来る基礎能力を身に着けることが出来る。
- 基礎だけではなく機械学習などの本格的な話が増えてくるので、統計の面白さを体験できる。
学習ポイント
- わからない語句はすぐ調べる。
- ワークブック内の解説を細かく理解する。
- ワークブックに登場する語句のワークブックに書かれていない特性を理解する。
私はこの検定に合格したことで統計の面白さに気づくことが出来ました。今後は時系列に特化した勉強も進めていくつもりです。皆様もぜひ統計の面白さに気づくために受験してみましょうね。
応援しています!!!!
ここまでご覧いただきありがとうございます。沢山のコメントお待ちしています。
それではノシ
※更新情報
2024/4/7 最優秀賞獲得であることの追記