皆さんこんにちは!
今回のお題ですが、私@2626が、統計検定準1級に合格するために取り組んだこと&苦労したことを紹介できればと思っております。このような試験奮闘記が出てくると、必ずと言っていいほど「文系」という言葉が出てくると思います。今回はそれに負けじと、敢えて「理系」側の人がこのような記事を書いてみました。
タイトルの通り、「理系」出身であった筆者であってもこの試験勉強はかなり苦しみました。文理問わず、是非一読いただければ幸い。
この記事を見て、ひとりでも資格の勉強に役立つ人が出てきてくれたら幸いです。
はじめに
本記事は下記で構成されています。
- 試験結果
- 受験者の前提知識
- 統計検定とは?
- 実際に取り組んだこと
- 受験した感想
試験結果
正直あまり褒められた成績ではないですが…。まぁ合格したので良しとしましょう。
受験者の前提知識
某大学院で数学を専攻していました(修士卒です)。これだけ聞くと、「この記事読んでも参考にならんやん!」というツッコミをしてしまうかもしれません…。しかし、よく言われるのですが、数学を専攻している大学生は統計をしません!
もちろん、統計を専門に研究されている方もおられるので、全ての数学専攻の学生に成り立つことではないですが、ほとんどの数学専攻の学生は統計をしないのです。まぁ人より数式を見慣れているというのはありますが、数式に慣れ過ぎたあまり計算も苦手です。(四則演算むずない?)
ちなみに統計検定2級は、統計検定準1級を受験した6年前に一応合格していたのですが、ほとんど忘れておりました。
統計検定とは?
統計検定とは?
統計検定のホームページを確認すると、下記のように書かれています。
データに基づいて客観的に判断し、科学的に問題を解決する能力は、仕事や研究をするための21世紀型スキルとして国際社会で広く認められています。この国際的社会に通用する統計の知識・技能やその活用能力を評価・認定する検定試験が、日本統計学会によって開発された「統計検定」です。
メリット
統計検定を受けることによって、下記のようなメリットがあるといわれています。
- 「統計学」の基礎が身につく
- 学術的な質保証
- 幅広い応用範囲
統計検定の種類
統計検定には3つの種類があります。
- 統計検定(1級、準1級、2級、3級、4級)
- 統計調査士(統計調査士、専門統計調査士)
- データサイエンス(基礎、発展、エキスパート)
受験方式・方法
統計検定は、1級を除いてCBT方式です。試験会場を自分で選択しますが、会場によって利用できる日にちや時間はバラバラなので、各自お近くの受験会場をお調べください。筆者の場合は平日しか空いておりませんでした。会場では、PCを操作して選択肢から正しいと思う答えを選択して解答します。
計算用紙やペンは用意いただけましたが、電卓は各自用意する必要があります。当然ながらスマホを電卓にすることはできませんので、各自買いましょう。後述の通り、問題数の割に試験時間が短いので、電卓はそれなりに使いやすいものをおすすめします。
統計検定準1級について
ここからは統計検定準1級について簡単に説明してまいります。
まず、統計検定準1級のホームページを確認すると、下記のように書かれています。
ビッグデータ時代の到来とともに、統計的な考え方を身につけ統計学の様々な手法を正しく理解して、現実の諸問題の解決に役立てる力がますます求められる時代となりました。
…
(中略)
…
統計検定準1級は、統計検定2級までの基礎知識をもとに、実社会の様々な問題に対して適切な統計学の諸手法を応用できる能力を問うものです。
統計検定準1級は、統計検定の中でも「大学の専門課程レベル」に相当するものであり、かなり難しい部類に入ると思います。実際、テスト範囲も膨大です。
25問~30問の出題に対して時間は90分しかありません。よって、3~4分で1問を解く必要があります。60点以上/100点満点で合格になるので、頑張りましょう。
勉強に利用した本・Webサイト
次に、どんな本を利用して勉強したのかが皆さんに共有したいと思います。
統計学実践ワークブック
まず1冊目が「統計学実践ワークブック」です。
公式が出版している本なので、これを勉強すれば間違いありません。が、この本は1冊に全てのテスト範囲を網羅することを目的としているのか、あらゆる説明が省略されており、これだけを利用して理解するのはかなり難しいかもしれません。とはいえ、マストで買う必要がある本だと思います。
統計学入門
東京大学から出版されている、いわるゆ「赤本」です。
入門とありますが、さすがに初心者には難しいと思います。しかし、統計検定準1級をこれから受験しようとする方には、ちょうどいい難易度ではないでしょうか?テスト範囲の大項目において、「確率と確率変数」「種々の確率変数」「統計的推測(推定)」「統計的推測(検定)」「回帰分析」あたりはある程度網羅できるように思います。
統計検定準1級公式問題集
こちらは過去問が収録されています。考え方や方針を身に着けるために複数回解きました。解くだけなら答えを覚えてしまうのですが、解くまでの仮定や考え方を身に着ける上で非常に参考になった本です。
データ解析のための統計モデリング入門
こちらは、いわるゆ「緑本」です。
計算問題は無いです。ただ、この本を読むことで「一般化線形モデル」「階層ベイズモデル」「MCMC」のような確率モデルについての理解が深まることは間違いないです。また、比較的ストーリーのように話に繋がりがありつつ少しずつ難易度が増していく構成になっているので、非常に読みやすいと感じていました。
次からはWebサイトやYoutubeチャンネルの紹介です。非常に勉強になるものばかりですので、読者の皆さんも是非足を運んでみてください。
Syleir’s note
こちらは本ではなくWebサイトです。時系列解析、生存時間解析、MCMCなどが詳しく書かれており、式の導出など含めて、非常に分かりやすいサイトです。
あつまれ統計の森
こちらは過去問の解説が分かりやすく掲載されております。統計検定準1級公式問題集では省略されている部分も詳細に書かれており、非常にためになるサイトです。
はじめての統計学
こちらは統計学について詳しくまとめられた、Youtubeチャンネルです。こちらは、統計学で出てくる式や理論が動画形式で分かりやすくまとめられているので、分からない用語等があるときに重宝しました。
AIcia Solid Project
同じく統計学について詳しくまとめられた、Youtubeチャンネルです。こちらも式の導出や式の解釈を分かりやすくまとめてくださっております。他の動画も面白いので普通にチャンネル登録しました。
実際にやったこと
3か月~2か月前
合格したのが3月26日ですが、1月1日から勉強を始めました。まずは、「統計学実践ワークブック」を読み進めます。章末に問題があるので、必ず解くようにしましょう。
筆者はまず、理解することより全体像をつかむために、ある程度の段階まできたら次の章に進んでいました。定義や重要用語が淡々と並んでいるだけなので、これだけで理解するのは結構難しいです。特に、計算するための式は突然出てきます。全部暗記できれば苦労しないですが、そういうわけにはいかないので、自分で式を導出できるようにしていました。
2か月~1.5か月前
「統計学実践ワークブック」を読破したところで、「統計検定準1級公式問題集」に書かれている過去問を解いてみます。このとき、解けるまで頑張るのではなく、時間を測ってできる範囲で解くようにしていました。当然ですが、この時点ではあまり解けないと思います。
ただし、解説はちゃんと読みます。過去問は同じ問題が本番で出るわけではないので、問題を覚えるのにそれほど大きな意味はないと思っています。一方、解くまでの考え方は本番でも重要になってきます。「求めたい値は●●だから問題文に書かれている●●の情報を集めて、●●の計算をしないといけないな」という考え方です。問題文からそれがイメージできると理想的ですね。
より具体例を提示しましょう。ここでは「ダービン・ワトソン比」というものを取り上げてみます。
ダービン・ワトソン比は
$$
\frac{\sum_{t=2}^T (e_t - e_{t-1})^2}{\sum_{t=1}^T e_t^2}
$$
で表される式です。
さて、これだけ見たところで覚えるのは中々難しいでしょうし、これだけだと何のための式なのかわかりません。そこで、知られている事実をいくつか列挙してみます。
- ダービンワトソン比は、ダービンワトソン検定をするときに用いられる検定統計量である
- ダービンワトソン検定は回帰分析をしたときに、誤差項同士に自己相関があるかどうかを検定する
- ダービンワトソン比は2に近いときに帰無仮説(自己相関係数が0)を受容し、2より十分小さければ帰無仮説を棄却する
- 誤差項同士に自己相関があるとOLS(最小二乗法)を使った回帰分析において、各誤差が独立であるという仮定に反する
- OLS(最小二乗法)は、いくつかの仮定を満たせば、その推定量はBLUE(最良線形不偏推定量)である
言葉の意味はあまり良く分からなくてもいいですが、これらの事実を知っていればダービンワトソン比は
- 誤差項同士に自己相関があるかどうかを検定するための値
ということは分かると思います。また
- ダービンワトソン比は2に近いときに帰無仮説(自己相関係数が0)を受容し、2より十分小さければ帰無仮説を棄却する
については、式の変形をすることで導き出すことができます(数式の羅列になるので、ここには記載しません)。
このような理解の仕方をすることで、ダービンワトソン比を使うような問題に出会ったとき、適切に解答を導くことができるのではないかと思います。
1.5か月~前日
「統計学実践ワークブック」をもう一周しました。前回と違うのは、今回は既に全体像をつかんでいるので、できる限り理解するように勉強していきます。この際、分からないところを「赤本」「緑本」や紹介したWebサイト、Youtubeチャンネルで補うようにしていました。
その後、「統計検定準1級公式問題集」を再度解きます。1周目は時間を測らずにできるだけ理解するまで取り組み、2周目は時間を測って解きます。同じ問題なので、選択肢や簡単な計算の結果は覚えているということもありましたが、合格に非常に役立ったように思います。
「統計検定準1級公式問題集」を解き終わっても、まだ2週間くらい間隔があったので、「統計学実践ワークブック」を再度一周しています。この頃には問題に慣れてきて、9割くらいは解けていたように思います。
前日
前日は体をゆっくり休めました。ちゃんと栄養のある食事をして、ちゃんと睡眠をしましょう。あと電卓は必ずカバンに入れておきましょう。
本番
規約上、どのような問題が出題されたかは言えません。が、意外と公式ワークブックの隅に書かれている公式が出てくることに注意してください。名前は知っているのに式が思い出せないということがいくつかありました。
問題数が時間の割に多いので、分からない問題はチェックを付けて早めに飛ばします。実際筆者が全て解き終えたのも80分程度経っておりましたので、ほとんど見直しの時間はないです。
ただ、解答が選択肢になっているので、途中で明らかに出てこないであろう解答があったりします。例えば選択肢が
- $\sqrt{2}$
- $-\sqrt{2}$
- $\sqrt{5}$
- $-\sqrt{5}$
だとして、計算の途中に $\sqrt{2}$ が出てきたら、「$\sqrt{5}$ の選択肢はないな…。」と考えることができると思います。このようなイメージで最後まで計算しなくても、選択肢を狭めることができるので、選択肢を上手く活用してください。
結果
上記の通りです。最後まで答えが分からない問題もあったので、一部カンで選択肢を選びましたが、無事合格できてよかったです。
感想
かなり難しく、範囲も広いので「統計検定1級より難しい」と言われていたりもしますが、さすがにそんなことないと思います。ただ、準1級でもかなり難しい部類に入るので、勉強時間はかなり必要だと思います。
実際に筆者の場合、明確に測っていないので何とも言えないですが、150~200時間程度の勉強時間を費やしていたように思います。
これを学んだことによって、業務に生かせているかと言われると「?」な部分もありますが、少なくとも機械学習やAIの勉強をする上で、その感覚を養うのに役立っていると思いますし、何より筆者のような数学オタクには、数学の魅力や難しさを改めて知ることができてよかったと感じております。