目次
1.はじめに
2.雑感
3.統計検定の勉強を始めるまでの背景
4.学習履歴
5.勉強不足だと感じたこと
6.おわりに
1.はじめに
今回初めてQiitaに記事を投稿します。ネッシーと言います。
2022年3月25日に統計検定準1級を、2022年11月21日に統計検定1級(数理統計・統計応用(社会科学))を受験し、両方合格することができました。この記事では、どういう勉強をしてきたかという備忘録と、両試験の感想などを残そうと思います。
なお、前提として統計応用は社会科学を受けておりますので、それ以外の分野とは違いがあるかもしれません。
2.雑感
統計検定1級の公式ページに記載されている実施趣旨では、次のようにあります。
準1級までの知識を基に、それらをさらに発展させ、実社会における様々な分野におけるデータ解析のニーズに応えるための基本的な能力の習得如何を問うもの。レベル的には定量的なデータ解析に深くかかわるような大学での専門分野修了程度。
これを見ると統計検定1級は、「統計検定準1級よりも難しい」という印象を受けるかもしれませんが、受けた感想としては準1級も1級もそれぞれ別の能力を測っているように思えました。
統計検定準1級は統計学・確率論だけでなくデータ分析や機械学習に関する幅広い知識も要求されていました。しかし、統計検定1級は、確率論・統計学に関する深い理解を要求されていましたが、データ分析・機械学習に関する知識はさほど要求されておらず、確率論・統計学の問題だけできれば、合格する事が可能なんじゃないかという印象を受けました。
3.統計検定の勉強を始めるまでの背景
私は数学科の学部を卒業し、その後数学系の大学院へ進学しました。
学部から大学院を通して幾何学を専攻しており、統計検定の勉強を始めるまでは確率論や統計学についての知識は持ち合わせていませんでした。そのため、統計検定1級のための勉強はいちから確率論・統計学の勉強をするところから始めました。
学部四年間は数学を学んでいたということもあるので、
- 多変数解析(多変数の場合の微積分)
- 測度論・ルベーグ積分論
についての知識はある程度持ち合わせていたため、数理統計学・機械学習の勉強でつまづきにくかったということもあるかと思います。
4.学習履歴
ここでは実際に自分がどのような学習をしてきたかについて時系列順に記載します。
2021年9月頃
友人がデータサイエンティストとして就職したことをきっかけに, 数理統計学の勉強会が始まりました。その際、使用した本は現代数理統計学(竹村彰通著)でした。
この本は決して数学科向けに厳密に書かれた本ではないのですが、「数理統計」という分野について丁寧に幅広く解説されています。
実際に統計学を数学的に理解していくとなると、かなり高度な確率論・測度論の知識が必要になるため、数学科でも解析が非専門の学生はある程度お気持ちで理解していったほうがいいと思います。そういう意味では、この本は非常に勉強しやすく、数学科を背景に持つ方にもおすすめします。
その後、2022年4月中旬までの8ヶ月間は継続してこの本を輪読しながら学習していました。
2021年12月中旬
上記の本の確率・統計学パートは概ね読み終えたので、統計学実践ワークブック(日本統計学編)を購入し、統計検定準1級の対策をはじめました。また、こちらの学習は輪読ではなく個人で行っていました。
この本の13章までは、上述の現代数理統計学で概ねカバーできたので、後半の14章から32章までを中心に学習していました。
しかしながら、この本1冊だけで準1級の出題範囲について理解をすることはほぼ不可能だったと思います。基礎的な問題は解けるようには多少はなるかと思いますが、きちんと理解しようとなると、各章ごとに一冊ずつ専門書を読まなければならないように思います。
この本で一通りは勉強しましたが、全然十分ではなかったかと思います。しかし、準1級は合格最低点が60点で、うち50点は確率論・統計学が出題されます。それ故、(20点分ぐらい応用分野で解けるようになれば合格できるな)と考え、この本以上に専門的なことには踏み込まずに試験に臨みました。
2022年3月25日
この日、私は統計検定準1級を受験しました。現在準1級の試験はCBT方式となっており、試験会場でPCに答えを入力していました。
筆記用具は使用不可で、代わりにラミネート加工されたA4用紙とホワイトボードマーカーを渡されました。めちゃめちゃ使いにくかったです。ラミネート加工されたA4用紙は何枚でもいえばもらうことができました。
試験終了後、結果はその場で表示されるのですが、100点満点中71点で通常合格でした(合格点は60点以上)。
また、余談なのですが、結果が表示される際に「合格おめでとうございます。」とわざわざ書いてあって、それがちょっと嬉しかったので試験監督の方に許可をもらって結果画面を撮影しました。
同教室で他に受験してた人は、みんな終わったら即座に帰っていましたが、うれしくなかったのかな。それともみんな不合格だったのかな。どっちなんでしょう。
2022年4月末
現代数理統計学を読了したため、多変量解析入門ー線形から非線形へー(小西貞則著)の輪読を始めました。
統計検定準1級の反省点であった、応用分野の理解の浅さということもあり、重回帰、ロジスティック回帰、判別分析、SVM、クラスタリング等々、機械学習分野に関して幅広く書かれた本書の学習を始めました。
準一級の機械学習分野の対策として、本書はかなりお勧めできると思います。というか、統計検定準一級の勉強をする際にこの本を読んだ方がよかったと感じました。
一方、こちらの本は統計検定一級とどの程度関わっているかについてはよくわかりません。
少なくとも社会科学の分野は、この本と関係するのは序盤の回帰分析だけでした。
なので、一級の対策に最適とは思っておらず、他に良い本があるんじゃないかと思います。
こちらの本は、2022年の8月末ごろまで輪読していました。
2022年9月初旬
統計検定1級の申し込みを行い、本格的な1級対策を行っていきます。
まず去年の過去問を見て、応用分野でどの分野を選択するかについて友人たちと議論していました。
2021年度の過去問は、社会科学か人文科学が簡単そうであり、また自分が社会科学に対してなんとなく興味を抱いていたので、応用分野は社会科学を選択しようとなりました。
過去受験された方のブログを見ると、「理系は迷わず理工学を選択しろ」と書いてあったりしますが、合格することが目的なら、間違いなく過去問を眺めて簡単そうなものを受験したほうがいいと思います。(理系にもいろいろありますし、一緒くたにしてしまうと後悔すると思います。特に数学科とかは理系の中でも実験が無かったり異質ですし。)
1級対策ですが、私が実質的にやったのは過去問の演習だけでした。
初めのうちは「過去問2021年から2012年度まで、すべての過去問を演習しよう!!」と思っていたんですが、新しい知識を身に付けている感覚もなく、同じような問題を唯々解いていくのはかなりの苦行です。(試験対策って、こういう厳しさが一般にあると思いますが。)なので、2017年度までの4年分(2021, 2019, 2018, 2017)で飽きが来てしまったため、それ以上の事はやりませんでした。
また、試験時間は90分ですが、これはかなり短く感じます。記述慣れ・計算慣れをするために、過去問は2週しました。
2022年11月20日
試験当日。
午前中は統計数理でした。
試験時間ギリギリなので、できそうでも計算に時間を取られるくらいなら別の問題を選んだほうが良い場合もあります。ペース配分には気を付けましょう。
また、5問中3問を選択するのですが、どの問題を選択するかもかなり重要です。全体的に楽そうな問題を選んで記述していきましょう。
試験の出来は8割程度でした。
一方で午後の統計応用(社会科学)は、予想通りに行きませんでした。
- ほぼ毎年出ていた、「層化抽出法」に関する問題が出題されず、
- 例年簡単だった「条件付確率」に関する問題が難化(というか、【平均への回帰】というよく知らないワードが出た)し、
- 出題する事を期待していた「ポアソン分布」に関する問題も出題されず、
- 「ラスパイレス指数」とかいうよくわからない経済学の用語が出題され(しかも定義さえ知っていれば簡単だったらしい)、
とにかく山を外しまくりました。定期テストみたいなことしてますが……。試験自体は、できる問題が消去法で3問しかなかったので、泣く泣くそれらの問題を解きました。甘めに見積もっても、出来は6割弱程度だったように思います。
統計検定1級は合格最低点が公開されておらず、結果発表までかなりドキドキでした。
いつ結果が発表されるかもわからなかったので、ツイッターで試験結果の発表日の傾向について調べ、大体12月20日付近の月曜日の昼頃に結果発表されることから2022年12月19日(月)に発表されるだろうと予測し(実際この予想は的中した。これこそ統計学の学習で身に付けたスキルである。)その日まで毎日公式ページを訪れていました。
2022年12月19日
統計検定の結果が発表されました。
なんとあれだけ不安だった統計応用(社会科学)は優秀賞!
さらに、統計数理は最優秀賞でした!
今年度は、統計応用(社会科学)は全体的に難化していたのでしょう。そしてみんなラスパイレス指数は知らなかったのでしょう……。結果的に優秀賞をとることができてよかったです。
5.勉強不足だと感じたこと
統計検定準1級
確率論・統計学分野は、「現代数理統計学」でカバー可能でしたが、機械学習分野・その他応用分野については「統計学実践ワークブック」の勉強だけでは足りませんでした。機械学習分野についてはさらに掘り下げて、「多変量解析入門ー線形から非線形へー」も読むこともお勧めします。
統計検定1級
応用分野に関して深堀りして学習することができなかったことは後悔しています。
- 時系列解析
- (幅広い)経済学
この2分野についてはさらに深堀りして学習するべきだったと考えています。そのほうが、より安全圏での合格を勝ち取ることができると思います。
おすすめの本というわけではなく、こういうのを勉強するべきだったという本を上げると、時系列解析入門(北川源四郎著)や計量経済学(西山慶彦,新谷元嗣,川口大司,奥井亮著)について学習してもよかったかとは思っています。
6.おわりに
ここまでご覧いただきありがとうございます。
こちらの記事が、今後、統計検定準1級・1級を受ける誰かの力になれば幸いです。
また、一緒に数理統計の勉強をし一緒に1級を合格した数学野郎も記事を投稿しているので、もしよろしければご覧ください!→統計初心者が1年で統計検定1級に合格した話