この度、2019年度の統計検定1級(理工学)に合格しました。
去年度までと問題の傾向が変わり、対策の方向性も変わってきたかなと思ったので、学習の履歴ととともに来年度の参考になればと思い、履歴を書き残してみます。
統計検定/統計検定1級とは?
統計検定は、日本統計学会公認の資格で、統計関係の資格では一番メジャーかもしれません。
中学生レベルの4級から、大学専門課程の1級まであり、データサイエンスへの関心の高まりとともに受験者も増えているともっぱらの噂です。
1級は、公式によると、
実社会における様々な分野におけるデータ解析のニーズに応えるための基本的な能力の習得如何を問うものです。レベル的には定量的なデータ解析に深くかかわるような大学での専門分野修了程度となっています。
…と言ってもよくわからないと思うので問題を眺めた印象から言うと、
- 統計学を用いる様々な分野のアカデミックで応用研究を始めるための理論的な基礎が範囲
- 問題の形式・レベルは院試に近いが、回答時間が短め
といった感じで、完全記述で、手計算でごりごり微積させられるアカデミック、かつ理論よりの試験です。
- 「統計数理」…数理統計学の試験
- 「統計応用」…統計学を使った各応用分野(人文科学/社会科学/理工学/医薬生物学のうち1つ選択)に関する問題
の2つの試験が1日の午前午後、各90分の試験時間で実施されます。1級獲得のためには、どちらも合格することが必要ですが、合格基準は公開されておらず、年20%程度の合格率で推移しています。チャンスは年に1回、11月です。
午前も午後も5題のうち3題選択のため、得意な分野の問題を選ぶことができることになっていますが、毎年問題の範囲・難易度のボラティリティが大きいので、解ける大問を選んでいると思ったより選択の余地はありません。さらに院試だったら1科目2時間は普通与えるよなあという分量が出るので、計算の手早さも求められます。
データサイエンス文脈で注目されてはいますが、統計検定はあくまで統計学の試験ですので、統計検定1級に受かったからといって、データ活用の現場に即座に応用できるわけではなく、実応用は実応用で別途実践を積まないといけない感じです。とはいえ、周りの方々の話を聞きますと、一応数理統計を理解しているということを示せる資格だそうですし、大企業でもダイキン工業を始めとして取得を奨励している会社がいくつかあるようです。
学習の履歴
- 理工系修士卒(統計学は使わなかったが、微積は結構使っていた)
- 統計学は数理でない初等統計学の講義を大学1年のときに取っただけ(東大出版会の『統計学入門』レベル)
- フルタイムで全く関係のない分野で勤務中。勤務時間外+土日が学習時間
というスペックで、結果として、学習期間は正味4ヶ月くらいでした。
8月頃:受験しようと思い立ち、先達の体験記を読み込む
ある日、「せっかく理工系出ているし、数学と離れてしまうのも寂しいのでなにか資格でも取りたい」と思い、興味があった統計学を極めようと思い、統計検定を受けることを決意しました。
微積計算がある方が却って解けるだろうという謎の理論で、数式計算がメインの1級を受けようと思いました。
ちなみに、この段階では、受験範囲(ここに載っています)のほとんどを知らない状態でした。
まず、1級の指定教科書を見てみましたが、全然範囲が網羅されていないことが判明。先達の知恵を得るしかないと早々に判断し、Qiitaの記事など、先達の体験記を熟読して作戦を練りました。この記事のアドバイスに従い、統計応用を理工学で受験することも決めました。
8月〜11月:統計数理向けに数理統計学を勉強しつつ手を動かす
受験を決めた時点で、残り時間は4ヶ月強。統計学を1から勉強する必要があったので、「理論をしっかり追う→演習問題で計算を重ねる」という正攻法では間に合わないことは自明でしたので、**「まず例題で計算をして具体例に慣れる→具体例の一般化として、理論を理解する」**という帰納的な学習方針で行くことにしました。
指定教科書は理論先行で、演習量も不十分でしたので、問題が豊富な数理統計学の本が必要だと思い、ネット上の情報をかき集めて選んだのが以下の2冊でした。
1.『リスクを知るための確率・統計入門』(岩沢 宏和 著、東京図書)
ちょうど統計に関わる資格として、試験範囲が結構被っているアクチュアリー試験の受験も考えており、数学の基礎を学べる本としておすすめされていたので取り組んでみました。
確率・統計の本としては珍しく習うより慣れろ式で、理論の記載はほとんどなく例題100本ノックというかなりエッジのきいた本でしたが、今回の目的からいっても、バッチリハマっていた本だと思います。問題選定の網羅感とレベル感が絶妙で、短時間で、確率・統計の典型問題の解き方を手に覚えさせることができたと思います。
2.『現代数理統計学の基礎』(久保川 達也 著、共立出版)
こちらは、きちんとした数理統計学の本で、現代的な視点(特にベイズ的な視点)で書かれているのが類書との違いでしょうか。統計検定1級を意識したという記述もサポートページ等にあり、出題範囲との整合性も高いです。指定教科書がポイントのみの記述となっていることから考えると、本書が(特に「統計数理」は)事実上の教科書といえるのではないでしょうか。竹村本も出版社の解散により、入手困難になりますし…
記述も煩雑なところはバッサリと省略、ポイントだけを簡潔に書いてあるので、理論を学ぶ1冊目として取り組みやすかったです。さらに、演習問題が(統計検定を意識したのか)これでもかという量入っており、サポートページにも略解が公開されているので、演習量を稼ぐための本としても適しています。
過去問・出題範囲表と見比べ、範囲外の章・難しすぎる演習問題は飛ばしつつ典型題は集中的に解くことで、頭を慣らし、問題を解く速さを上げることができたと思います。
受験まで、実際に取り組んだのは実質この2冊でした。確率・統計の典型的な計算をこなせれば少なくとも「統計数理」は合格点まで達することができるので、ここのステップをいかにこなすかが勝負だと思います。
11月〜受験直前まで:過去問を解く&指定教科書で統計応用の内容を抑える
過去問を3年分くらい解きました。上記の2冊の内容で解ける問題で、6割前後と噂される合格点を稼ぐことはできるかと思いましたが、時間がかなりタイトなので、少しでも出題形式に慣れることが大切だと思いました。というわけで、なるべく早めに過去問に取り組むのは大事です。
さらに、統計応用の分野はひたすら範囲が広いので、まずは指定教科書でキーワードを眺めました。理工学の各分野はそれぞれ本1冊仕上げないといけないような内容で焦りましたが、過去問を見る限りは「統計数理」の内容(=普通の数理統計学の教科書の内容)で案外カバーできるので、指定教科書以上の対応は特にしませんでした。
受験当日
受験会場は白金の明治学院大学でした。前はよく通っていましたが、中に入るのは初めてでした。歴史がある大学で、ミッション系ということもあり、おしゃれな建物が並ぶキャンパスでした。
いわゆる大教室での試験でした。時計が設置されていなかったので、腕時計を忘れると焦るので気をつけてください。午前、午後ともに7割くらいの受験率でした。
午前「統計数理」
例年通りのセットという印象です。問題5に若干見慣れぬベイズ統計の問題が出ましたが、ベイズの定理を知っていれば後は問題文に従って計算をしていくという問題でした。
改めて思いましたが、計算量の多い微分積分が多分に含まれるので、計算ミスをしないで時間の無駄なく解き進めることが肝だと思います。計算練習の量をこなすことがかなり大事だなと思いました。
午後「統計応用(理工学)」
統計検定1級(理工)の感想。 pic.twitter.com/jnZnuHNtT6
— データサイエンティスト転職見習い (@tensyokutsurai) November 24, 2019
統計検定1級応用(理工)の試験前と試験後 pic.twitter.com/P7e2cXRove
— ひさ (@hisagrmf) November 24, 2019
…ということで、前年までの確率分布の処理でゴリ押しできたセットから変わり、方や前提知識がガッツリ必要、方や頻出分野に見えて数学ヘビーな問題となり、取り組みづらいセットでした。途中退出も非常に多かったです。そんな「ハンター試験」、具体的にセットを見てみると…
-
問題1:生存時間解析(これを選択)
- 頻出ではありましたが、前半に論証問題、[3]はハザード関数の意味を問う問題と普段と違う形の出題形式で取っつきづらさがありました。[4]は独立で解ける計算問題でした。
-
問題2:品質管理手法(これを選択)
- あまりお目にかかることのない品質管理分野からの出題でした。問題文の字数が多くいかつく見えるのですが、実はよく読むと問題文の知識だけで解け、しかも計算量は少ないという実はお得な設問だったりします。これを選んだのが私にとっては合否を分けるポイントだったかもしれません。
- 問題3:実験計画
- 正直対策してなかったので難易のほどはわからず。。。
- 問題4:時系列分析
- ガッツリ線形代数の計算があり、後ろも計算量が多そうなので、最初は選択しようと思いましたが撤退しました。
-
問題5:適合度検定(これを選択)
- 前半は頻出の適合度検定、後半はラグランジュの未定乗数法の計算問題でした。時間がなく、最後までたどり着けませんでした。。。
大問の後半に紛れている前半と独立で計算をするだけの問題を先に片付ける&問題2を短時間でこなすという作戦で、なんとか点をかき集めるのが精一杯でした。
今年の統計応用は、理工学が他の分野に比べて問題が統計数理に寄りすぎていたことを気にかけて傾向を変えてきたのでしょう。おそらく平均点がかなり低くなったので、調整がかかって例年より緩めに合格が出たのではと思われました。
来年度以降も同様の傾向が続くかわかりませんが、もはや、統計応用はきちんと学習することを前提に、とりあえず理工学、ということではなく、指定教科書でキーワードを眺め今の自分に一番親和性の高い分野を選ぶことが一番なのかもしれません。例えば、マーケティングデータを扱うのであれば、人文科学を選ぶのが良さそうです。
合格&受験を終えて
IELTSと運転免許しか履歴書に書けるものを持っていない私にとって、まずは合格でき、数理系の資格を取れたというのはとても嬉しかったです。統計データを見たときも、これ何分布に従うだろう、どんな分析手法使ったのかななどと、受験勉強を始める前とは違った見方でデータを捉えることができるようになった気がします。今後も学習を進め、自信を持って現場でデータの統計学的処理をできるようになればと思っています。
1級は出題範囲や問題の傾向にボラティリティがある試験なので、どうしても当日の当たり外れがありますが、統計学の学習のベンチマークとしては、アクチュアリー試験(数学)とともに今後も重要な位置を占め続けるのでしょう。キャリアの箔になるかと言われるとまだまだという気もしますが、是非受験を検討されてみてはいかがでしょうか?