試験範囲
統計検定準一級
統計検定準一級の試験内容は、大学1年の「統計学」から大幅にレベルアップした内容になります。
正規分布・t分布・F分布が2級の内容であれば
- 多変量解析
- 時系列解析
- 多次元配置データ(ANOVA)
- 質的データ
- ベイズ法
の習得が必要になります。
統計検定一級
学習範囲に関しては準1級と変わりません。下に内容のリンクを張ります。
ただし、出題に偏りがあるため準1級よりも対策は容易です。
1級のみ記述式になります。
- 統計数理(90分) : 理論的な部分
- 統計応用(90分) : 実際に使う
の2科目に変わり
- 医学分野 : オッズ比・ノンパラメトリック法
- 社会学分野 : 時系列分析深化(共和分・ARCHなど)
- 人文科学 : ANOVA・多変量解析深化
- 理工学分野 : 実験計画法
1級と準1級の違い
出題範囲は同じですが、出題頻度から対策の大変さは準1級のほうが高かったりします。
(1級)<(準1級)
- 1級は数理・応用ともに5問中3問選択で良いです。準1級は全分野満遍なく知っている必要があります。
- 1級は出る問題に偏りがある。
1級の出題範囲の偏り
統計数理:
- 確率密度関数から平均・分散を求める
- 2つ以上の確率変数から新しい確率変数を作って確率密度関数を求める
- 「複数の確率変数の最大値」という確率変数についての確率密度関数
が1題以上でています。次に出やすいのは以下になります。
- 最尤推定
- 多変量の正規分布
- 条件付き確率・ベイズの定理・事後分布の導出
- 分散分析(平方和の分解)
サブで知っておいたほうがいいのは
- 十分統計量(最尤推定量の変数となりえる統計量or同時確率密度関数の母数の代わりに置き換えられる統計量)
- チェビシェフの不等式の導出の流れ
- フィッシャー情報量、最尤推定量の分散
- 最強力検定・ネイマンピアソンの定理:尤度比検定+単純帰無仮説のとき検出力が最大になる
積分の計算を間違えやすいので、うまくいかないときは前の設問に戻って計算ミスがないか確認したほうがいいです。
式の途中で+-ミスなども頻発します。異様に簡単に解けるときは考慮不足を疑ったほうがいいです。
統計応用(理工):
- 確率密度関数の平均・分散・モーメント母関数(定義はつけてくれる)
- 最尤推定
- ハザード関数
- ベイズ:事後分布
- 実験計画法:直行表と交絡と分散分析
2019年の理工はかなり難しかったです。
頻出問題
ハザード関数
\begin{eqnarray}
Tを故障時間の確率変数とする\\
f(T)&:&Tの密度関数\\
F(t)&:&故障確率(tまでに壊れる確率)\\
S(t)&:&生存確率(tまで生きている確率)\\
h(t)&:&ハザード確率(tに壊れる確率)\\
\end{eqnarray}
として、
\begin{eqnarray}
Tを故障時間の確率変数とする\\
f(T)&:&Tの密度関数\\
F(t) = \int_0^{t}f(x)dx &:&故障確率(tまでに壊れる確率)\\
S(t)=1-F(t)&:&生存確率(tまで生きている確率)\\
h(t) = f(T|T>t) = \frac{f(t)}{S(t)}&:&ハザード確率(tに壊れる確率)\\
\end{eqnarray}
の関係がある。
「tまでの故障回数」の確率変数を$N_t$とすると、以下の関係がある。
\begin{eqnarray}
&故&障時間T<tならば、1回は故障していることになる。つまり\\
&T&<t \iff N_t \geq 1\\
&F&(t) = P(N_t \geq 1)\\
&F&(t) = 1-P(N_t = 0)\\
&f&(t) = -\frac{d}{dt} P(N_t = 0)
\end{eqnarray}
最後の式は重要である。
次に、$N$回故障するまでの時間$T$を考える。
\begin{eqnarray}
F(t) &:& 故障確率(tまでにn回壊れる確率)\\
F(t) &=& P(N_t \geq n)\\
&=& 1 - P(N_t < n) \\
&=& 1 - \sum_{i=1}^n P(N_t = i ) \\
f(t) &=& -\frac{d}{dt} \sum_{i=1}^n P(N_t = i )
\end{eqnarray}
故障時間と回数の変換
\begin{eqnarray}
&F&(t) = P(N_t \geq 1)\\
\end{eqnarray}
これができるかどうかが解けるかどうかの鍵になります。
過去問:リンク
2012が統計検定1級第一回です。
2012~2014:数理統計のみ
2015~2019:各年3問
学習期間
これまでの学習経緯などを遺します。
<2023/10/15 記入>
お恥ずかしながら、もうすぐ1年経ちます。去年の12月頭から勉強を初めて、1月頭に準一級を受ける予定で対策をして、結局学習範囲の半分も修了できず、40点(60点満点)で落ちました。
原因は多変量解析・時系列解析の範囲までやれなかったからです。
去年の年末は終わってない焦りと河原でクリスマスに食べたスーパーで買ったマグロ巻の味を覚えています。
資格試験は無理な計画を建てないようにしようと思いました・・・
<2023/11/08 記入>
明日、統計検定1級を受けます。
結局その後、準1級は受けずに1級を受けます。
多変量解析・時系列分析などもやったけど1級には使わない(笑)
過去問やってから気づいた(笑)
明日頑張ります。
使用した本
ワークブック
必須級です。試験範囲を知るのにまず必要です。
この本のみで学習しようとすると、ネットで調べながらやることになります。
内容は幅広く、重要な公式を抑えられるという感じです。
この本のみでは無理です。
この本のみではただの暗記になってしまうので面白くないですし、勉強効率も悪いです。
ちゃんと内容の理解・公式の証明まで知りたいならば、後半の書籍も読んだ方が結果的に楽です。
ノンパラメトリック法は、この本のみで学習しました(暗記)。
統計学入門:通称、赤本
大学1年の統計学を理解できていれば無くてもいいです。
理解していれば、ワークブックの該当部分を復習したほうが時間的に早いです。
統計検定2級受験者向けの本
自然科学の統計学:通称、青本
尤度比検定、フィッシャーの情報量あたりからワークブックのみでは辛くなったため読み始める。
この本の内容がそのまま、多変量解析につながる。
ただ、長い・・・ただ読みこなすだけでもかなりの労力がいる。
演習問題に少し誤植がある(自分が間違っているだけかな?)
1級に必要な知識はすべてこの本で十分です。
多変量解析法入門
読みやすくて割といいけど、証明を章末演習問題にするタイプの本。
証明をしないで放り投げている部分がある。
準1級なら必要。
11章MDS以外はわかりやすい。
時系列解析
通称:沖本本
5章単位根検定に入るまでは、なんとかなります。
6章では単位根過程同士には見せかけの相関があることも知っていたほうがいいです。
以降のGARCH,状態モデルは流し読みしました。やってません。
ベイズ
難易度は高いです。MH法・HMC法を理解するのは非常に大変です。
内容
- 事後分布:条件付き確率の演習
- 連続事後分布
- 事前分布の決め方
- 自然共役となるようにした場合の事後分布の計算
- MH法
- HMC法
- 複数の事例に対して実践
やる意味
- ベイズの考え方
- MCMC法(MH,HMC方などの事後分布を計算する手法の総称、全てマルコフ連鎖の定常性を原点としている)
- 統計検定対策としてはやり過ぎ
統計モデリング
通称:緑本。かなり親切な内容であるので、読みやすい。ベイズをやってから読んだほうがいい
内容
- GLM:一般線形モデル
- GLMM:一般線形混合モデル
- AICによるモデルの評価
- MCMCによるモデル更新
やる意味
- AICの意味が理解できる(原理は説明されない)
- 統計モデルの建て方・考え方を知れる
- 読みやすいので時間がかからない
苦悩
<2023 1/15 準1級落ちたときに記入>
ワークブック・過去問ではなく、赤本・青本・多変量解析・時系列解析・ベイズ法まで完全に習得しようとすると、1ヵ月では明らかに足りません。内容を証明したり、章末問題を解いていたら、さらに足らないです。
1回8000円もするので、受験申し込みをする前に前述の本をやったほうがいいかもしれません。
ただ、受験日があるとそこに合わせて勉強をするのでモチベーションにはなります。
個人的には、試験範囲が終わっていないという焦りで辛くなりました。今後は申し込みは準備できてからにしたいと思います。
CBT方式になって、1年間いつでも受けることができますから。余裕を持って受けれます。
試験に受かることが目標ではなく、知識を増やすことが目標
この気持ちは忘れず頑張ります。
<2023 12/19 1級落ちた時に記入>
落ちました。数理統計を受けた段階で半分程度しか自信を持って回答できていなかったため、ある程度は察していましたが、悲しいです。数理応用のほうが通っていましたが、正直こっちも出来は良くなかったです。
原因を考えてみます。
- (2)の段階で詰まっている問題に取り組み続けてしまった
- 時間配分を間違ってしまった
- 受験前の過去問演習の段階で計算が詰まってしまったりすることが多かった
- 勘違いで計算できない積分が出てきたり
- 計算が非常に大変なものがでてきて、正しい方法かどうか自信がなくなったり
- 解法が想定した方法じゃなかったり
書きながら、どう対応したらいいかわからなくなってきました。
今年の数理統計の問題を見返すと全然難しくないんですけど、解いている当時は計算できねぇとなっていました。
Q2(2)でつまずいて、(3),(4)を解かなかったのがとどめだったとも思います。Q2(2)でつまずいた段階でQ2は捨てて、Q4,Q5に挑戦すればよかったです・・・Q4にすれば行けた気がします。
確率密度だけで行こうと思っていると、そこで詰まったときに復帰できなくなるので、他の問題でも行けるという心持ちで挑戦すべきでした。粘ってしまいました。
来年も暇だったら受けよう。