統計検定準1級の全体構造
統計検定準1級の内容は、大きく分けると次の6分野に整理できます。
| 分野 | 役割 |
|---|---|
| ① 確率論 | 確率を計算する土台 |
| ② 数理統計 | パラメータを推定する理論 |
| ③ 統計モデリング | 変数間の関係をモデル化する |
| ④ 多変量解析 | 多数の変数の構造を整理する |
| ⑤ 確率過程・時系列 | 時間変化する現象を扱う |
| ⑥ 応用統計 | 現実データに統計手法を適用する |
B1, 確率論(Probability)
分布が完全に既知の世界
位置づけ
確率論は、統計学の土台です。
同時分布や確率密度関数が与えられている前提で、確率・期待値・分散などを計算します。
基本構造
| 観点 | 内容 |
|---|---|
| 前提 | 同時分布・密度関数が与えられる |
| 変数 | 確率変数 $X,Y$ |
| 求めるもの | 確率・期待値・分散 |
| 本質 | 計算 |
例:
P(Y \mid X)
該当する単元
| 単元 | 内容 |
|---|---|
| 条件付き分布 | 条件付き確率・条件付き期待値を扱う |
| 多変量正規分布 | 複数の確率変数が従う正規分布 |
| 積率母関数 | 分布の特徴量を取り出す関数 |
まとめ
👉 確率論は、分布が分かっているときに確率を計算する分野
B1, 数理統計(Statistical Inference)
分布の形は仮定するが、パラメータは未知の世界
位置づけ
数理統計は、データから未知のパラメータを推定する理論です。
確率論では分布が完全に分かっていましたが、数理統計では分布の形だけを仮定します。
基本構造
| 観点 | 内容 |
|---|---|
| 前提 | 分布の形を仮定する |
| 変数 | データ $x$、パラメータ $\theta$ |
| 求めるもの | パラメータ・事後分布 |
| 本質 | 推定 |
最尤法
位置づけ
観測データが最も起こりやすくなるようなパラメータを求める方法です。
| 観点 | 内容 |
|---|---|
| 前提 | 分布の形 $f(x|\theta)$ を仮定 |
| 変数 | データ $x$、パラメータ $\theta$ |
| 求めるもの | 最尤推定量 $\hat{\theta}$ |
| 本質 | パラメータ推定 |
L(\theta)=\prod_{i=1}^{n} f(x_i|\theta)
ベイズ法
位置づけ
事前分布とデータを組み合わせて、パラメータの事後分布を求める方法です。
| 観点 | 内容 |
|---|---|
| 前提 | 尤度 + 事前分布 |
| 変数 | データ $x$、パラメータ $\theta$ |
| 求めるもの | 事後分布 $p(\theta|x)$ |
| 本質 | 分布推定 |
p(\theta|x) \propto p(x|\theta)p(\theta)
該当する単元
| 単元 | 内容 |
|---|---|
| 最尤法 | 尤度を最大化してパラメータを推定 |
| ベイズ法 | 事前分布と尤度から事後分布を推定 |
| 不完全データの統計処理 | 欠測・潜在変数を含むデータを扱う |
まとめ
👉 数理統計は、分布の形を仮定してデータからパラメータを推定する分野
B2, 統計モデリング(Regression / GLM / ANOVA)
分布に加えて、変数間の構造 $X \to Y$ を仮定する世界
位置づけ
統計モデリングは、説明変数 $X$ と目的変数 $Y$ の関係をモデル化する分野です。
数理統計が「パラメータ推定の理論」だとすると、統計モデリングはそれを使って「現象の構造」を表します。
基本構造
| 観点 | 内容 |
|---|---|
| 前提 | 分布 + 変数間の構造を仮定 |
| 変数 | 説明変数 $X$、目的変数 $Y$、パラメータ |
| 求めるもの | 関係性・予測値・確率 |
| 本質 | モデル化 |
回帰分析(線形モデル)
| 観点 | 内容 |
|---|---|
| 前提 | 平均構造 $E[Y|X]=X\beta$、誤差分布 |
| 変数 | データ $X,Y$、パラメータ $\beta$ |
| 求めるもの | 回帰係数 $\beta$、予測値 |
| 本質 | 連続値の予測 |
E[Y|X]=X\beta
分散分析(ANOVA)
| 観点 | 内容 |
|---|---|
| 前提 | 群平均モデル、正規誤差、等分散 |
| 変数 | 群、観測値 |
| 求めるもの | 群差の有無 |
| 本質 | 平均の差の検定 |
ロジスティック回帰(GLM)
| 観点 | 内容 |
|---|---|
| 前提 | ベルヌーイ分布、ロジットリンク |
| 変数 | 説明変数 $X$、目的変数 $Y$、パラメータ $\beta$ |
| 求めるもの | 回帰係数 $\beta$、確率 |
| 本質 | 0/1の確率予測 |
P(Y=1 \mid X)=\frac{1}{1+e^{-X\beta}}
該当する単元
| 単元 | 内容 |
|---|---|
| 重回帰分析 | 複数の説明変数で連続値を説明 |
| 分散分析 | 群間の平均差を検定 |
| 質的回帰 | 0/1やカウントなどの目的変数を扱う |
まとめ
👉 統計モデリングは、分布と変数間の関係を仮定して、構造や予測を求める分野
B3, 多変量解析(Multivariate Analysis)
複数変数の構造・関係性を整理する世界
位置づけ
多変量解析は、多くの変数を同時に扱い、背後にある構造を見つける分野です。
回帰のように明確な $X \to Y$ の関係を置くものもありますが、多くは「構造の発見」が目的です。
基本構造
| 観点 | 内容 |
|---|---|
| 前提 | 多変量データに何らかの構造がある |
| 変数 | 複数の観測変数 |
| 求めるもの | 構造・分類・低次元表現 |
| 本質 | 構造抽出 |
該当する単元
| 単元 | 前提 | 求めるもの | 本質 |
|---|---|---|---|
| 主成分分析 | 分散最大化・線形結合 | 主成分 | 次元削減 |
| 判別分析 | クラス分布 | 分類ルール | 分類 |
| 因子分析 | 潜在変数モデル | 潜在因子 | 潜在構造の推定 |
| クラスター分析 | 距離・類似度 | グループ | 教師なし分類 |
| グラフィカルモデリング | 条件付き独立性 | 依存構造 | ネットワーク構造 |
| その他の多変量解析手法 | 多変量構造 | 特徴・関係 | 構造把握 |
まとめ
👉 多変量解析は、複数変数の背後にある構造を見つける分野
B4,5, 確率過程・時系列(Stochastic Process / Time Series)
時間や状態の変化を扱う世界
位置づけ
確率過程・時系列は、時間とともに変化する確率現象を扱います。
通常の確率論が「ある時点の確率」を扱うのに対し、確率過程は「時間の流れの中での確率」を扱います。
基本構造
| 観点 | 内容 |
|---|---|
| 前提 | 時間依存構造・状態遷移構造がある |
| 変数 | 時間、状態、観測値 |
| 求めるもの | 遷移確率・分布・予測 |
| 本質 | 動的モデル化 |
該当する単元
| 単元 | 前提 | 求めるもの | 本質 |
|---|---|---|---|
| ポアソン過程 | 独立増分・定常性 | 事象の発生確率 | ランダムな発生のモデル化 |
| マルコフ連鎖 | マルコフ性 | 遷移確率・定常分布 | 状態遷移のモデル化 |
| ブラウン運動 | 連続時間・独立増分 | 分布・軌道特性 | 連続確率過程 |
| 時系列分析 | 自己相関構造 | 予測・構造 | 時間依存の分析 |
まとめ
👉 確率過程・時系列は、時間とともに変化する確率現象を扱う分野
B6, 応用統計(Applied Statistics)
現実データに統計手法を適用する世界
位置づけ
応用統計は、現実のデータ条件に合わせて統計手法を使う分野です。
分割表、ノンパラメトリック法、生存時間解析、標本調査法などは、理論というより「実データをどう扱うか」に重点があります。
基本構造
| 観点 | 内容 |
|---|---|
| 前提 | 実データ特有の条件がある |
| 変数 | 標本・観測データ |
| 求めるもの | 推定・検定・関連性 |
| 本質 | 実務適用 |
該当する単元
| 単元 | 前提 | 求めるもの | 本質 |
|---|---|---|---|
| 分割表 | カテゴリデータ | 独立性・関連性 | カテゴリ分析 |
| ノンパラメトリック法 | 分布を強く仮定しない | 検定結果 | ロバストな検定 |
| 生存時間解析 | 打ち切りデータ | 生存関数・ハザード | 時間イベント解析 |
| 標本調査法 | 抽出設計 | 母集団推定 | 標本から母集団を推定 |
まとめ
👉 応用統計は、現実データの制約に合わせて統計手法を使う分野
全体まとめ
| 分野 | 前提 | 変数 | 求めるもの | 本質 |
|---|---|---|---|---|
| 確率論 | 分布が既知 | 確率変数 | 確率・期待値 | 計算 |
| 数理統計 | 分布の形を仮定 | データ + パラメータ | パラメータ・事後分布 | 推定 |
| 統計モデリング | 分布 + 構造を仮定 | $X,Y,$ パラメータ | 関係・予測・確率 | モデル化 |
| 多変量解析 | 多変量構造を仮定 | 複数の観測変数 | 構造・分類・低次元表現 | 構造抽出 |
| 確率過程・時系列 | 時間依存構造を仮定 | 時間・状態・観測値 | 遷移確率・分布・予測 | 動的モデル化 |
| 応用統計 | 実データ条件を考慮 | 標本・観測データ | 推定・検定・関連性 | 実務適用 |