統計検定2級2019年11月の過去問を解いているのでまとめました。
間違いなどあったら指摘いただければ嬉しいです。
問1
1.東京の箱ひげ図から外れ値が16度から18度の間に2点あるので①が答え。
2.四分位点が一番大きいのは福岡。
問2
問3
問4
時系列の変動に関する知識問題。以下を覚えていればOK.
①傾向変動
長期間にわたる基本的な変動傾向であり、変動の根幹を占めるものです。傾向変動を算出する方法として移動平均法や最小二乗法があります。
②循環変動
周期は一定でないが、周期的に繰り返される上下変動を周期変動と呼び、経済活動での景気変動などが該当します。循環変動は直接算出する手法がないため、時系列変動から傾向変動と季節変動を除去して算出する方法が一般的です。
③季節変動
通常一年を周期とする規則的な変動を季節変動と呼びます。名前から四季の変動を連想しがちですが、半年・四半期・月別・週別を周期とする繰り返し変動も季節変動として考えます。季節変動を算出する手法としては、月別平均法、移動平均法、連環比率法があります。
④不規則変動
以上三変動以外の変動として取り残された変動を指します。天災等の不時の変動や、明確に説明できないような変動が含まれます。
引用) https://www.nrc.co.jp/marketing/12-17.html
問5
コレログラムの問題。時系列データに対して、lag分ずらした系列との相関係数のプロット。
問題ではx軸が年月なのでlag=nカ月移動させる。元の時系列データは12カ月周期っぽい&6カ月で負の相関になりそうなのでそうなっている②を選択。
問6
[10]
標本抽出の名前の問題
系統抽出法:
母集団に通し番号をつけ、それ以下の通し番号を持つ点から無作為に一点目の標本を抽出する。その点から等間隔で(抽出間隔ごとに)標本を抽出するような方法。
引用)https://bellcurve.jp/statistics/glossary/1283.html
層化抽出法:
母集団をその特性に応じていくつかの層に分類することが可能な場合に、母集団を層化し、各層からランダムに標本を抽出する方法。層内が均質であれば、誤差分散を小さくすることができる。
引用)https://bellcurve.jp/statistics/glossary/317.html
集落抽出法(クラスター抽出法):
母集団をいくつかのグループに分け、その中から無作為抽出で選ばれたグループに含まれる標本を全て抽出する方法。
引用)https://bellcurve.jp/statistics/glossary/3657.html
多段抽出法:
母集団をいくつかのグループに分け、その中からランダムにグループを抽出する方法。抽出されたグループをさらにグループに分け、ランダムにグループを抽出する。この作業を何度か繰り返し、最後に抽出されたグループからランダムに抽出を行う方法。
引用)https://bellcurve.jp/statistics/glossary/1799.html
単純無作為抽出:
母集団から、乱数表を用いて必要数だけサンプルを抽出する方法。
Ⅰは単純無作為抽出。Ⅱは乗客を午前午後にグループ分けし、そこから無作為抽出しているので層化抽出法になる。Ⅲは2便でグループ分けしたのちそのグループ全員に対して調査を行っているので集落抽出法になる。
問7
[11]
標準誤差を求める問題。
サンプルサイズnが大きい場合は中心極限定理により、標本平均の分布はN(μ,σ^2/n)に従う。よって、標準誤差は不変分散をsとして
と書くことができる。
問8
条件付確率の問題。
A:対策講座を受講する事象
B:検定試験に合格する事象
問題文から講座を受講したものが試験を受けて合格する確率が70%、受講しなければ30%なので、
である。(メモ:P(A|B)はBの事象が起きる条件のもとAが起きる確率である)
〔1〕[12]
検定試験を受けた人の中から無作為に1人選び、その人が対策講座を受講した合格者である確率はを求める。
求めるべき確率はP(A∧B)であるため、
より、計算すると
になる。(メモ:条件付確率になると思ったけど、母集団が受験者になってるから条件付確率は使わない(使えない))
〔2〕[13]
受験者から無作為に1人選び、その人が合格者と分かった状態でその人が対策講座を受講している確率を求める。
すなわち求める確率はP(A|B)である。
を用いて計算する。ここでP(B)はわからないためベイズの定理を使って、
より、
問9
確率分布と期待値に関する問題。
〔1〕[14]
$ \int _{-\infty}^{\infty}f(x) dx $= 1を満たすように計算するだけ。
〔2〕[15]
使用量の期待値なので、
$$ \int _{-\infty}^{\infty}xf(x) dx $$
を計算する。これを計算すると20/3になる。
〔3〕[16]
水道使用量金の期待値を求める問題。使用料xに対する水道料金をg(x)とするとの確率分布f(x)のもとでのg(x)の期待値を求めるので、
$$ \int _{-\infty}^{\infty}g(x)f(x) dx $$
を求めればいよい。
問10
累積確率分布に関する問題?。難しい。
〔1〕[17]
確率変数同士の関係が分布の関係にどう効いてくるかわからなかったけど調べたら↓
確率変数が等しい⇔確率分布が等しいになるの?
⇒確率変数が等しい⇒分布が等しいが真。
(注意)「二つの確率変数 X と Y が等しい」というとき、それは「 関数である X(w) と Y(w) が等しい」という意味です。確率変数 X と Y が 等しいとき、X が従う確率密度関数と Y が従う確率密度関数は、もちろん、 一致します。しかしながら、二つの確率変数 X と Y が等しい確率分布に 従う場合であっても、確率変数 X と Y は、普通は等しくありません。 (この記述は、確率統計を理解している人には、あたりまえのことですが、 そうでない人にはあたりまえのことではないようです。注意してください)。
引用 http://watanabe-www.math.dis.titech.ac.jp/users/swatanab/rand-vari.html
解答と同じだけど以下の考え方で自分は理解。
$ 0 \leq x < 100 $であるxに対する$F_X$に対して累積確率分布を求める。$0<x\leq 100$の範囲では確率変数$X=Z$である。
よって、$F_Z(0)$が定義されていないことから、$F_X(0)$を加えればよく、$F_X=F_X(0) + F_Z(x)$となる。
ここで、$F_X(0)$は
$$
F_X(0) = P(X=0) = P(Z=0)+ P(Z>100) = 0 + 0.04
$$
である。(∵ X=0である確率はZ>100である確率とZ=0である確率の和である。Z=0である確率は今は0)
よって
$$
F_X = F_Z(x) + 0.04
$$
〔2〕[18]
$F_X(x) = 0.95$を解く。
$$
F_X(x) = 0.95
\Leftrightarrow
F_Z(x) + 0.04 = 0.95 \\
\therefore
F_Z(x) = 0.91 \\
\therefore
x= 5
$$
〔3〕[19]
問11
問17
分散分析の問題。
水準:月
帰無仮説:月ごとの平均値に差がないつまりμ1=μ2=...=μ12
[1]水準平方和S_A、残差平方和S_eを求める問題。
水準平方和は水準の平均から全体の平均を引いて全2乗和を取るので
と書くことができる。