統計検定2級 模擬試験2017年11月風
第1章:データの記述と要約 (問1~問7)
問1:ある商品の価格指数を算出する際、基準時点の数量をウェイトとして用いる指数を何というか。
① ラスパイレス指数 ② パーシェ指数 ③ フィッシャー指数 ④ 消費者物価指数 ⑤ 企業物価指数
問2:変数 と の相関係数が であった。このとき、 と の関係について正しい記述はどれか。
① が増えると も増える強い傾向がある。
② が増えると が減る強い傾向がある。
③ と にはほとんど関係がない。
④ と の間には非線形の強い関係がある。
⑤ の分散は の分散より大きい。
問3:箱ひげ図において、第1四分位数が30、中央値が40、第3四分位数が60であるとき、四分位範囲(IQR)はいくらか。
① 10 ② 20 ③ 30 ④ 40 ⑤ 70
問4:平均50、標準偏差10のデータがある。すべてのデータに2を掛けた後、10を引いた。新しいデータの平均と標準偏差の組合せとして正しいものはどれか。
① 平均90、標準偏差10 ② 平均90、標準偏差20
③ 平均110、標準偏差20 ④ 平均110、標準偏差10
⑤ 平均100、標準偏差20
問5:あるクラスのテスト結果が左に裾を引く分布(負に歪んだ分布)であるとき、一般的に平均値、中央値、最頻値の大きさの関係はどうなるか。
① 平均値 < 中央値 < 最頻値 ② 最頻値 < 中央値 < 平均値
③ 中央値 < 平均値 < 最頻値 ④ 平均値 = 中央値 = 最頻値
⑤ 関係は決まらない
問6:共分散が12、変数 の標準偏差が4、変数 の標準偏差が6のとき、相関係数はいくらか。
① 0.2 ② 0.3 ③ 0.5 ④ 0.6 ⑤ 0.8
問7:変動係数(CV)を求める式として正しいものはどれか。
① 標準偏差 / 平均 ② 平均 / 標準偏差 ③ 分散 / 平均
④ 平均 / 分散 ⑤ 標準偏差 / サンプルサイズ
第2章:標本抽出と実験計画 (問8~問10)
問8:母集団をいくつかのグループ(層)に分け、各層の大きさに比例して標本を抽出する方法を何というか。
① 単純無作為抽出法 ② 層化無作為抽出法 ③ クラスター抽出法
④ 多段抽出法 ⑤ 系統抽出法
問9:実験において、処置以外の条件が結果に影響を与えることを防ぐため、被験者をランダムに割り当てることを何というか。
① 盲検化 ② 無作為化(ランダム化) ③ ブロッキング
④ 繰り返し ⑤ 層別化
問10:観察研究において、原因と結果の両方に影響を与える第3の変数を何というか。
① 説明変数 ② 目的変数 ③ 交絡因子 ④ 誤差項 ⑤ ダミー変数
第3章:確率と分布 (問11~問17)
問11:ある病気の罹患率が0.1%である。検査の感度が99%、特異度が95%のとき、陽性と判定された人が実際に罹患している確率は約いくらか。
① 0.012 ② 0.019 ③ 0.050 ④ 0.100 ⑤ 0.990
問12:サイコロを3回投げたとき、1の目が少なくとも1回出る確率はいくらか。
① ② ③ ④ ⑤
問13:期待値 のポアソン分布において、分散はいくらか。
① ② ③ ④ ⑤
問14:標準正規分布 において、 の値はいくらか。
① 0.68 ② 0.90 ③ 0.95 ④ 0.975 ⑤ 0.99
問15:確率変数 が の二項分布に従うとき、 の期待値と分散の組合せとして正しいものはどれか。
① (20, 16) ② (20, 20) ③ (80, 16) ④ (80, 20) ⑤ (20, 4)
問16:自由度 の 分布において、 が無限大に近づくと、どの分布に近似されるか。
① カイ二乗分布 ② 指数分布 ③ 分布 ④ 標準正規分布 ⑤ 二項分布
問17:連続型確率変数 の密度関数が であるとき、 の期待値はいくらか。
① 0.5 ② 1.0 ③ 1.5 ④ 2.0 ⑤ 2.5
第4章:統計的推定 (問18~問22)
問18:標本平均 の分散 は、母分散 とサンプルサイズ を用いてどう表されるか。
① ② ③ ④ ⑤
問19:不偏分散の計算で で割る理由として適切なものはどれか。
① 計算を簡単にするため ② サンプルサイズが小さいから
③ 期待値が母分散に一致するようにするため ④ 標準誤差を小さくするため
⑤ 自由度を にするため
問20:母比率 の推定において、サンプルサイズを4倍にすると、信頼区間の幅はどうなるか。
① 2倍になる ② 4倍になる ③ 1/2になる ④ 1/4になる ⑤ 変わらない
問21:一致性(一致推定量)とはどのような性質か。
① 期待値が母数に一致する性質
② サンプルサイズを大きくすると母数に収束する性質
③ 分散が最小になる性質
④ 常に正の値をとる性質
⑤ 推定値が正規分布に従う性質
問22:母分散が未知の正規母集団から抽出した の標本を用いて母平均の信頼区間を求める際、用いる統計量はどの分布に従うか。
① 標準正規分布 ② 自由度16の 分布 ③ 自由度15の 分布
④ 自由度15のカイ二乗分布 ⑤ 自由度(1, 15)の 分布
第5章:仮説検定 (問23~問28)
問23:有意水準 5% で検定を行い、帰無仮説を棄却できなかった。このとき正しい記述はどれか。
① 帰無仮説が正しいことが証明された。
② 対立仮説が正しい可能性がある。
③ 有意な差があるといえる。
④ -値は 0.05 より小さかった。
⑤ 第1種の過誤を犯した。
問24:第2種の過誤()とはどのような誤りか。
① 帰無仮説が正しいのに、誤って棄却すること。
② 帰無仮説が誤っているのに、棄却しないこと。
③ サンプルサイズが足りないこと。
④ 有意水準を高く設定しすぎること。
⑤ 検定統計量を間違えること。
問25:適合度検定において、3つのカテゴリーがある場合のカイ二乗統計量の自由度はいくらか。
① 1 ② 2 ③ 3 ④ 4 ⑤ 30
問26:独立性の検定において、期待度数が極端に小さい場合に注意すべき点は何か。
① 検定に切り替える。
② カイ二乗分布の近似が悪くなる。
③ 常に有意になる。
④ 自由度を増やす。
⑤ サンプルサイズを減らす。
問27:-値について正しい記述はどれか。
① 帰無仮説が正しい確率である。
② -値が小さいほど、帰無仮説の下で観測データが得られる確率が低いことを示す。
③ -値は常に有意水準 0.05 より大きい。
④ 対立仮説が正しい確率である。
⑤ -値は 1 を超えることがある。
問28:2つの独立した母平均の差の検定(ウェルチの検定)はどのような時に用いられるか。
① 母分散が等しいと仮定できるとき
② 母分散が等しいと仮定できないとき
③ サンプルサイズが等しいとき
④ 対応があるデータのとき
⑤ 標本が正規分布に従わないとき
第6章:回帰分析・分散分析・時系列 (問29~問35)
問29:単回帰モデル において、決定係数 であった。このとき相関係数 の絶対値はいくらか。
① 0.3 ② 0.49 ③ 0.7 ④ 0.9 ⑤ 2.4
問30:回帰係数 の有意性検定における帰無仮説はどれか。
① ② ③ ④ ⑤
問31:一元配置分散分析において、水準間の平均平方を誤差の平均平方で割った値( 値)が非常に大きいとき、何を意味するか。
① 各水準の平均に有意な差がある可能性が高い。
② 各水準の平均はすべて等しい。
③ 誤差が非常に大きい。
④ サンプルサイズが小さすぎる。
⑤ 交互作用がある。
問32:重回帰分析において、説明変数同士に強い相関がある場合に生じる問題を何というか。
① 自己相関 ② 異分散性 ③ 多重共線性(マルチコ)
④ 欠測値 ⑤ 外れ値
問33:時系列データにおいて、1年前の同じ時期のデータと強い相関があることを何というか。
① トレンド ② 季節性(季節変動) ③ 不規則変動
④ 構造変化 ⑤ ホワイトノイズ
問34: という両対数モデルにおいて、 は何を表すか。
① が 1 単位増えた時の の増加量
② が 1% 増えた時の の変化率(弾力性)
③ の平均値
④ 相関係数の2乗
⑤ 誤差の標準偏差
問35:分散分析表において、総自由度が29、水準間の自由度が4であるとき、残差(誤差)の自由度はいくらか。
① 4 ② 25 ③ 29 ④ 30 ⑤ 33
第1章:データの記述と要約
問1:① ラスパイレス指数
- 解説: 指数の重み(ウェイト)に基準時点の数量を用いるのがラスパイレス指数です。対照的に、比較時点(現在)の数量を用いるのはパーシェ指数です。
- 公式:
問2:② が増えると が減る強い傾向がある
- 解説: 相関係数が負()であるため「負の相関」があり、絶対値が に近いため「強い」関係です。負の相関とは、一方が増えるともう一方が減る関係を指します。
問3:② 20
- 解説: 四分位範囲 () は、第3四分位数 () から第1四分位数 () を引いた値です。
- 計算:
- 訂正: 選択肢 ③ 30 が正解です。(※以前の回答で計算ミスがあった場合への配慮)
問4:② 平均90、標準偏差20
- 解説: データの変換 において、平均は 、標準偏差は となります。
- 計算: 平均 。標準偏差 。
問5:① 平均値 < 中央値 < 最頻値
- 解説: 左に裾を引く分布(負の歪み)では、極端に小さな値が平均を左側に引っ張るため、平均値が最も小さくなります。
問6:③ 0.5
- 解説: 相関係数 は、共分散をそれぞれの標準偏差の積で割ったものです。
- 公式:
問7:① 標準偏差 / 平均
- 解説: 変動係数 () は、単位の異なるデータのばらつきを比較するための指標です。
- 公式:
第2章:標本抽出と実験計画
問8:② 層化無作為抽出法
- 解説: 母集団をグループ(層)に分け、それぞれの層からサンプリングする方法です。
問9:② 無作為化(ランダム化)
- 解説: 被験者をランダムに割り当てることで、未知の要因によるバイアス(偏り)を平均化し、因果関係を正しく評価します。
問10:③ 交絡因子
- 解説: 説明変数と目的変数の両方に影響を与え、見かけ上の相関を作ってしまう第3の変数のことです。
第3章:確率と分布
問11:② 0.019
- 解説: ベイズの定理を使います。陽性と判定される確率は「病気で陽性」+「健康で陽性(偽陽性)」の合計です。
- 計算:
**問12:⑤ **
- 解説: 「少なくとも1回」は「1 - 全く出ない」で計算します。
- 計算:
**問13:① **
- 解説: ポアソン分布の大きな特徴は、期待値 と分散 がともにパラメータ に等しいことです。
問14:③ 0.95
- 解説: 標準正規分布において、平均から左右に 倍の標準偏差の範囲には、全データの約 が含まれます。
問15:① (20, 16)
- 解説: 二項分布 の期待値は 、分散は です。
- 計算: 期待値 。分散 。
問16:④ 標準正規分布
- 解説: 分布は、自由度が大きくなる(サンプルサイズが増える)ほど、標準正規分布に近づきます。
問17:② 1.0
- 解説: から までの範囲の連続一様分布の平均は、その中心値になります。
- 公式:
第4章:統計的推定
**問18:② **
- 解説: 標本平均 の分散は、元の母分散をサンプルサイズで割ったものになります。
問19:③ 期待値が母分散に一致するようにするため
- 解説: 標本から計算した分散を で割ると母分散を過小評価してしまうため、 で割ることで「不偏性(偏りがない性質)」を持たせます。
問20:③ 1/2になる
- 解説: 信頼区間の幅は に比例します。 を 倍にすると、幅は になります。
問21:② サンプルサイズを大きくすると母数に収束する性質
- 解説: のとき、推定値が母数と一致していく性質を「一致性」と呼びます。
問22:③ 自由度15の 分布
- 解説: 母分散が未知で小標本の場合、 統計量を使います。自由度は です。
第5章:仮説検定
問23:② 対立仮説が正しい可能性がある
- 解説: 棄却できなかったことは「帰無仮説が正しい」と証明したわけではなく、「差があるとは言い切れない」という保留の状態です。
問24:② 帰無仮説が誤っているのに、棄却しないこと
- 解説: 実際には差がある(帰無仮説が偽)のに、それを見逃してしまう誤りです。
問25:② 2
- 解説: 適合度検定の自由度は です。 となります。
問26:② カイ二乗分布の近似が悪くなる
- 解説: 各セルの期待度数が 未満だと、カイ二乗分布を使った近似計算の精度が著しく低下します。
問27:② -値が小さいほど、帰無仮説の下で観測データが得られる確率が低いことを示す
- 解説: -値は「帰無仮説が正しいとしたとき、今のデータ(またはそれ以上に極端な結果)が得られる確率」です。
問28:② 母分散が等しいと仮定できないとき
- 解説: 2つの群の母分散が異なる場合に平均値の差を検定する手法です。
第6章:回帰分析・分散分析・時系列
問29:③ 0.7
- 解説: 単回帰において、決定係数 は相関係数 の 乗に等しい性質があります。
- 計算:
**問30:① **
- 解説: 「説明変数が目的変数に何の影響も与えない(傾きが )」という状態を否定したい対象(帰無仮説)にします。
問31:① 各水準の平均に有意な差がある可能性が高い
- 解説: 値は(グループ間の差の大きさ / グループ内の誤差の大きさ)です。これが大きいことは、誤差に比べてグループ間の差が無視できないほど大きいことを示します。
問32:③ 多重共線性(マルチコ)
- 解説: 説明変数同士に強い相関があると、回帰係数の推定が不安定になり、正しい分析ができなくなります。
問33:② 季節性(季節変動)
- 解説: 1年前の同時期と相関があるなど、一定の周期で繰り返される変動です。
問34:② が 増えた時の の変化率(弾力性)
- 解説: 両対数モデル の係数 は「弾力性」を表します。
問35:② 25
- 解説: 分散分析では(総自由度)(水準間自由度)(残差自由度)が成り立ちます。
- 計算:
統計検定2級 模擬試験(第3弾・改訂版)全35問
────────────────────────
第1章 データの記述と要約
────────────────────────
問1
あるデータの平均は55、中央値は62、最頻値は68である。
この大小関係から判断して、分布の形として最も適切なものを選べ。
1 左右対称
2 右側に長い裾をもつ分布(正の歪み)
3 左側に長い裾をもつ分布(負の歪み)
4 一様分布
5 二つの山をもつ分布
問2
相関係数が r = 0.8 のとき、決定係数とその意味の正しい組合せを選べ。
1 R^2 = 0.8 :Yの変化の80%がXで説明できる
2 R^2 = 0.64:Yの変動の64%がXとの線形関係で説明できる
3 R^2 = 0.4 :XとYに強い因果関係がある
4 R^2 = 0.64:誤差の64%が説明される
5 R^2 = 0.8 :Yの平均がXの0.8倍になる
問3
箱ひげ図において
第1四分位数 Q1 = 40
第3四分位数 Q3 = 70
外れ値の下限は
Q1 − 1.5 × (Q3 − Q1)
で定義されるとき,下側境界はいくつか。
1 −5
2 −10
3 10
4 25
5 0
問4
変数Xの平均は10,分散は4である。
Y = 3 − 2X という変換を行ったときの,Yの平均と標準偏差の正しい組合せを選べ。
A 平均 −17,標準偏差 4
B 平均 −17,標準偏差 8
C 平均 23,標準偏差 4
D 平均 23,標準偏差 8
E 平均 −15,標準偏差 8
問5
ローレンツ曲線が45度の完全平等線から離れるほど,ジニ係数はどのように変化するか。
1 0に近づく
2 1に近づく
3 変わらない
4 負の値になる
5 無限に大きくなる
問6
カテゴリごとの相対度数を p1, p2, …, pk としたとき
1 − (p1^2 + p2^2 + … + pk^2)
で定義される指標を何というか。
1 変動係数
2 歪度
3 尖度
4 ジニ係数
5 ジニ不純度
問7
物価指数において,ラスパイレス指数よりもパーシェ指数の方が,物価上昇時に小さく出やすい理由として最も適切なものを選べ。
1 基準時の数量で固定しているため
2 価格上昇時に消費者が代替品へ移る行動を反映するため
3 幾何平均を用いるため
4 標本数が少ないため
5 最新価格のみを用いるため
────────────────────────
第2章 統計調査と実験計画
────────────────────────
問8
母集団をいくつかの層に分け,各層の大きさに比例して標本を抽出する。
層内のばらつきが小さく,層間の差が大きい場合に最も有効な抽出法はどれか。
1 クラスター抽出
2 系統抽出
3 層化無作為抽出
4 多段抽出
5 便宜抽出
問9
実験研究と観察研究の本質的な違いとして正しいものを選べ。
1 実験研究は必ず大標本で行う
2 観察研究では,被験者が自ら処置を選んでいる場合がある
3 実験研究は将来予測に使えない
4 観察研究には交絡は存在しない
5 実験研究は病院のみで行う
問10
アンケートで,質問の並び順によって回答が変化する現象を何というか。
1 選択バイアス
2 情報バイアス
3 順序効果(キャリーオーバー効果)
4 脱落バイアス
5 自己選択バイアス
────────────────────────
第3章 確率と分布
────────────────────────
問11
感度 0.90
特異度 0.95
有病率 0.01
の検査において,「陽性」と出た人が実際に病気である確率として最も近いものを選べ。
1 0.01
2 0.15
3 0.50
4 0.90
5 0.95
問12
連続確率変数Xの確率密度関数が
f(x) = Cx (0 ≤ x ≤ 2)
それ以外は0であるとき,定数Cはいくつか。
1 1/4
2 1/2
3 1
4 2
5 4
問13
問12の確率変数Xの期待値 E[X] を求めよ。
1 2/3
2 4/3
3 3/2
4 5/3
5 2
問14
X が平均2のポアソン分布に従うとき,1回も起こらない確率はいくつか。
1 0.135
2 0.270
3 0.500
4 0.675
5 0.865
問15
標準正規分布において
P(Z ≤ 1.96) = 0.975
であるとき,上側2.5%点はいくつか。
1 1.28
2 1.645
3 1.96
4 2.33
5 2.58
問16
自由度 ν のカイ二乗分布に従う確率変数Yの期待値はいくつか。
1 ν
2 ν − 1
3 2ν
4 √ν
5 1
問17
互いに独立な標準正規変数 Z1, Z2 について
P(Z1 > 0 かつ Z2 > 0) を求めよ。
1 1/2
2 1/3
3 1/4
4 1/6
5 1/8
────────────────────────
第4章 統計的推定
────────────────────────
問18
母集団の分布形に依らず,標本平均が大標本で正規分布に近づく性質を何というか。
1 大数の法則
2 中心極限定理
3 ベイズの定理
4 ガウスの定理
5 フィッシャーの原理
問19
正規母集団,母分散未知,標本サイズ10のとき,母平均の信頼区間に用いる分布はどれか。
1 標準正規分布
2 自由度9のt分布
3 自由度10のt分布
4 自由度9のカイ二乗分布
5 自由度(1,9)のF分布
問20
母比率の95%信頼区間の幅がwである。
サンプルサイズを4倍にすると,区間の幅はどうなるか。
1 2w
2 w
3 w/2
4 w/4
5 変化しない
問21
不偏分散
s^2 = Σ(xi − xbar)^2 / (n − 1)
の自由度はいくつか。
1 n
2 n − 1
3 n + 1
4 n − 2
5 1
問22
一致推定量の定義として正しいものを選べ。
1 常に不偏である
2 n → ∞ で推定量が母数に確率収束する
3 不偏推定量の中で分散が最小
4 小標本でも必ず正確
5 推定値は常に正規分布
────────────────────────
第5章 仮説検定
────────────────────────
問23
有意水準0.05,P値0.06のときの判断として正しいものを選べ。
1 帰無仮説を棄却する
2 帰無仮説を棄却できない
3 帰無仮説は100%正しい
4 対立仮説が正しい確率は0.06
5 有意水準0.10でも棄却できない
問24
2つの正規母集団の分散が等しいかを検定する際に用いる分布はどれか。
1 t分布
2 F分布
3 カイ二乗分布
4 正規分布
5 ポアソン分布
問25
適合度のカイ二乗検定の統計量の正しい式を選べ。
1 Σ(Oi − Ei)
2 Σ(Oi − Ei)^2
3 Σ (Oi − Ei)^2 / Ei
4 Σ |Oi − Ei| / Ei
5 Σ (Oi − Ei)^2 / Oi
問26
第1種過誤確率を α,第2種過誤確率を β としたとき,検出力はどれか。
1 α + β
2 1 − α
3 1 − β
4 αβ
5 β / α
問27
P値の性質として正しいものを選べ。
1 帰無仮説が正しい確率
2 0から1の間の値をとる
3 小さいほど対立仮説が誤っている
4 有意水準より大きいと棄却される
5 標本が増えると必ず大きくなる
問28
r行c列の分割表に対する独立性のカイ二乗検定の自由度はいくつか。
1 rc
2 r + c − 2
3 (r − 1)(c − 1)
4 r(c − 1)
5 (r − 1)c
────────────────────────
第6章 回帰分析・分散分析ほか
────────────────────────
問29
重回帰で説明変数を追加した場合のR^2と調整済みR^2の一般的な関係として正しいものを選べ。
1 R^2は増えるか変わらないが,調整済みR^2は下がることもある
2 両方必ず増える
3 両方必ず下がる
4 R^2は下がり,調整済みR^2は増える
5 常に同じ
問30
回帰係数bjの有意性検定に用いるt値の式として正しいものを選べ。
1 t = bj / SE(bj)
2 t = bj × SE(bj)
3 t = bj^2 / SE(bj)
4 t = SE(bj) / bj
5 t = bj / Var(bj)
問31
一元配置分散分析で,要因自由度が5,誤差自由度が77のとき,総データ数はいくつか。
1 77
2 82
3 83
4 84
5 5
問32
一元配置分散分析におけるF値の定義として正しいものを選べ。
1 F = MSE / MSA
2 F = MSA / MSE
3 F = (MSA + MSE) / 2
4 F = SSA / SSE
5 F = SSE / SSA
問33
要因Aが3水準,要因Bが4水準,各組合せに2回の測定を行うとき,総データ数はいくつか。
1 12
2 18
3 24
4 48
5 96
問34
時系列データで,直前の値と現在の値との相関を何というか。
1 相互相関
2 自己相関
3 偏相関
4 季節相関
5 擬似相関
問35
多重共線性が疑われる典型的な状況を選べ。
1 R^2が非常に小さい
2 全体のF検定は有意だが,個々のt検定が有意になりにくい
3 残差が正規分布に従う
4 標本サイズが十分に大きい
5 回帰直線が原点を通る
第1章:データの記述と要約(問1~問7)
問1(正答:③)
平均=55、中央値=62、最頻値=68。
一般に、分布の歪みと「平均・中央値・最頻値」の並びは次。
- 右に裾が長い(正の歪み): 最頻値 < 中央値 < 平均
- 左に裾が長い(負の歪み): 平均 < 中央値 < 最頻値
今回は
平均55 < 中央値62 < 最頻値68
なので 左に裾が長い(負の歪み)。
問2(正答:②)
相関係数 r=0.8。決定係数は
R^2 = r^2 = (0.8)^2 = 0.64
意味:
「回帰モデル(線形関係)で、目的変数Yの分散(変動)のうち、説明変数Xで説明される割合」が0.64。
注意:
- 因果関係を意味しない(③は誤り)
- 誤差が64%という意味でもない(④は誤り)
問3(正答:①)
Q1=40、Q3=70。
IQR(四分位範囲)= Q3 − Q1 = 70 − 40 = 30
外れ値下限(下側フェンス):
下限 = Q1 − 1.5IQR = 40 − 1.530 = 40 − 45 = −5
よって −5。
問4(正答:A)
Xの平均 E[X]=10、分散 Var(X)=4。
Y=3−2X。
(1) 平均
E[Y] = E[3−2X] = 3 − 2E[X] = 3 − 2*10 = 3 − 20 = −17
(2) 分散
定数加算は分散に影響しない。係数a倍は分散が a^2 倍。
Var(Y)=Var(3−2X)=Var(−2X)=(-2)^2 Var(X)=4*4=16
(3) 標準偏差
SD(Y)=sqrt(Var(Y))=sqrt(16)=4
よって(平均−17, SD4)= A。
問5(正答:②)
ローレンツ曲線が45度線から離れるほど「不平等が大きい」。
ジニ係数は「不平等の大きさ」を0〜1で表す指標なので、離れるほど 1に近づく。
問6(正答:⑤)
相対度数 p1,…,pk について
1 − Σ pi^2
は、分類問題(決定木など)で使う ジニ不純度(Gini impurity)。
「集中していないほど大きい」指標。
問7(正答:②)
- ラスパイレス:基準時数量 q0 を固定して、価格変化を測る
- パーシェ:当期数量 q1 を使って、価格変化を測る
物価が上がると、人は高いものを避けて代替品に移る。
当期数量 q1 はその代替行動を反映しやすく、結果として「上昇を小さく見積もりがち(過小評価)」になる。
よって ②。
第2章:統計調査と実験計画(問8~問10)
問8(正答:③)
層内ばらつきが小さい + 層間差が大きい
→ 層を作る意味がある
→ 層化無作為抽出が効く。推定精度が上がりやすい。
問9(正答:②)
観察研究:被験者が自ら処置を選ぶことがありうる
→ 交絡が入りやすい
→ 因果推論が難しくなる
実験研究:割付(ランダム化)が可能
→ 交絡を減らせる
よって ②。
問10(正答:③)
質問順序により回答が変わる
→ 順序効果(キャリーオーバー効果)
第3章:確率と分布(問11~問17)
問11(正答:②)
求めたいのは P(病気 | 陽性)。ベイズで計算。
与えられた値:
- 感度 = P(陽性 | 病気) = 0.90
- 特異度 = P(陰性 | 健康) = 0.95
→ 偽陽性率 P(陽性 | 健康)=1−0.95=0.05 - 有病率 = P(病気)=0.01
→ P(健康)=0.99
ベイズ:
P(病気|陽性)
= P(陽性|病気)P(病気) / {P(陽性|病気)P(病気) + P(陽性|健康)P(健康)}
= (0.900.01) / (0.900.01 + 0.05*0.99)
= 0.009 / (0.009 + 0.0495)
= 0.009 / 0.0585
≈ 0.1538
≈ 0.15 → ②
問12(正答:②)
PDF:
f(x)=C x (0≤x≤2)
PDFは全体積=1:
∫0^2 Cx dx = 1
計算:
∫0^2 x dx = [x^2/2]0^2 = 4/2 = 2
よって
C * 2 = 1
C = 1/2
→ ②
問13(正答:②)
期待値:
E[X] = ∫0^2 x f(x) dx
= ∫0^2 x * (C x) dx
= C ∫0^2 x^2 dx
まず ∫0^2 x^2 dx = [x^3/3]0^2 = 8/3
C=1/2より
E[X] = (1/2)*(8/3)=4/3
→ ②
問14(正答:①)
Poisson(λ)で
P(X=0)=e^(−λ) λ^0/0! = e^(−λ)
λ=2なので
P(X=0)=e^(−2)=0.1353… → 0.135(①)
問15(正答:③)
上側2.5%点 z は
P(Z ≥ z)=0.025
同値に P(Z ≤ z)=0.975
問題文に P(Z ≤ 1.96)=0.975 が与えられている
→ z=1.96 → ③
問16(正答:①)
χ^2(ν) の期待値は
E[Y]=ν
理由(要点):
χ^2(ν)=標準正規の二乗和(ν個)
Y = Σ Zi^2
E[Y]=Σ E[Zi^2]=ν*1=ν
→ ①
問17(正答:③)
Z1,Z2 独立標準正規。
P(Z1>0)=1/2
P(Z2>0)=1/2
独立より
P(Z1>0, Z2>0)= (1/2)*(1/2)=1/4
→ ③
第4章:統計的推定(問18~問22)
問18(正答:②)
標本平均が n大で正規に近づく
→ 中心極限定理
問19(正答:②)
母分散未知・正規母集団からの平均の区間推定
→ t分布を使う
自由度は n−1=9
→ 自由度9のt分布(②)
問20(正答:③)
比率の信頼区間幅は概ね
幅 ∝ 1/sqrt(n)
nを4倍 → sqrt(n)は2倍
→ 幅は 1/2倍
よって w/2(③)
問21(正答:②)
不偏分散 s^2 の分母は (n−1)
自由度= n−1
→ ②
問22(正答:②)
一致推定量:
n→∞ で推定量が母数に確率収束する
→ ②
第5章:仮説検定(問23~問28)
問23(正答:②)
有意水準 0.05
P値 0.06
P値 > 有意水準
→ 棄却できない
→ ②
問24(正答:②)
分散が等しいかの検定 → 分散比
( s1^2 / s2^2 ) が F分布
→ F分布(②)
問25(正答:③)
適合度検定の統計量:
χ^2 = Σ (Oi−Ei)^2 / Ei
→ ③
問26(正答:③)
Power = 1 − β
(βは第2種の過誤)
→ ③
問27(正答:②)
P値は確率(の形)なので 0〜1
1を超えない
→ ②
問28(正答:③)
r行×c列の独立性検定の自由度:
(r−1)(c−1)
→ ③
第6章:回帰分析・分散分析・その他(問29~問35)
問29(正答:①)
R^2:説明変数を増やすと「当てはまり」は上がる(または同じ)
→ R^2は減らない
調整済みR^2:説明変数増加の罰則が入る
→ 上がるとは限らず、下がることもある
→ ①
問30(正答:①)
係数 bj のt値は
t = (推定値 bj) / (標準誤差 SE(bj))
→ ①
問31(正答:③)
一元配置ANOVA:
- 要因自由度 dfA = k−1
- 誤差自由度 dfE = N−k
ここで dfA=5 → k=6
dfE=77 = N−6
→ N = 83
よって 83(③)
問32(正答:②)
F値は
F = MS_A / MS_E
(要因の平均平方 / 誤差の平均平方)
→ ②
問33(正答:③)
2元配置:
Aが3水準、Bが4水準
セル数 = 34 = 12
各セル反復2 → データ総数 N = 122 = 24
→ ③
問34(正答:②)
時系列で「自分自身のずれた値との相関」
→ 自己相関
→ ②
問35(正答:②)
多重共線性が強いと:
- 全体(F検定)は有意になりやすい(全体では説明できる)
- しかし各係数のSEが大きくなり、t検定が有意になりにくい
→ ②
【第1章 データの記述・要約】
問1
ある度数分布表において,相対度数の総和は1である。
他の階級の相対度数が
0.12,0.25,0.33,0.18
であるとき,残りの相対度数を求めよ。
問2
次のデータの平均を求めよ。
8,10,12,15,15,20
問3
次のデータの中央値を求めよ。
3,5,7,9,12,14,18,21
問4
平均が50,分散が16のとき,標準偏差を求めよ。
問5
平均が200,標準偏差が20のとき,変動係数を求めよ。
────────────────────────
【第2章 相関・回帰】
問6
相関係数が r = 0.6 のとき,決定係数を求めよ。
問7
回帰式 y = 120 − 4x において,x = 15 のときの y を求めよ。
問8
回帰係数の推定値が −3.0,標準誤差が0.5のとき,t値を求めよ。
問9
回帰係数の推定値が2.4,t値が6のとき,標準誤差を求めよ。
────────────────────────
【第3章 確率】
問10
1個のサイコロを1回投げるとき,偶数の目が出る確率を求めよ。
問11
袋の中に赤玉3個,白玉5個が入っている。
無作為に1個取り出したとき,赤玉である確率を求めよ。
問12
成功確率0.4の試行を5回行うとき,成功がちょうど2回となる確率を求めよ。
問13
成功確率0.3の試行を10回行うとき,成功が0回である確率を求めよ。
────────────────────────
【第4章 確率分布】
問14
確率変数 X が二項分布 B(6, 0.5) に従うとき,E[X] を求めよ。
問15
確率変数 X が二項分布 B(10, 0.2) に従うとき,Var(X) を求めよ。
問16
確率変数 X がポアソン分布 Pois(3) に従うとき,P(X=0) を求めよ。
問17
確率変数 X がポアソン分布 Pois(2) に従うとき,P(X=1) を求めよ。
────────────────────────
【第5章 連続分布】
問18
確率密度関数
f(x) = Cx (0 ≤ x ≤ 2)
が確率密度関数となるように定数 C を求めよ。
問19
問18の確率密度関数について,期待値 E[X] を求めよ。
問20
確率変数 X が一様分布 U(1, 5) に従うとき,E[X] を求めよ。
問21
確率変数 X が一様分布 U(0, 4) に従うとき,Var(X) を求めよ。
────────────────────────
【第6章 正規分布】
問22
標準正規分布に従う確率変数 Z について,
P(Z ≤ 1.96) を求めよ。
問23
母平均50,母分散36の正規分布から大きさ9の標本を取る。
標本平均の標準偏差を求めよ。
問24
問23において,標本平均が52以上となる確率を求めよ。
────────────────────────
【第7章 推定】
問25
標本サイズ100,標本平均80,母分散25のとき,
母平均の95%信頼区間を求めよ。
問26
標本サイズ400,標本比率0.6のとき,
母比率の95%信頼区間を求めよ。
────────────────────────
【第8章 検定】
問27
有意水準0.05で検定を行い,P値が0.08であった。
帰無仮説は棄却されるか答えよ。
問28
自由度9のt分布における95%信頼区間で用いる上側臨界値を答えよ。
問29
自由度4のカイ二乗分布における期待値を求めよ。
────────────────────────
【第9章 分散分析】
問30
一元配置分散分析において,要因自由度が3,誤差自由度が20のとき,
全データ数を求めよ。
問31
分散分析において,要因平方和SS_A=120,
要因自由度df_A=3のとき,要因平均平方MS_Aを求めよ。
────────────────────────
【第10章 その他】
問32
観測度数 (18, 22, 20),期待度数 (20, 20, 20) に対する
カイ二乗統計量を求めよ。
問33
平均10の集団が5人,平均15の集団が7人いる。
全体平均を求めよ。
問34
自己相関係数が正であるとき,
隣り合うデータにはどのような傾向があるか簡潔に述べよ。
問35
多重回帰において,全体のF検定は有意だが,
各回帰係数のt検定が有意でないことが多い原因を1つ述べよ。の相対度数が
0.18,0.27,0.34
であるとき,不明な相対度数 ( a ) を求めよ。
【第1章 データの記述・要約】
問1
ある度数分布表において,相対度数の総和は1である。
他の階級の相対度数が
0.12,0.25,0.33,0.18
であるとき,残りの相対度数を求めよ。
問2
次のデータの平均を求めよ。
8,10,12,15,15,20
問3
次のデータの中央値を求めよ。
3,5,7,9,12,14,18,21
問4
平均が50,分散が16のとき,標準偏差を求めよ。
問5
平均が200,標準偏差が20のとき,変動係数を求めよ。
────────────────────────
【第2章 相関・回帰】
問6
相関係数が r = 0.6 のとき,決定係数を求めよ。
問7
回帰式 y = 120 − 4x において,x = 15 のときの y を求めよ。
問8
回帰係数の推定値が −3.0,標準誤差が0.5のとき,t値を求めよ。
問9
回帰係数の推定値が2.4,t値が6のとき,標準誤差を求めよ。
────────────────────────
【第3章 確率】
問10
1個のサイコロを1回投げるとき,偶数の目が出る確率を求めよ。
問11
袋の中に赤玉3個,白玉5個が入っている。
無作為に1個取り出したとき,赤玉である確率を求めよ。
問12
成功確率0.4の試行を5回行うとき,成功がちょうど2回となる確率を求めよ。
問13
成功確率0.3の試行を10回行うとき,成功が0回である確率を求めよ。
────────────────────────
【第4章 確率分布】
問14
確率変数 X が二項分布 B(6, 0.5) に従うとき,E[X] を求めよ。
問15
確率変数 X が二項分布 B(10, 0.2) に従うとき,Var(X) を求めよ。
問16
確率変数 X がポアソン分布 Pois(3) に従うとき,P(X=0) を求めよ。
問17
確率変数 X がポアソン分布 Pois(2) に従うとき,P(X=1) を求めよ。
────────────────────────
【第5章 連続分布】
問18
確率密度関数
f(x) = Cx (0 ≤ x ≤ 2)
が確率密度関数となるように定数 C を求めよ。
問19
問18の確率密度関数について,期待値 E[X] を求めよ。
問20
確率変数 X が一様分布 U(1, 5) に従うとき,E[X] を求めよ。
問21
確率変数 X が一様分布 U(0, 4) に従うとき,Var(X) を求めよ。
────────────────────────
【第6章 正規分布】
問22
標準正規分布に従う確率変数 Z について,
P(Z ≤ 1.96) を求めよ。
問23
母平均50,母分散36の正規分布から大きさ9の標本を取る。
標本平均の標準偏差を求めよ。
問24
問23において,標本平均が52以上となる確率を求めよ。
────────────────────────
【第7章 推定】
問25
標本サイズ100,標本平均80,母分散25のとき,
母平均の95%信頼区間を求めよ。
問26
標本サイズ400,標本比率0.6のとき,
母比率の95%信頼区間を求めよ。
────────────────────────
【第8章 検定】
問27
有意水準0.05で検定を行い,P値が0.08であった。
帰無仮説は棄却されるか答えよ。
問28
自由度9のt分布における95%信頼区間で用いる上側臨界値を答えよ。
問29
自由度4のカイ二乗分布における期待値を求めよ。
────────────────────────
【第9章 分散分析】
問30
一元配置分散分析において,要因自由度が3,誤差自由度が20のとき,
全データ数を求めよ。
問31
分散分析において,要因平方和SS_A=120,
要因自由度df_A=3のとき,要因平均平方MS_Aを求めよ。
────────────────────────
【第10章 その他】
問32
観測度数 (18, 22, 20),期待度数 (20, 20, 20) に対する
カイ二乗統計量を求めよ。
問33
平均10の集団が5人,平均15の集団が7人いる。
全体平均を求めよ。
問34
自己相関係数が正であるとき,
隣り合うデータにはどのような傾向があるか簡潔に述べよ。
問35
多重回帰において,全体のF検定は有意だが,
各回帰係数のt検定が有意でないことが多い原因を1つ述べよ。
【問1 解説】
相対度数の和は 1 である。
与えられている相対度数の和は
0.12 + 0.25 + 0.33 + 0.18 = 0.88
よって残りは
1 − 0.88 = 0.12
────────────────────────
【問2 解説】
平均は
(8 + 10 + 12 + 15 + 15 + 20) / 6 = 80 / 6 = 13.33
────────────────────────
【問3 解説】
データ数は8個(偶数個)。
4番目と5番目は 9 と 12。
中央値 = (9 + 12) / 2 = 10.5
────────────────────────
【問4 解説】
標準偏差 = √分散 = √16 = 4
────────────────────────
【問5 解説】
変動係数 = 標準偏差 / 平均
= 20 / 200 = 0.10(=10%)
────────────────────────
【問6 解説】
決定係数 = r²
= (0.6)² = 0.36
────────────────────────
【問7 解説】
y = 120 − 4x
x = 15 を代入
y = 120 − 60 = 60
────────────────────────
【問8 解説】
t値 = 回帰係数 / 標準誤差
= (−3.0) / 0.5 = −6.0
────────────────────────
【問9 解説】
標準誤差 = 回帰係数 / t値
= 2.4 / 6 = 0.4
────────────────────────
【問10 解説】
偶数は {2,4,6} の3通り。
全事象6通り。
確率 = 3 / 6 = 1/2
────────────────────────
【問11 解説】
赤玉3個,白玉5個,合計8個。
赤玉の確率 = 3 / 8
────────────────────────
【問12 解説】
二項分布 B(5, 0.4)。
P(X=2) =
C(5,2) (0.4)² (0.6)³
= 10 × 0.16 × 0.216
= 0.3456
────────────────────────
【問13 解説】
P(X=0) = (1 − 0.3)¹⁰ = 0.7¹⁰ ≈ 0.028
────────────────────────
【問14 解説】
二項分布の期待値
E[X] = np = 6 × 0.5 = 3
────────────────────────
【問15 解説】
分散 Var(X) = np(1−p)
= 10 × 0.2 × 0.8 = 1.6
────────────────────────
【問16 解説】
P(X=0) = e⁻³ × 3⁰ / 0! = e⁻³
────────────────────────
【問17 解説】
P(X=1) = e⁻² × 2¹ / 1! = 2e⁻²
────────────────────────
【問18 解説】
確率密度関数の条件
∫₀² Cx dx = 1
C [x²/2]₀² = 1
C × 2 = 1 → C = 1/2
────────────────────────
【問19 解説】
E[X] = ∫₀² x f(x) dx
= ∫₀² x × (1/2)x dx
= (1/2) ∫₀² x² dx
= (1/2) × (8/3) = 4/3
────────────────────────
【問20 解説】
一様分布 U(a,b) の期待値
E[X] = (a+b)/2 = (1+5)/2 = 3
────────────────────────
【問21 解説】
一様分布の分散
Var(X) = (b−a)² / 12
= (4−0)² / 12 = 16/12 = 4/3
────────────────────────
【問22 解説】
標準正規分布表より
P(Z ≤ 1.96) ≈ 0.975
────────────────────────
【問23 解説】
標本平均の標準偏差
= √(母分散 / n)
= √(36 / 9) = 2
────────────────────────
【問24 解説】
Z = (52 − 50) / 2 = 1
P(Z ≥ 1) = 1 − 0.8413 = 0.1587
────────────────────────
【問25 解説】
95%信頼区間
80 ± 1.96 × √(25/100)
= 80 ± 1.96 × 0.5
= (79.02 , 80.98)
────────────────────────
【問26 解説】
標準誤差
√(0.6×0.4 / 400) = 0.0245
信頼区間
0.6 ± 1.96×0.0245
≈ (0.552 , 0.648)
────────────────────────
【問27 解説】
P値 = 0.08 > 有意水準0.05
→ 帰無仮説は棄却されない
────────────────────────
【問28 解説】
自由度9,95% → t₀.₀₂₅ ≈ 2.262
────────────────────────
【問29 解説】
カイ二乗分布の期待値 = 自由度
→ 4
────────────────────────
【問30 解説】
要因自由度 = k−1 = 3 → k=4群
誤差自由度 = N−k = 20
N = 24
────────────────────────
【問31 解説】
MS_A = SS_A / df_A
= 120 / 3 = 40
────────────────────────
【問32 解説】
χ² = Σ (O−E)²/E
= (18−20)²/20 + (22−20)²/20
= 4/20 + 4/20 = 0.4
────────────────────────
【問33 解説】
全体平均
= (10×5 + 15×7) / (5+7)
= (50+105)/12 = 12.92
────────────────────────
【問34 解説】
自己相関が正 →
大きい値の次に大きい値が来やすい傾向がある
────────────────────────
【問35 解説】
説明変数間に強い相関(多重共線性)があるため
A. 相対度数・中央値(問1対応:1〜4)
【1】相対度数が 0.08, 0.12, 0.25, 0.30, 0.15 のとき、残り1階級の相対度数を求めよ。
【2】階級 A〜F の相対度数が
A:0.06, B:0.18, C:0.27, D:0.22, E:0.17, F:0.10 のとき、中央値が入る階級を求めよ。
【3】度数分布:階級(0–3),(3–6),(6–9),(9–12) に度数 5, 9, 14, 12。中央値が入る階級を求めよ。
【4】データ 4, 6, 7, 9, 10, 11, 15, 20 の中央値を求めよ。
B. 相関・回帰(問2対応:5〜12)
【5】相関係数 r=−0.65 のとき、決定係数 R^2 を求めよ。
【6】回帰係数 b=−4.8、標準誤差 SE=1.2 のとき t 値を求めよ。
【7】t=−3.75、回帰係数 b=−6.0 のとき標準誤差 SE を求めよ。
【8】回帰式 y=120−4.9x に x=18.2 を代入し y を求め、四捨五入して整数にせよ。
【9】相関 r=0.50、標本サイズ n=30 のとき
t = r*sqrt((n−2)/(1−r^2)) を計算せよ。
【10】TSS=500、RSS=180 のとき R^2 を求めよ。
【11】回帰式 y=a+bx、ȳ=40、x̄=5、b=−3 のとき切片 a を求めよ。
【12】回帰で SSE=240、自由度 df=48 のとき MSE を求めよ。
C. 箱ひげ・外れ値・変動係数(問3対応:13〜18)
【13】データ 90, 95, 98, 100, 102, 105, 110, 160 の中央値を求めよ。
【14】Q1=95、Q3=110 のとき IQR を求めよ。
【15】問14の結果を用い、外れ値の上限 Q3+1.5IQR を求めよ。
【16】平均 200、標準偏差 40 のとき変動係数 CV=SD/mean を求めよ。
【17】平均 12、標準偏差 3 のとき CV を求めよ。
【18】データ 3,5,5,6,7,9,12,15 の Q1 と Q3 を求めよ(中央値で2分割して四分位)。
D. 自己相関の有意判定(問3(3)対応:19〜21)
【19】n=36 のとき棄却限界(近似) 1.96/sqrt(n) を求めよ。
【20】n=36、自己相関 r1=0.65 のとき、問19の棄却限界で有意か判定せよ。
【21】n=48、自己相関 r12=0.30 のとき、棄却限界 1.96/sqrt(n) を求め、有意か判定せよ。
E. ラスパイレス価格指数(問4対応:22〜24)
【22】単一財:p0=200,q0=30,p1=250 のときラスパイレス指数 L=(p1q0)/(p0q0) を求めよ。
【23】2財:
A:(p0,q0,p1)=(100,5,120)
B:(80,10,88)
総合ラスパイレス指数 L=Σ(p1q0)/Σ(p0q0) を求めよ。
【24】3財:
A:(50,4,55) B:(60,3,54) C:(40,8,44)
総合ラスパイレス指数を求めよ。
F. 抽出法(問5対応:計算タスク化:25〜26)
【25】系統抽出:母集団 N=500、標本サイズ n=25。抽出間隔 k を求めよ。
【26】系統抽出:N=1200、n=40、開始番号 r=17 のとき、最初の5つの抽出番号を求めよ。
G. ベイズ(問7対応:27〜29)
【27】感度 Se=0.90、特異度 Sp=0.95、有病率 π=0.10 のとき
P(D|+) = (Seπ)/(Seπ+(1−Sp)(1−π)) を求めよ。
【28】Se=0.98, Sp=0.80, π=0.02 のとき P(D|+) を求めよ。
【29】Se=0.85, Sp=0.90, π=0.30 のとき
P(D|−) = ((1−Se)π)/((1−Se)π+Sp(1−π)) を求めよ。
H. 確率密度(問8対応:30〜32)
【30】f(x)=C(1−x^2)(−1≤x≤1)で、∫f(x)dx=1 より C を求めよ。
【31】問30の分布で E[X] を求めよ(対称性または積分で)。
【32】問30の分布で E[X^2] を求め、Var(X)=E[X^2]−(E[X])^2 を求めよ。
I. χ²・t・F 分布(問9対応:33〜34)
【33】Z~N(0,1) とし、Y=Z^2 のとき Y の分布名と自由度を答えよ。
【34】自由度 ν=9 の t 分布について、上側 2.5% 点が t0.025,9=2.262 と与えられた。
P(|T|≤2.262) を求めよ。
J. 正規・二項・標本平均(問10対応:35〜36)
【35】X~N(50,10^2)。P(X≥60) を求めよ(標準化して Φ(1.0)=0.8413 を使用)。
【36】5人独立に同じ試験を受け、各人が60点以上の確率が p=0.20 のとき、
「ちょうど1人だけが60点以上」の確率を求めよ。
────────────────────────
A. 相対度数・中央値
────────────────────────
【1】
相対度数の和は 1。
0.08+0.12+0.25+0.30+0.15 = 0.90
よって残り = 1 − 0.90 = 0.10
【2】
累積相対度数
A 0.06
B 0.24
C 0.51 ←0.5超
∴ C
【3】
総数 N = 5+9+14+12 = 40
中央値位置 = 20番目
累積度数
5 →14 →28 ←
∴ (6–9)
【4】
中央2値 = 9 と 10
中央値 = (9+10)/2 = 9.5
────────────────────────
B. 相関・回帰
────────────────────────
【5】
R² = r² = (−0.65)² = 0.4225
【6】
t = b/SE = −4.8/1.2 = −4.0
【7】
SE = b/t = (−6.0)/(−3.75) = 1.6
【8】
y = 120 − 4.9×18.2 = 120 − 89.18 = 30.82 ≈ 31
【9】
t = 0.5√(28/0.75) = 0.5√37.33 ≈ 0.5×6.11 = 3.06
【10】
R² = 1 − RSS/TSS = 1 − 180/500 = 0.64
【11】
a = ȳ − b x̄ = 40 − (−3)×5 = 55
【12】
MSE = SSE/df = 240/48 = 5
────────────────────────
C. 箱ひげ
────────────────────────
【13】
中央2値 = 100 と 102
中央値 = 101
【14】
IQR = 110 − 95 = 15
【15】
上限 = 110 + 1.5×15 = 132.5
【16】
CV = 40/200 = 0.20
【17】
CV = 3/12 = 0.25
【18】
下半分 {3,5,5,6} → Q1 = (5+5)/2 = 5
上半分 {7,9,12,15} → Q3 = (9+12)/2 = 10.5
────────────────────────
D. 自己相関
────────────────────────
【19】
1.96/√36 = 0.327
【20】
0.65 > 0.327 → 有意
【21】
1.96/√48 = 0.283
0.30 > 0.283 → 有意
────────────────────────
E. ラスパイレス
────────────────────────
【22】
L = 250/200 = 1.25
【23】
Σp1q0 = 120×5 + 88×10 = 600 + 880 = 1480
Σp0q0 = 100×5 + 80×10 = 500 + 800 = 1300
L = 1480/1300 = 1.138
【24】
Σp1q0 = 220 + 162 + 352 = 734
Σp0q0 = 200 + 180 + 320 = 700
L = 734/700 = 1.049
────────────────────────
F. 抽出
────────────────────────
【25】
k = N/n = 500/25 = 20
【26】
17, 57, 97, 137, 177
────────────────────────
G. ベイズ
────────────────────────
【27】
= 0.09/(0.09+0.045) = 0.667
【28】
= 0.0196/(0.0196+0.196) = 0.091
【29】
= 0.045/(0.045+0.63) = 0.067
────────────────────────
H. 確率密度
────────────────────────
【30】
∫C(1−x²)dx = C[2 − 2/3] = 1
C = 3/4
【31】
対称 → 0
【32】
E[X²] = ∫x² f(x)dx = 1/5
Var = 0.20
────────────────────────
I. χ²・t
────────────────────────
【33】
χ²分布(自由度1)
【34】
1 − 2×0.025 = 0.95
────────────────────────
J. 正規・二項
────────────────────────
【35】
P = 1 − Φ(1) = 1 − 0.8413 = 0.1587
【36】
= 5 × 0.2 × 0.8⁴ = 0.4096
役割
あなたは統計検定の専門家であり、画像から文字を正確に読み取り、文字起こしを行い、日本語で高品質な選択式問題を作成するAIアススタントである。
目標
ユーザーがアップロードした画像(手書きや印刷された統計問題、計算式、表、グラフなど)から内容を文字起こしし、その内容に基づいて日本語で5肢選択式の問題を複数作成する。今回は1回の画像入力に対して合計35問を作成する。問題は正確で論理的であり、統計検定(例: 統計検定2級〜1級レベル)の出題形式に準拠したものにする。
手順
- ユーザーが画像をアップロードしたら、まず画像を詳細に分析し、すべての文字、数式、表、グラフを正確に文字起こしする。
- 文字起こしした内容を基に、統計学的な主題(仮説検定、推定、分散分析、回帰分析、相関、確率分布など)を特定する。
- その内容から多角的に問題を設計し、合計35問の5肢選択式問題を作成する(1つの主題から複数の切り口で問題を派生させる、または複数の主題が含まれる場合はそれぞれから問題を抽出)。
- 各問題について、正しい計算や解釈を1つ選び、それを正解とする。残りの4つの選択肢は典型的な誤答パターン(計算ミス、概念の取り違え、単位間違い、検定の片側/両側間違いなど)を反映したものを含める。
- 問題文を自然で明確な日本語で記述し、必要に応じて数式はLaTeX形式で表記する。
- 35問を連続して番号付きで出力する。
出力仕様
- まず「文字起こし結果」をそのまま表示する。
- 次に「作成問題」を以下の形式で35問分連続出力する:
【問題1】
(問題文)
【選択肢】
A. (選択肢1)
B. (選択肢2)
C. (選択肢3)
D. (選択肢4)
E. (選択肢5)
【正解】
(例: C)
【解説】
(正解の根拠と誤選択肢の誤りのポイントを簡潔に説明)
(以下、【問題2】〜【問題35】まで同様の形式で続ける)
具体例
(出力イメージ:問題1のみ抜粋)
文字起こし結果:
次のデータからt検定を行い、平均が10と有意に異なるかを5%有意水準で検定せよ。
データ:12, 8, 11, 9, 13(n=5)
(実際の画像内容に応じて複数のデータや表が含まれる場合を想定)
【問題1】
ある製品の重量の標本平均を調べるために5個を無作為抽出し、重量を測定したところ、12, 8, 11, 9, 13(単位:g)であった。この標本から母平均が10gであるという帰無仮説を5%有意水準で両側検定を行う。検定統計量tの値として最も適切なものはどれか。
【選択肢】
A. 0.50
B. 1.00
C. 1.58
D. 2.00
E. 2.45
【正解】
C
【解説】
標本平均¯x = 10.6、不偏分散の平方根s ≈ 2.07、t = (10.6-10)/(2.07/√5) ≈ 1.58。正解はC。他の選択肢は計算過程での典型的な誤りに対応。
(以下、【問題2】〜【問題35】まで同様に続き、異なる切り口や追加計算で35問作成)
────────────────────────
A. 相対度数・中央値(1〜4)
────────────────────────
【1】残り1階級の相対度数
相対度数の和は 1。
残り = 1 − (0.08+0.12+0.25+0.30+0.15)
= 1 − 0.90
= 0.10
答え:0.10
【2】中央値が入る階級(相対度数)
累積相対度数:
A 0.06
B 0.06+0.18=0.24
C 0.24+0.27=0.51 ← 0.5を初めて超える
よって中央値は階級C
答え:C
【3】度数分布の中央値が入る階級
度数:5,9,14,12 合計 N=40
中央値位置は 20番目と21番目(偶数なので2つ)
累積度数:5, 14, 28, 40
20番目・21番目は「累積28」に入るので(6–9)
答え:(6–9)
【4】データの中央値
データ:4,6,7,9,10,11,15,20(N=8)
中央値 = (4番目+5番目)/2 = (9+10)/2 = 9.5
答え:9.5
────────────────────────
B. 相関・回帰(5〜12)
────────────────────────
【5】r=-0.65 の決定係数 R^2
R^2 = r^2 = (−0.65)^2 = 0.4225
答え:0.4225
【6】t値(b=-4.8, SE=1.2)
t = b/SE = −4.8/1.2 = −4.0
答え:−4.0
【7】標準誤差SE(t=-3.75, b=-6.0)
t = b/SE なので SE = b/t
SE = (−6.0)/(−3.75) = 1.6
答え:1.6
【8】回帰式 y=120−4.9x に x=18.2
y = 120 − 4.9*18.2
= 120 − 89.18
= 30.82
四捨五入 → 31
答え:y=30.82、整数は 31
【9】相関のt値(r=0.50, n=30)
t = rsqrt((n−2)/(1−r^2))
= 0.50sqrt(28/(1−0.25))
= 0.50sqrt(28/0.75)
= 0.50sqrt(37.3333...)
≈ 0.50*6.1101
≈ 3.055
答え:約 3.06
【10】TSS=500, RSS=180 の R^2
R^2 = 1 − RSS/TSS
= 1 − 180/500
= 1 − 0.36
= 0.64
答え:0.64
【11】回帰式 y=a+bx(ȳ=40, x̄=5, b=-3)
回帰直線は (x̄, ȳ) を通る:
ȳ = a + b x̄
a = ȳ − b x̄ = 40 − (−3)*5 = 40 + 15 = 55
答え:a=55
【12】MSE(SSE=240, df=48)
MSE = SSE/df = 240/48 = 5
答え:5
────────────────────────
C. 箱ひげ・外れ値・変動係数(13〜18)
────────────────────────
【13】中央値
データ:90,95,98,100,102,105,110,160(N=8)
中央値 = (4番目+5番目)/2 = (100+102)/2 = 101
答え:101
【14】IQR
IQR = Q3 − Q1 = 110 − 95 = 15
答え:15
【15】外れ値上限(上側フェンス)
上限 = Q3 + 1.5IQR = 110 + 1.515 = 110 + 22.5 = 132.5
答え:132.5
【16】変動係数 CV(平均200, 標準偏差40)
CV = SD/mean = 40/200 = 0.20
答え:0.20
【17】変動係数 CV(平均12, 標準偏差3)
CV = 3/12 = 0.25
答え:0.25
【18】Q1とQ3(中央値で2分割)
データ:3,5,5,6,7,9,12,15(N=8)
中央値 = (6+7)/2 = 6.5(※四分位計算のための分割点)
下側:3,5,5,6 → Q1 = (2番目+3番目)/2 = (5+5)/2 = 5
上側:7,9,12,15 → Q3 = (2番目+3番目)/2 = (9+12)/2 = 10.5
答え:Q1=5、Q3=10.5
────────────────────────
D. 自己相関の有意判定(19〜21)
────────────────────────
【19】棄却限界 1.96/sqrt(n)(n=36)
sqrt(36)=6
限界 = 1.96/6 = 0.326666...
答え:約 0.327
【20】n=36, r1=0.65 は有意か
棄却限界 ≈ 0.327
|r1| = 0.65 > 0.327 → 有意
答え:有意(棄却)
【21】n=48, r12=0.30 の判定
棄却限界 = 1.96/sqrt(48)
sqrt(48)≈6.9282
限界 ≈ 1.96/6.9282 ≈ 0.2829
|r12|=0.30 > 0.2829 → 有意(ぎりぎり)
答え:棄却限界≈0.283、判定は有意
────────────────────────
E. ラスパイレス価格指数(22〜24)
────────────────────────
【22】単一財
L = (p1 q0)/(p0 q0) = p1/p0 = 250/200 = 1.25
答え:1.25(=125%)
【23】2財
分子 Σ(p1 q0) = 1205 + 8810 = 600 + 880 = 1480
分母 Σ(p0 q0) = 1005 + 8010 = 500 + 800 = 1300
L = 1480/1300 = 1.1384615...
答え:約 1.138(=113.8%)
【24】3財
分子 = 554 + 543 + 448 = 220 + 162 + 352 = 734
分母 = 504 + 603 + 408 = 200 + 180 + 320 = 700
L = 734/700 = 1.0485714...
答え:約 1.049(=104.9%)
────────────────────────
F. 抽出法(25〜26)
────────────────────────
【25】系統抽出の抽出間隔 k
k = N/n = 500/25 = 20
答え:20
【26】N=1200, n=40, 開始番号 r=17
k = 1200/40 = 30
抽出番号:r, r+k, r+2k, r+3k, r+4k
= 17, 47, 77, 107, 137
答え:17, 47, 77, 107, 137
────────────────────────
G. ベイズ(27〜29)
────────────────────────
【27】Se=0.90, Sp=0.95, π=0.10
P(D|+) = (Seπ)/(Seπ+(1−Sp)(1−π))
分子 = 0.900.10 = 0.09
分母 = 0.09 + (0.050.90)=0.09+0.045=0.135
P(D|+) = 0.09/0.135 = 0.666666...
答え:約 0.667(=2/3)
【28】Se=0.98, Sp=0.80, π=0.02
分子 = 0.980.02 = 0.0196
分母 = 0.0196 + (0.200.98)=0.0196+0.196=0.2156
P(D|+) = 0.0196/0.2156 ≈ 0.0909
答え:約 0.091
【29】Se=0.85, Sp=0.90, π=0.30
P(D|−)=((1−Se)π)/((1−Se)π+Sp(1−π))
(1−Se)=0.15
分子 = 0.150.30 = 0.045
分母 = 0.045 + 0.900.70 = 0.045 + 0.63 = 0.675
P(D|−)=0.045/0.675 = 0.066666...
答え:約 0.0667(=1/15)
────────────────────────
H. 確率密度(30〜32)
────────────────────────
【30】正規化定数C
f(x)=C(1−x^2), −1≤x≤1
∫{-1}^{1} C(1−x^2) dx = 1
∫(1−x^2)dx = x − x^3/3
[ x − x^3/3 ]{-1}^{1}
= (1−1/3) − (−1+1/3)
= (2/3) − (−2/3)
= 4/3
C*(4/3)=1 → C=3/4
答え:C=3/4
【31】E[X]
密度は偶関数(左右対称)なので E[X]=0
答え:0
【32】E[X^2], Var(X)
E[X^2]=∫{-1}^{1} x^2C(1−x^2) dx
= C∫{-1}^{1} (x^2 − x^4) dx
偶関数なので
= 2C(∫_0^1 x^2 dx − ∫_0^1 x^4 dx)
= 2C(1/3 − 1/5)
= 2C(2/15)
= 4C/15
C=3/4 より
E[X^2] = (4(3/4))/15 = 3/15 = 1/5 = 0.2
Var(X)=E[X^2]−(E[X])^2=0.2−0^2=0.2
答え:E[X^2]=0.2、Var(X)=0.2
────────────────────────
I. χ²・t・F 分布(33〜34)
────────────────────────
【33】Z~N(0,1), Y=Z^2
標準正規の二乗 → カイ二乗分布(自由度1)
答え:χ^2 分布、自由度1
【34】t(ν=9), 上側2.5%点が 2.262
P(T ≤ 2.262)=0.975、P(T ≥ −2.262)=0.975
よって P(|T| ≤ 2.262)=0.975−0.025=0.95
答え:0.95
────────────────────────
J. 正規・二項(35〜36)
────────────────────────
【35】X~N(50,10^2), P(X≥60)
Z=(X−50)/10
P(X≥60)=P(Z≥1)
Φ(1)=0.8413 なので
P(Z≥1)=1−0.8413=0.1587
答え:0.1587
【36】n=5, p=0.20「ちょうど1人」
二項分布:
P = C(5,1) p (1−p)^4
= 5 * 0.2 * 0.8^4
0.8^4=0.4096
P=50.20.4096=1.0*0.4096=0.4096
答え:0.4096
A. 相対度数・中央値(問1対応)
────────────────────────
【A1】相対度数(%)の残りを求めよ
6階級のうち5つの割合が
0.93%, 5.25%, 35.80%, 38.27%, 5.25% である。
残り1階級の割合(%)を求めよ。
解答:14.50%
計算:
残り = 100 − (0.93 + 5.25 + 35.80 + 38.27 + 5.25)
= 100 − 85.50
= 14.50
【A2】中央値が入る階級(累積%)
6階級の相対度数(%)が
A: 10, B: 18, C: 22, D: 25, E: 15, F: 10
のとき、中央値が入る階級を答えよ。
解答:D
計算:累積%
A 10
B 10+18=28
C 28+22=50 ←ちょうど50%
中央値(50%点)は「Cまで」で到達するが、通常は「50%を超える最初の階級」または「50%点を含む階級」として扱う。
ここでは C で 50% に到達し、次の観測は D に入るため「中央値階級=D」とする運用(検定問題でよく使う)
※運用の違いが出るケース。試験では「50%を超える最初」が安定。
【A3】度数分布の中央値階級(度数)
階級(0–3),(3–6),(6–9),(9–12) に度数 5, 9, 14, 12。
中央値が入る階級を求めよ。
解答:(6–9)
計算:
N=5+9+14+12=40
中央値位置は 20番目と21番目
累積度数:5, 14, 28, 40
20番目・21番目は累積28に含まれる → (6–9)
【A4】生データの中央値
4, 6, 7, 9, 10, 11, 15, 20 の中央値を求めよ。
解答:9.5
計算:N=8なので
中央値 = (4番目+5番目)/2 = (9+10)/2 = 9.5
────────────────────────
B. 相関・回帰(問2対応)
────────────────────────
【B1】決定係数
相関係数 r = −0.789 のとき、決定係数 R^2 を求めよ。
解答:0.622521(約0.623)
計算:
R^2 = r^2 = (−0.789)^2
= 0.789*0.789
= 0.622521
【B2】t値の計算
回帰係数 b = −2.7608、標準誤差 s = 0.3036 のとき t 値を求めよ。
解答:−9.0938(約−9.09)
計算:
t = b/s = −2.7608 / 0.3036 ≈ −9.0938
【B3】標準誤差の逆算
t = −9.0938、回帰係数 b = −2.7608 のとき標準誤差 s を求めよ。
解答:0.3036(約0.304)
計算:
t = b/s → s = b/t
s = (−2.7608)/(−9.0938) ≈ 0.3036
━━━━━━━━━━━━━━━━━━━
Ⅰ.正規分布系(問10, 13, 回帰, Z検定)
━━━━━━━━━━━━━━━━━━━
すべての出発点:
X ~ N(μ, σ²)
標準化:
Z = (X − μ) / σ
標本平均:
X̄ ~ N( μ , σ² / n )
検定の原型:
( 推定量 − 仮説値 )
---------------------- → N(0,1)
標準誤差
この「差 / ばらつき」が統計の正体。
● 母比率
p̂ = x / n
SE = sqrt( p̂(1−p̂)/n )
95%CI :
p̂ ± 1.96·SE
━━━━━━━━━━━━━━━━━━━
例題①(母比率)
n=400, x=160
p̂=0.4
SE = sqrt(0.4·0.6/400)=0.0245
CI = 0.4 ± 1.96×0.0245
→ [0.352 , 0.448]
━━━━━━━━━━━━━━━━━━━
Ⅱ.χ²分布系(問9, 11, 15, 16)
━━━━━━━━━━━━━━━━━━━
χ²は「誤差エネルギー」
χ² = Σ (誤差 / 標準誤差)²
χ²(k) = Z1² + … + Zk²
平均=k
分散=2k
適合度:
χ² = Σ (Oi−Ei)² / Ei
━━━━━━━━━━━━━━━━━━━
例題②(適合度)
Oi={18,22,20}
Ei={20,20,20}
χ² = (−2)²/20 + 2²/20 + 0
= 0.4
━━━━━━━━━━━━━━━━━━━
Ⅲ.比の構造(F分布・回帰・分散分析)
━━━━━━━━━━━━━━━━━━━
F = (ばらつき1 / 自由度1) / (ばらつき2 / 自由度2)
分散分析:
F = (SSA/(k−1)) / (SSE/(N−k))
回帰:
t = b / SE
→ t² = F
━━━━━━━━━━━━━━━━━━━
例題③(分散分析)
SSA=60(df=2)
SSE=40(df=12)
MSA=30
MSE=3.33
F=9.0 → 有意
━━━━━━━━━━━━━━━━━━━
Ⅳ.ポアソン(問11)
P(X=k) = λ^k e^(-λ)/k!
E[X]=Var[X]=λ
例題④
λ=3
P(X=0)=e^(−3)=0.0498
━━━━━━━━━━━━━━━━━━━
【問1】2群比較。薬A群 n=50 の平均=72, 薬B群 n=50 の平均=68。差(薬A−薬B)を求めよ。
【問2】無作為割付の割合。200人を2群に無作為割付したら治療群108人、対照群92人。治療群割合を求めよ。
【問3】交絡の例(計算)。健康食品摂取者: n=120, そのうち運動習慣あり=90。非摂取者: n=80, 運動習慣あり=20。運動習慣あり割合の差を求めよ。
【問4】観察研究データ。摂取者の平均BMI=22.1、非摂取者の平均BMI=23.0。平均差を求めよ。
【問5】層別。運動あり層で摂取者 n=90 平均=70、非摂取者 n=20 平均=69。運動なし層で摂取者 n=30 平均=66、非摂取者 n=60 平均=65。各層の平均差を求めよ。
━━━━━━━━━━━━━━━━━━━
B. ベイズの定理(計算 6問)
━━━━━━━━━━━━━━━━━━━
(共通)ベイズ: P(A|B)=P(B|A)P(A)/P(B), P(B)=P(B|A)P(A)+P(B|Ac)P(Ac)
【問6】有病率 P(D)=0.02。検査感度 P(+|D)=0.95、偽陽性率 P(+|Dc)=0.10。P(D|+)を求めよ。
【問7】P(D)=0.01, P(+|D)=0.99, P(+|Dc)=0.05。P(D|+)を求めよ。
【問8】P(D)=0.20, P(+|D)=0.90, P(+|Dc)=0.15。P(D|+)を求めよ。
【問9】2段検査。1回目+で2回目も+のとき陽性確定とする。P(D)=0.01, 各検査は感度0.95, 偽陽性0.05で独立。P(D|++ )を求めよ。
【問10】検査が陰性だったとき。P(D)=0.03, 感度0.90, 偽陽性0.08。P(D|−)を求めよ(P(−|D)=0.10, P(−|Dc)=0.92)。
【問11】事前確率が変化。P(D)=0.20, 感度0.90, 偽陽性0.10。P(D|+)を求めよ。
━━━━━━━━━━━━━━━━━━━
C. 回帰分析(自由度・t・予測)(計算 10問)
━━━━━━━━━━━━━━━━━━━
(共通)単回帰: y = a + b x
t検定: t = (b − 0)/SE(b)
自由度: df = n − 2
【問12】df=199 の単回帰。標本サイズ n を求めよ。
【問13】df=58 の単回帰。n を求めよ。
【問14】回帰係数 b=−4.90, SE(b)=0.80。t値を求めよ。
【問15】b=2.40, SE(b)=0.30。t値を求めよ。
【問16】b=−1.75, SE(b)=0.25。t値を求めよ。
【問17】回帰式 y = 20.0 − 2.76 x。x=6.10 のときの予測値 y を求めよ。
【問18】回帰式 y = 120 − 5.0 ln(x)。x=10 のときの予測値を求めよ(ln(10)=2.302を使用)。
【問19】回帰式 y = 50 + 3.2 x。xが1増えるとyは何増えるか。
【問20】n=30, b=1.50, SE(b)=0.60。dfとt値を求めよ。
【問21】b=−4.90, t=−7.00。SE(b)を求めよ。
━━━━━━━━━━━━━━━━━━━
D. 母比率の信頼区間(計算 6問)
━━━━━━━━━━━━━━━━━━━
(共通)p̂ = x/n
SE = sqrt(p̂(1−p̂)/n)
95%CI: p̂ ± 1.96 SE
【問22】n=500, x=180。p̂と95%CIを求めよ。
【問23】n=300, x=90。p̂と95%CIを求めよ。
【問24】n=1000, x=520。p̂と95%CIを求めよ。
【問25】n=200, x=40。p̂と95%CIを求めよ。
【問26】n=400, x=260。p̂と95%CIを求めよ。
【問27】n=150, x=75。p̂と95%CIを求めよ。
━━━━━━━━━━━━━━━━━━━
E. 母比率の差の信頼区間(計算 4問)
━━━━━━━━━━━━━━━━━━━
(共通)差 d = p̂1 − p̂2
SE = sqrt( p̂1(1−p̂1)/n1 + p̂2(1−p̂2)/n2 )
95%CI: d ± 1.96 SE
【問28】調査1: n1=400,x1=120。調査2: n2=500,x2=200。差と95%CIを求めよ。
【問29】n1=300,x1=90。n2=300,x2=60。差と95%CIを求めよ。
【問30】n1=800,x1=520。n2=1000,x2=580。差と95%CIを求めよ。
【問31】n1=200,x1=70。n2=250,x2=60。差と95%CIを求めよ。
━━━━━━━━━━━━━━━━━━━
F. 適合度検定(χ²)(計算 2問)
━━━━━━━━━━━━━━━━━━━
(共通)χ² = Σ (Oi−Ei)²/Ei
自由度 df = (カテゴリ数−1) −(推定した母数の個数)
【問32】3カテゴリ。理論確率が(0.2,0.3,0.5)、試行回数N=200、観測度数(50,50,100)。期待度数Eiとχ²を求めよ。
【問33】3カテゴリ。帰無仮説が確率(0.1,0.2,0.7)で既知。N=100、観測度数(8,30,62)。χ²と自由度を求めよ。
━━━━━━━━━━━━━━━━━━━
G. 分散分析(一元配置 ANOVA)(計算 2問)
━━━━━━━━━━━━━━━━━━━
(共通)F = (SSA/dfA) / (SSE/dfE)
dfA = k−1, dfE = N−k
【問34】k=4, N=20。SSA=120, SSE=80。dfA, dfE, Fを求めよ。
【問35】k=6, N=36。SSA=250, SSE=300。dfA, dfE, Fを求めよ。