普段より、自分のプログラミング等に関する質問に答えて下さっている皆様ありがとうございます。m( _ _)m よろしければ統計検定の学習等にご利用ください(自分はそもそも存在を知ったのが10月末で、来年受けます。※1年計画です。)
標本平均の定義と(数Ⅰ、数Bの標本平均の手前で習う)平均(値)との違い
標本平均の定義は次の通りです。(自分が持っている「青チャート数学Ⅱ・B」より)
「母集団から大きさ $n$ の標本を抽出し、変量 $x$ についてその標本のもつ $x$ の値を
$X_1$、$X_2$、・・・・・、$X_n$ とする。この標本を1組の資料とみなしたとき、
その平均値
\begin{align}
\frac{1}{n} \sum_{i=1}^n X_i = \frac{1}{n}(X_1+X_2+・・・・・、+X_n)
を標本平均といい、\overline{X}と表す。」
\end{align}
これに対し、数Ⅰのデータの分析で出てくる平均値の定義は次の通り
(自分が持っている「青チャート数学I・A」より)
「大きさ $n$ のデータの値を$x_1$、$x_2$、・・・・・、$x_n$ とするとき、
\begin{align}
\frac{1}{n} \sum_{i=1}^n x_i = \frac{1}{n}(x_1+x_2+・・・・・、+x_n)
を平均値といい、\overline{x}と表す。」
\end{align}
これ何が違うん??ただ、大文字と小文字が違うだけなんちゃうん??(´д`)??と思われた方
。実は全然違います。
一般に数学では、大文字は集合やベクトル、小文字は要素やスカラー(ベクトルの中に入っている数値、日常の計算で使う数)を表します。
結果、
標本平均は「確率「変数」」なのに対し、 数Ⅰのデータの分析で出てくる平均値(や数Bの前半で(「期待値」として)出てくる平均
$$E(X)$$
は基本的には「定数(として計算された値)」です。
※数学Bの確率分布と統計的な推測の序盤に、確率変数 $X$と 、$X$として取り得る値$x_i(i = 1, 2, …,n)$に対する確率$p_k$に対して(「期待値」として紹介されて)
\begin{align}
E(X)=\sum_{k=1}^n x_kp_k = x_1p_1+x_2p_2+・・・・・、+x_np_n
\end{align}
と定義されていますが、上記の後者の方は、
\begin{align}
p_1 = p_2 =・・・= p_n = \frac{1}{n}
\end{align}
の状態を考えていることになります。
また、標本平均の平均
\begin{align}
E(\overline{X})
\end{align}
はイメージとしては、
\begin{align}
E(\overline{X})=E(E(X))
\end{align}
みたいなものを実は考えていることになります。そしてさらに、前回書いた
「確率統計学・統計検定学習備忘録 ③標本平均・標本分散(※復元抽出)、数Ⅰと数Bの統計の違い①」https://qiita.com/thinking-weed/items/36a3eadf0035557a1714
では、実は暗に復元抽出を考えているのですが、非復元抽出だと、このQiitaに記したような式がかなり気持ち悪い感じに変態します。※後ほど詳しくQiita化します。
(冗長になるので今回はこのあたりで止めますが、)とりあえず抽出の概念の大まかなイメージとしては
復元抽出
「一回取り出した玉等(にあたる確率変数)を再度(袋や箱等に)戻して、再度引ける状態にする」⇒「計算するときに母数が変わらない」⇒「べき乗を考える」ことが多い。
非復元抽出
「一回取り出した玉等(にあたる確率変数)はもう(袋や箱等に)戻さない。(=再度引けない)」⇒「計算するときに母数が1ずつ減る」⇒「階乗を考える」ことが多い。
よくお世話になっている参考資料一覧(※全部の内容を自分も理解できているわけではないです。)
・統計検定1級公式問題集 実務教育出版
※過去問のページもありました。 https://www.toukei-kentei.jp/prepare/kakomon/
・青チャートI+A、Ⅱ+B 数研出版
・理工系の微分積分学 吹田信之、新保経彦 共著 学術図書出版書
・線形代数入門 齋藤正彦 著 東京大学出版会
・定本 解析概論 高木貞治 著 岩波書店
・数学シリーズ 数理統計学 改訂版 稲垣萱生 著 裳華房(一番オススメ)
・数学シリーズ 集合と位相 内田伏一 著 裳華房
・one point 推定と検定 鷲尾泰俊 著 共立出版
・電磁場とベクトル解析 深谷賢治 著 岩波書店
・シリーズ物理数学1 フーリエ解析 江沢 洋 著 朝倉書店
(※一見、統計とは全く関係なさそうですが、実は中に統計・確率に関する章があります。しかも結構詳しく書いてくれてある。江沢さんの本は難しいけど丁寧だから基本オススメ