1.この記事でまとめたいこと
1つの母集団から無作為にn個の標本を抽出し,その標本から母集団の母数(平均$\mu$や分散$\sigma^2$)の区間推定を行う方法。絵でいうと下記。
2.まとめた背景
参考書などで勉強していたところ,下記のような色々なケースの区間推定の方法が出てきた。
- 母集団の分布・・・既知/未知
- 母分散・・・既知/未知
それぞれのケースで,新たに定義する確率変数や,その確率変数が従う分布(標準正規分布/t分布/カイ二乗分布)が異なっており,覚えられなかった。まとめていくと,共通する考え方が見えてきた。
3.共通する考え方
4.各ケースと共通する考え方に照らし合わせると
下図のように,全て共通する考え方で,区間推定を行うことができる。赤字がポイントだと思う。
図中の★部分は,5章で記載する。
5.4章の図中の★部分についての説明
5.1.★1について
標本平均を使うとなぜ自由度が1下がるのかについては,下記サイトで理解することができた。
@takayan4さん教えていただきありがとうございました。
・高校数学の美しい物語
https://mathtrain.jp/chinijoproof
5.2.★2について
6.おまけ(確率密度関数)
関連する確率密度関数をMATLABでプロットしてみた。
本コードを実行するには,Statistics and Machine Learning Toolboxが必要です。
6.1.正規分布とt分布
t分布の自由度を増やすと,標準正規分布に近づいていく。
これは,nが大きくなると,不偏分散が母分散に近づいていくため。
xrng = [-3,3];
fplot(@(x) normpdf(x,0,1),xrng,'DisplayName','Standard Normal Distribution') % 標準正規分布
hold on
fplot(@(x) tpdf(x,5),xrng,'DisplayName','t Distribution with \nu=5') % 自由度5のt分布
fplot(@(x) tpdf(x,10),xrng,'DisplayName','t Distribution with \nu=10') % 自由度10のt分布
legend
hold off
6.2.カイ二乗分布
xrng = [0,20];
fplot(@(x) chi2pdf(x,1),xrng,'DisplayName','\nu=1') %自由度1のカイ二乗分布
hold on
fplot(@(x) chi2pdf(x,2),xrng,'DisplayName','\nu=2') %自由度2のカイ二乗分布
fplot(@(x) chi2pdf(x,3),xrng,'DisplayName','\nu=3') %自由度3のカイ二乗分布
fplot(@(x) chi2pdf(x,5),xrng,'DisplayName','\nu=5') %自由度5のカイ二乗分布
fplot(@(x) chi2pdf(x,10),xrng,'DisplayName','\nu=10') %自由度10のカイ二乗分布
legend
hold off
7.参考文献
・マセマ出版社 統計学キャンパス・ゼミ 改訂5
https://www.mathema.jp/product/統計学キャンパス・ゼミ-改訂5/
・ヨビノリ 確率統計 推定・検定入門
https://www.youtube.com/playlist?list=PLDJfzGjtVLHmx7qMP410-9gx0weC9d90X
・高校数学の美しい物語
https://mathtrain.jp/chinijoproof