#はじめに
今回の投稿内容は、「Rによる統計的学習の入門」演習問題5.4(4)の自分の回答です。
それでは、早速見ていきましょう。
##1.演習問題
この演習問題は、「Rによる統計的学習の入門」から引用します。
予測変数Xが与えられたときの応答変数Yを予測するために、ある統計的学習法を使うとする。予測の標準誤差をどのように推定するかについて詳しく説明せよ。
##2.解答
ブートストラップ法の予測の標準誤差の求め方について、説明します。
ステップ1: データセットからn個のデータを無作為抽出することにより、
ブートストラップ標本を作成します。抽出の際には重複を許します。
ステップ2: ブートストラップ標本を使い、ブートストラップ推定値を求めます。
ステップ3: 以上のことを複数回(回数は大きな値)繰り返し、
異なるブートストラップデータセットと、対応する推定値を複数個を得ます。
ステップ4: 以下の式により、ブートストラップ推定値の標準誤差を求めます。
ここで、Bは繰り返し回数、$\alpha^{*r}$は各ブートストラップ標本の推定値となります。
ブートストラップ法を使用するメリットは、
(1)ほとんど全ての場合で、使用することは可能です。
(2)複雑な計算は不要です。
Rでブートストラップを行う場合は、以下の二つのステップが必要です。
(1)求めたい統計量を計算する関数を作成します。
(2)boot()関数を使用して、標準の復元抽出を繰り返し、ブートストラップを行います。
#参考書籍
1.著者 G. James,D. Witten,T. Hastie,R. Tibshirani,(2017),原著タイトル,An Introduction to Statistical Learning: with Applications in R.訳者 落海 浩,首藤 信通,(2018),Rによる統計的学習の入門,朝倉書店.
以上です。