More than 5 years have passed since last update.

「データ解析のための統計モデリング入門」の読書メモ（第11章）

Posted at 2019-11-02

11 空間構造のある階層ベイズモデル

11.1 例題：一次元空間上の個体数分布

図11.1：一次元的に分布する50個の調査区画$j$それぞれで架空植物の個体数$y_j$を数える．

図11.2：調査区画ごとの個体数$y_j$．

破線は架空データ${y_j}$をポアソン乱数で生成する時に使った平均値（局所密度）．
局所密度は何らかの理由でなだらかに変化しているとする．近くにある局所密度は似ていて空間相関がある．

11.2 階層ベイズモデルに空間構造をくみこむ

区画$j$ごとに平均$\lambda_j$が異なるポアソン分布にしたがうと考える．

p(y_j | \lambda_j)
= \frac{\lambda_j^{y_j} \exp (-\lambda_j)}{y_j!}

ここで，平均個体数$\lambda_j$は線形予測子と対数リンク関数を使って以下のように表してみる．

\log \lambda_j = \beta + r_j

$\beta$：大域的なパラメータ．すべての場所に同じ影響を与える．無情報事前分布．
$r_j$：局所的なパラメータ．区画$j$だけに影響を与える．階層事前分布．

11.2.1 空間構造のない階層事前分布

第10章では以下の階層事前分布を指定した．

p(r_j|s) = \frac{1}{\sqrt{2 \pi s^2}} \exp \left( - \frac{r_j^2}{2 s^2} \right)

これだと場所差$r_j$はどれも独立に同じ事前分布を仮定していることになる．
この例題のように空間相関がありそうな場合には不適．

11.2.2 空間構造のある階層事前分布

簡単のため以下を仮定．
・区画の場所差は近傍（両隣）区画の場所差にしか影響されない．
・近傍の直接の影響はどれも等しく$1/n_j$．

$r_j$の条件付き事前分布が以下のような正規分布であると設定（条件つき自己回帰モデル，conditional auto regressive, CAR）．

p(r_j|\mu_j, s) = \frac{n_j}{\sqrt{2 \pi s^2}} \exp \left( - \frac{(r_j-\mu_j)^2}{2 s^2/n_j} \right)

ここで，正規分布の平均$\mu_j$は，近傍の平均値に等しいとする．

\mu_j = \frac{r_{j-1} + r_{j+1}}{2}

また，標準偏差は$s/\sqrt{n_j}$．ばらつきパラメータ$s$はどの場所でも同じと仮定．

この場所差{$r_j$} $=$ {$r_1, r_2, ..., r_{50}$}全体の事前分布である同時分布$p$({$r_j$}$|s$)は

p(\{r_j\}|s) 
\propto \exp \left( -\frac{1}{2s^2} \sum_{j \sim j'} (r_j - r_{j'})^2 \right)

ここで$j \sim j'$は，ある区画$j$と別の区画$j'$が近傍であるようなすべての組み合わせという意味．

11.3 空間統計モデルをデータにあてはめる

事後分布は

p(\beta, s, \{r_j\} | Y)
\propto p(\{r_j\} | s) p(s) p(\beta) \prod_j p(y_j | \lambda_j)

右辺の$p(y_j | \lambda_j)$は平均$\lambda_k = \exp (\beta+r_j)$のポアソン分布とした．
$\beta$は大域的なパラメータなので無情報事前分布$p(\beta)$を指定．
$r_j$は局所的なパラメータであり，空間相関を考慮した階層事前分布$p$({$r_j$}$|\mu_j, s$)を指定．

WinBUGSによる実装．

図11.4が場所ごとに変わる平均個体数$\lambda_j = \exp(\beta + r_j)$の結果．

11.4 空間統計モデルが作りだす確率場

一般に，相互作用する確率変数で埋め尽くされた空間は確率場と呼ぶ．
{$r_j$}も確率場の一種．

図11.5：$s$を変えたときの{$r_j$}の事後分布からのサンプリング例．
$\beta=2.27$に固定．
$s$が小さいと両隣の平均と似ている傾向が強く，$r_j$全体のばらつきは小さい．

この確率場は少数の大域的パラメータ（この例題では$s$）にコントロールされている．
$r_j$は独立した確率変数ではなく，両隣{$r_{j\pm1}$}と$s$で決まる．

11.5 空間相関モデルと欠測のある観測データ

空間相関を組み込んだ階層ベイズモデルの強みのひとつ：
欠測のあるデータに対してより良い予測が得られることがある．

図11.6：図11.2から何点かのデータを除いたもの．
これに対して11.2節の空間統計モデルと，空間相関を無視している階層ベイズモデルをあてはめて結果を比較する．

図11.7(A)：空間統計モデルの結果．欠測データがない場合（図11.4）とあまり変わらない．
隣接相互作用があるので，近くのデータ点の情報をうまく利用できたため．

空間相関を考慮しないモデルでは，区画$j$ごとに独立な場所差$r_j$を仮定．
すべての$r_j$に共通の事前分布

p(r_j|s) 
= \frac{1}{\sqrt{2 \pi s^2}} \exp \left( - \frac{r_j^2}{2s^2} \right)

前章の階層ベイズモデルと同じ．

図11.7(B)がその結果．各区間のデータ$y_j$に合わせようとするためばらつきが大きく，欠測データのある領域で不定性が大きい．

11.6 この章のまとめと参考文献

You get articles that match your needs
You can efficiently read back useful information
You can use dark theme

What you can do with signing up