はじめに
地理空間データの勉強を始めようとして、村上大輔さんの「Rではじめる地理空間データの統計解析入門」(2022年4月6日発売)を読み初めました。まだ全て読んでないですが、間違い無く良書なので、本の中で紹介されていた手法を使い手を動かしてみました。なお、書いているコードの9割は本書に記載されている物を使います。前回は同時自己回帰モデル(Simultaneous Autoregressive; SAR)と呼ばれる空間相関をモデルを実装し、回帰係数の解釈までを行いました。今回は条件付き自己回帰 (Conditional Auto-regressive; CAR)と呼ばれる1つのエリアが周りのエリアの影響を受けているという仮定するモデルについてまとめてみます。(Rでの実装はSARモデルの場合とさほど変わらないので省略致します)
前回
条件付き自己回帰 (Conditional Auto-regressive; CAR) model
同時自己回帰モデル(Simultaneous Autoregressive; SAR)とはエリア間の空間相関関係を同時にモデル化するもので、同時多発的に各エリア同士が影響しあう空間相関性を仮定するものです。また、条件付き自己回帰モデル(Conditional Autoregressive; CAR)とは1エリアの観測値が周りのエリアの影響を受けていると仮定します。エリア同士の同時多発的相互作用は考慮されません。また、CARモデルは観測値が少ない(絶滅危惧種の分布パターンや疫病の感染者数)データに活用される事があります。
また、CARモデルは観測値が少ない不確実(絶滅危惧種の分布パターンや疫病の感染者数など)なデータに活用される事があります。たとえば、以下の分布図では、右下端の3という観測値がたまたまなのか、それとも必然なのか、判断が難しい場合に活用されます。CARモデルはMCMCを始めとするベイズ推定が活用される事で、データの不確実性をカバーしています。
Intrinsic CAR モデル
代表的なCARモデルで、以下の式で表されます $\dfrac{\sum_j w_{ij} z_{j}}{\sum_j w_{ij}}$ で近隣エリアの期待値を与え、空間相関を考慮しています。
$\tau^2$は$z_i$の分散であり、大きいほどエリア間の差が説明され、0に近いほど一様に近い分布になります。
$\sigma^2$は$\epsilon_i$の分散であり、大きいほどノイズが多くなり相関関係が説明されにくく、小さいほど空間相関が説明されます。
$$
y_i = \sum^K_{k = 1} x_{i,k}\beta_{k}+z_i + \epsilon_i, \qquad z_i|z_{j \ne i} \sim N\Big(\dfrac{\sum_jw_{ij} z_{j}}{\sum_j w_{ij}}, \dfrac{\tau^2}{\sum_jw_{ij}}\Big), \qquad \epsilon \sim N(0, \sigma^2)
$$
拡張版 Intrinsic CAR モデル
ICARモデルは弱い空間相関を捉えられない弱点があります、そのため、ICARモデルを拡張したモデルがいくつか存在します。
Besag-York-Mollie(BYM) モデル
ノイズ$\theta_j$を加える事で弱い相関関係を捉えます。
$$
z_i|z_{j \ne i} \sim N\Big(\dfrac{\sum_j c_{ij}(z_{j}+\theta_j)}{\sum_j c_{ij}}, \dfrac{\tau^2}{\sum_j c_{ij}}\Big), \qquad \theta_j \sim N(0, s^2)
$$
Leroux モデル
相関の強さを表す$\rho$を加える事で空間相関を説明します。
$$
z_i|z_{j \ne i} \sim N\Big(\dfrac{\rho\sum_j c_{ij}z_j}{\rho\sum_j c_{ij}+1-\rho}, \dfrac{\tau^2}{\rho\sum_j c_{ij}+1-\rho}\Big), \qquad \theta_j \sim N(0, s^2)
$$.
Stern and Cressie モデル
Lerouxモデル同様、相関の強さを表す$\rho$を加える事で空間相関を説明します。
$$
z_i|z_{j \ne i} \sim N\Big(\rho\dfrac{\sum_j c_{ij}z_j}{\sum_j c_{ij}}, \dfrac{\tau^2}{\sum_j c_{ij}}\Big), \qquad \rho \sim Unif(0, 1)
$$
おわりに
村上大輔さんの「Rではじめる地理空間データの統計解析入門」で紹介されている、空間相関モデルのひとつ、条件付き自己回帰 (Conditional Auto-regressive; CAR)モデルの概要について簡単にまとめました。詳しい実装方法が知りたい方は、ぜひ当本を手にとってみてください。
参考文献