1
0

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?

More than 1 year has passed since last update.

【論文紹介】ベイズ疾病マッピングの歴史について(後編)

Last updated at Posted at 2022-08-19

こんにちは,株式会社Nospareの小林です.
前回の記事に引き続き,Spatial Statistics に掲載されたMacNab (2022)によるベイズ疾病マッピングに関するレビュー論文``Bayesian disease mapping: Past, present, and future''の紹介を行います.本記事では,多次元疾病マッピングのための多変量ガウス・マルコフ確率場(GMRF)と適応的CARモデルについて紹介をおこない,今後の展望についても触れます.

多変量GMRF(MGRF)

前回の記事でも紹介した多次元疾病マッピングを行うためには,多次元の空間相関,相互共分散,多次元にわたる情報の借用,空間スムージングといった点において多変量GMRFは重要な役割を担っており,単変量GMRFの多次元への拡張はたくさん提案されてきています(下は本論文のTable 2より).
tab.png

MGRFは(単変量の場合と同じように)完全条件付き分布から構成されることが多いですが,MGMRFの構成や適用に関しては,空間パラメータと非空間パラメータがごっちゃになったり,対称性の維持をしなければならなかったりとまだ課題は残されています.

この論文の著者は,coregionalizationというアプローチを提案することで,任意のGMRFの多変量の拡張を行うことを可能にしました.これの基本的な考え方は単変量のGRMFの線形結合に当たります.例えば$\psi$が$n\times K$の行列であるとき,$\xi = A\psi^t $とします.ただし$AA^t$はフルランクの共分散行列になります.$A$の選択によっては次元の縮約を行うことも可能です.coregionalizationには既存の主たるMCAR(multivariate conditional autoregressive model)が含まれています.CoregionalizationについてはMacNab (2016, 2018)を参照してください.

適応的CAR

GMRFは無向グラフモデルであり,一般にノードとエッジの格子に対して定義されます.疾病マッピングによく使われるGMRFでは,エッジは与えられた地図上の隣接関係に基づいた隣接行列$W$によって定義されます.これは隣接地域同士の相互作用を仮定しており,このようなGMRFは通常,なめらかに変化する事後相対リスク予測に繋がり,地図上の一部で起こりうる隣接地域内あるいは間のリスクの異質性を許容するような柔軟性に欠けていることが知られています.より柔軟なモデリングを行うために,適応的CAR(ACAR)モデルが提案されてきました.

ACARモデルは,構築方法によって大まかに2つのアプローチに分けることができます.1つ目のアプローチでは,隣接行列を未知なものとして扱い,これをデータから推定します.2つ目のアプローチでは,$W$を所与のものとし,適応的にパラメータ化されたCARモデルを構築します.前回取り上げたCARモデルの適応的バージョンはすでにいろいろなバージョンが提案されています(下は論文のTable 3より).

tab2.png

これらのACARモデルは,局所的に変化する非対称な空間相関,相互作用,異質性などを捉えることができます.モデリングするために利用でき,さらに大きく3つのカテゴリに分けることができます:

  • pCAR(proper CARモデル)に適応パラメータ$c_i,\ \forall i$を相互作用に導入することでによって空間相関をコントロールする.例えば隣接地域$j$から地域$i$への影響を$\frac{c_i}{w_{i+}},\ \forall j\sim i$としたり(pCAR(a)),$\frac{\lambda c_jc_i}{w_{i+}},\ \forall j\sim i$としたりする(pCAR(b))
  • iCAR(intrinsic CARモデル)において,隣接行列$W$を適応的なバージョン$\tilde{W}$に変更する.例えば$\tau_i\tau_j/(\tau_i+\tau_j)$,$(\sigma_i\sigma_j)^{-1}$,$(c_ic_j)^{1/2}$などといったファクターを$w_{ij}$にかける.あるいは通常のCARモデルを線形変換する.このカテゴリのACARでは,隣接地域$j$から地域$i$への影響は$\frac{c_j}{\sum_{j\sim i} c_j}$(iCAR(a)),$\frac{c_j}{c_iw_{i+}}$(iCAR(b)),といったように,地域$j$の影響は地域$i$の隣接地域たちに対して相対的なものとなる.
  • 1つ目のカテゴリのACARの線形変換を考える(coregionalized adaptive CAR).

おわりに

空間疫学,人口・公衆衛生,医学におけるベイズ疾病マッピングは,COVID-19感染と関連する健康アウトカムのリスクの空間・時空間小地域マッピング,およびCOVID-19関連研究におけるCARモデルの応用などにおいて多く利用されています.高リスク地域や疾病発生・死亡のパターンの特定は,資源配分や局所的な疾病予防・介入のための優先順位設定など,公衆衛生計画に貴重な情報を提供することができるでしょう.病気や疾患のマッピングに加えて,子供の成長の空間モデリング,遺伝子頻度の地理的マッピング,医療利用率のマッピング,ワクチン接種率のマッピングなどのための新しい疾患マッピングモデルも開発されてきています.

統計コミュニティにとってCOVID-19の流行は,特に一般的に用いられているCAR,MCAR,適応的(M)CARモデルについて,厳格な評価とテストを行い,既存の手法を改善し,適用範囲をさらに拡大するよい機会となっています.世界中で利用可能な膨大な量のCOVID-19関連データは,本質的に空間的,時空的,多変量(例:感染,入院,死亡,ワクチン接種率など),多次元配列(例:年齢,性別,リスク/予防因子,国などの他の次元に加えて,様々な公衆衛生介入政策,予防措置,ワクチンの利用可能性に関する空間,時間,多変量の結果)となっています.これらのデータを統計的に分析できるようにすることは,現在(そして将来)の流行とそれが人口や公衆衛生に与える影響をよりよく理解し,パンデミック介入政策について情報を提供する,という点においてとても重要なことです.

疾病マッピングモデルは,心臓病や癌などの希少疾患や非伝染性疾患のモデリングにおいてよく用いられます.典型的なベイズ疾病マッピングモデルは,階層的に定式化された空間的な一般化線形混合モデル(GLMM)であり,様々なデータに対してモデルを適用することが可能です(ポアソン,二項,正規分布など).COVID-19のような伝染病のリスクは,空間的に変化し,空間的不連続性を示す可能性が極めて高いです.これは,感染症や入院や死亡のリスクに影響しうる根本的な健康格差に加えて,近接地域での感染症の発生や伝播の性質,公衆衛生介入政策や予防措置の実施や取り込みの違いなどによるものです.これらの理由から,適応的CARは地域のCOVID-19関連データをモデル化するためのより妥当な選択肢となるかもしれません.

本文中でも紹介があったように疾病マッピング・空間モデリングにおいて(少なくとも著者にとって)最近ホットな研究トピックのひとつとして適応的CARが挙げられており,今後モデルの精緻化が行われていくことが期待されます.例えば,隣接行列$W$をCAR定式化内で追加的にモデル化するアプローチは,局所的に変化する空間的なリスク依存性や隣接地域のリスクの影響に関して解釈がしやすく,また所与の隣接行列に由来する非現実的な空間上のリスク依存性の仮定を和らげることができるでしょう.一方で,隣接行列の要素を2値確率変数としてモデリングすることも適応的モデルの代替となりえますが,このアプローチは柔軟性に欠けることが知られています.今後の展開の可能性としては,これらの2つのアプローチを組み合わせて適応的な空間依存性のモデリングと隣接モデリングを同時に行うことが考えられるかもしれません.また最近の展開として,高解像度グリッド上の空間データに対するINLA-SPDE(integrated nested Laplace approximation-stochastic partial differential equation)アプローチが挙げられます.さらに,有向非巡回グラフの自己回帰モデルによる疾病マッピング,MCARにおける有向非巡回グラフによる非空間依存性のモデリングなども挙げられ,これらのアプローチの組み合わせなども今後の展開として考えられるかもしれません.最後にモデルの開発と関連して,INLA,HMC(Hamiltonian Monte Carlo),変分法などといった数値計算手法のさらなる改善も期待されます.

参考文献

  • MacNab, Y.C. (2016). Linear models of coregionalization for multivariate lattice data: a general framework for coregionalized multivariate CAR modles. Statistics in Medicine, 35, 3827--3850.
  • MacNab, Y.C. (2018). Some recent work on multivariate Gaussian Markov random fields (with discussions). TEST, 27, 497--541.

一緒にお仕事しませんか!
株式会社Nospareには統計学の様々な分野を専門とする研究者が所属しており,新たな知見を日々追求しています.統計アドバイザリーや統計学に関する研修につきましては弊社までお問い合わせください.インターンや正社員も随時募集しています!

株式会社Nospare
1
0
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
1
0

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?