はじめに
東京大学/株式会社Nospare リサーチャーの栗栖です.
前回の記事では経験尤度法の考え方とその導出について紹介しました.今回の記事では経験尤度法を用いた多様体データ解析に関する研究成果(Kurisu and Otsu(2024))について紹介します.
多様体データ
まずは多様体データの設定とその特徴量としてのフレシェ平均について導入しておきます.$\mathcal{M}$を多様体とし,$d:\mathcal{M}\times \mathcal{M} \to \mathbb{R}$を$\mathcal{M}$上の距離関数であるとします.また$\mathcal{M}$に値をとる独立同分布なデータ$X_1,\dots,X_n$を観測するとします.
多様体データの例
以下では代表的な多様体データとその応用例を挙げておきます.
応用例の詳細についてはBhattacharya and Patrangenaru(2014)が参考になります.
-
ユークリッドデータ
・通常の$d$次元ユークリッド空間$\mathbb{R}^d$. -
方向データ:
・風向データ(円周上のデータ)
・地球の磁気方向(球面上のデータ). -
形状データ:
・魚や葉,骨などの形状に基づく生物の形態分類.
・人の運動解析など3次元空間$\mathbb{R}^3$内の画像解析.
・眼球や脳の形状を用いた緑内障や統合失調症の分析. -
行列データ:
・画像データやfMRIで得られた脳の複数領域どうしの信号の相関行列の分析.
多様体データのフレシェ平均
次に,多様体データの特徴量として,ユークリッド空間に値をとるデータに対する平均の考え方を拡張したフレシェ平均について導入します.
ユークリッド空間の場合から始めましょう.$X$を$\mathbb{R}$に値をとる確率変数とし,その期待値を$\mu$とします.このとき,$d_E(x,y) = \sqrt{(x - y)^2}$をユークリッド距離とすると
\begin{align*}
\mu &= \mathrm{argmin}_{\nu \in \mathbb{R}}\mathbb{E}[d_E^2(\nu, X)].
\end{align*}
と表現することができます.この表現を拡張して,$\mathcal{M}$に値をとる確率変数$X$に対するフレシェ平均を以下で定義します.
\begin{align*}
\mu &= \mathrm{argmin}_{\nu \in \mathcal{M}}\mathbb{E}[d^2(\nu, X)].
\end{align*}
以下ではフレシェ平均を経験尤度法を用いて推定する方法について紹介します.
フレシェ平均の経験尤度推定
$m$次元の多様体$\mathcal{M}$上の点$\nu$に対して,その点における接空間$T_\nu \mathcal{M} \subset \mathbb{R}^m$から$\mathcal{M}$への指数写像$\mathrm{Exp}_\nu: T_\nu \mathcal{M} \to \mathcal{M}$を考えます.指数写像を用いると,$\mathcal{M}$に値をとる確率変数$X$に対するフレシェ平均$\mu$は以下を満たすことがわかります.
\begin{align*}
\mathbb{E}\left[\left.{\partial \over \partial x} d^2\left(\mathrm{Exp}_\mu(x), X \right)\right|_{x=0}\right] = 0 \in \mathbb{R}^m.
\end{align*}
上記の関係をフレシェ平均が満たすモーメント条件として経験尤度法でフレシェ平均$\mu$を推定することを考えましょう.前回の記事で紹介した経験尤度(empirical likelihood, EL)推定量において,$\theta = \mu$,
g(X,\mu) = \left.{\partial \over \partial x} d^2\left(\mathrm{Exp}_\mu(x), X \right)\right|_{x=0}
とすると,EL推定量は以下で定義されます:
\begin{align*}
\hat{\mu}_{EL} &= \mathrm{argmax}_{\nu \in \mathcal{M}}\left\{-\sum_{i=1}^{n}\log (1 + \lambda(\nu)'g(X_i;\nu))\right\}\\
&=: \mathrm{argmax}_{\nu \in \mathcal{M}}Q(\nu).
\end{align*}
モーメント条件$E[g(X;\mu)] = 0$が正しいと仮定します.このとき,EL推定量の定義に現れる関数$Q$(経験尤度)に対して,適当な条件の下で以下の結果が成り立つことが知られています:
\begin{align*}
Q(\mu) &\stackrel{d}{\to} \chi_m^2.
\end{align*}
ここで,$\chi_m^2$は自由度$m$のカイ2乗分布です.従って,$q_{1-\alpha}$を$\chi_m^2$分布の$1-\alpha$分位点とすると,上記の結果を用いて$Q(\theta)$のレベル集合 $\{\theta \in \Theta: Q(\theta) \leq q_{1-\alpha}\}$により$\theta_0$の$100(1-\alpha)$%信頼領域を構成することができます.また$q_{1-\alpha}$を critical value とすることで,帰無仮説$\mathbb{H}_0: \nu = \mu$ (対立仮説$\mathbb{H}_1: \nu \neq \mu$) の有意水準$100\alpha$%の検定を実行することができます.
その他の拡張
二標本検定
以下では,ここまで紹介したフレシェ平均の経験尤度推定を二標本検定に拡張する方法についても解説します.$\{X_{1,i}\}_{i=1}^{n_1}$, $\{X_{2,i}\}_{i=1}^{n_2}$をそれぞれ多様体$\mathcal{M}$に値をとるデータとし,$\{X_{1,i}\}_{i=1}^{n_1}$, $\{X_{2,i}\}_{i=1}^{n_2}$は独立かつそれぞれのデータが従う分布のフレシェ平均を$\mu_1$, $\mu_2$とします.このとき,帰無仮説$\mathbb{H}_0: \mu_1 = \mu_2$ (対立仮説$\mathbb{H}_1: \mu_1 \neq \mu_2$) を検定を実行する方法を考えましょう.
$Q_1(\nu)$, $Q_2(\nu)$をそれぞれ$\{X_{1,i_1}\}_{i_1=1}^{n_1}$, $\{X_{2,i_2}\}_{i_2=1}^{n_2}$を用いて計算した経験尤度とします.また$\mu_n$を$\{X_{1,i}\}_{i=1}^{n_1}$, $\{X_{2,i}\}_{i=1}^{n_2}$両方のデータを用いて計算した標本フレシェ平均とします.即ち,
\mu_n = \mathrm{argmin}_{\nu \in \mathcal{M}}{1 \over n_1 + n_2}\left(\sum_{i_1=1}^{n_1}d^2(\nu, X_{1,i_1}) + \sum_{i_2=1}^{n_2}d^2(\nu, X_{2,i_2})\right)
とします.
以上の設定の下で検定統計量を
T_n = Q_1(\mu_n) + Q_2(\mu_n)
と定義すると,適当な条件のもと,帰無仮説のもとで検定統計量はある確率変数$T_\infty$に分布収束することがわかります.また対立仮説の下で$T_n$は発散することがわかります.この結果を用いて,$\hat{q}_{1-\alpha}$を$T_\infty$の$1-\alpha$分位点の推定量とすると,$\hat{q}_{1-\alpha}$を critical value として,$T_n > \hat{q}_{1-\alpha}$の場合に帰無仮説を棄却することで有意水準$100\alpha$%の検定を実行することができます.
まとめ
この記事では経験尤度法の多様体データ解析への応用(Kurisu and Otsu(2024))について紹介しました.次回の記事ではRを利用して,実際に経験尤度法を用いた多様体データ分析を行う方法について解説する予定です.株式会社Nospareには統計学の様々な分野を専門とする研究者が所属しています.統計アドバイザリーやビジネスデータ分析につきましては株式会社Nospareまでお問い合わせください.

参考文献
[1] Bhattacharya, R. and Patrangenaru, V. (2014) Statistics on manifolds and landmarks based image analysis: A nonparametric theory with applications. Journal of Statistical Planning and Inference 145, 1-22.
[2] Kurisu, D. and Otsu, T. (2024) Empirical likelihood for manifolds. R&R at Journal of the Royal Statistical Society Series B.