生殖補助医療におけるXAIの活用（SHAP編）

Posted at 2024-01-10

STAIRLabアルバイトのTds_STです。
前回に続き、生殖補助医療分野においてXAIを使用している論文の紹介です。
今回はその中でも特に数値データでの予測においてSHAPを利用している論文に焦点を当てています。

論文１：子宮内膜症の危険因子の再考:マシンラーニングアプローチ

背景

子宮の内側には子宮内膜という組織が形成されています。
その子宮内膜が子宮以外の場所に異所的に形成されてしまう疾患を子宮内膜症と呼びます。この子宮内膜症は早期発見があまりできておらずそのための技術開発が必要とされています。
そこでこの論文では3種類のタイプの違うデータを用いて、子宮内膜症リスクの予測を行い、SHAPを用いて危険因子の特定を試みています。

方法

UK-Biobankのデータを使用して、複数の機械学習手法により予測を行い、SHAPにより予測への寄与度の高い特徴を調べています。

UK-Biobank：イギリスの医療データベースで2006～2010年に登録された40～69歳の方々のデータです。診断歴、処置歴、ライフスタイルなどの多様なデータが集計されています。この研究ではUK-Biobankのデータからライフスタイルと測定値、ICD-10(国際疾病分類)に基づいた診断結果、遺伝子情報を抽出し、それぞれに対し個別のモデルを訓練しています。

使用データは50万人のデータから親族関係のない白人女性148,647人(子宮内膜症でない人：142,723、子宮内膜症の人：5,924)のデータを抽出しています。
そして、このデータにおいて子宮内膜症の人とそうでない人で出生年の分布に有意な差があったため、この差を埋めるサンプリングを実施し最終的に76,912人(子宮内膜症でない人：71,088、子宮内膜症の人：5,924)のデータで学習をしています。
使用した特徴量はそれぞれ

ライフスタイルと測定値：46のライフスタイルと身体測定に関するデータ(下図がデータの一部です)

ICD-10：970種類の疾病についての診断データ
遺伝子：65の遺伝子変異データ
となっています。

特徴量は先行研究によって子宮内膜症の関連があると考えられているものをもとに、医療専門家の意見も考慮し決定されています。

結果

下の図は各データ及び複数データの組み合わせによる学習の結果となります。
A,Bは様々なパターンの入力データでのCatBoostの学習結果を示しています。
a,b,cは入力データの種類を表し、それぞれライフスタイルと測定値、ICD-10、遺伝子です。A,Bから入力データに3種類全てを使用したモデルがもっともスコアが高い結果となりました。
Cはa,b,c全てを入力データとし、モデルの種類による比較をしています。その結果CatBoostが最も良い結果となっています。
また、白人以外の全民族のデータで学習を行っても同様の結果になったとのことです。

続いて、下の図は上のCのCatBoostモデルにおけるSHAPによる寄与度解析の結果となります。
こちらの結果から、月経周期の長さ、初産年齢、卵巣・卵管・広靭帯の非炎症性障害、過多・頻発・不順月経などが子宮内膜症予測への寄与度が高いことが明らかとなりました。
また、白人以外の全民族のデータで学習を行ったモデルにおいても同様の結果になったとのことです。

論文２：機械学習アルゴリズムを使用したアジア人女性の妊娠糖尿病（GDM）の予測

背景

妊娠糖尿病とは、妊娠期間中に発見または発症する高血糖状態のことです。
この妊娠糖尿病は胎児に影響を及ぼすことが知られているため、早期発見による適切な処置が必要となります。
そこでこの論文では、母親の健康データ等を用いて機械学習により妊娠糖尿病の予測を行い、SHAPによる因子寄与度の解析を行っています。

方法

韓国内の4地域7つの病院から34387件の年齢、経産歴、基礎疾患、妊娠歴などのデータ（2009～2020）を収集しこれをベースラインデータとし、そこに妊娠後定期的に行う検査データを付加しデータセットを構築しています(ベースライン、E0(妊娠10週まで),、E1(11~13週)、M1(14~24週)の4種類)。
そのデータセットを用いてXGBoostで子宮内膜症の予測を行い、SHAPにより各特徴量の寄与度を解析しています。

結果

下の図が様々な条件での入力データによる学習の結果となります。
Whole,Nulliparity,Multiparityはそれぞれ全てのデータ、未経産のみのデータ、経産のみのデータで学習を行ったものです。
入力データの多いM1において最も良い結果となった一方、E1ではE0に対し予測の向上が見られない結果となりました。

続いて、下の図が未経産、経産両方のデータを使用した、ベースライン、E0、M1におけるSHAP解析の結果となります。
ベースラインとE0では、妊娠前のBMI、以前 GDMの病歴、内分泌疾患の病歴、母体の年齢、糖尿病の家族歴で高い寄与度となりました。
そしてM1では、50g GCTの結果、HbA1Cレベル、妊娠前のBMI、以前のGDMの病歴、および糖尿病の家族歴が高い寄与度となりました。(50 g GCT：経口ブドウ糖負荷テスト、HbA1C：グルコースの結合したヘモグロビン)

また、この論文ではBorutaアルゴリズムによる重要度の高い特徴量の選択も行っています。Borutaにより選択された特徴量はベースラインで10、E0,M1で20となりましたが、その種類はSHAP解析の上位と類似した結果となっています。

そして最後に、SHAP値上位40の特徴(Model[b])、Borutaにより選択された特徴(ベースライン：10、E0,M1：20)(Model[c])、ACOG(アメリカ産婦人科学会)(Model[a])が推奨するGDM危険因子の特徴の3種類のデータで再度学習を行い、精度の検証をしています。下の表がその結果で、Model[a]では性能の低下、model[b],Model[c]では特徴選択前と同様の結果となりました。

まとめ

今回は数値データでの予測におけるSHAP活用の論文を紹介いたしました。
前回ご紹介した論文のようなAIの予測根拠が人の判断基準と一致しているかを確認するための活用とは異なり、疾病に対する予測因子（危険因子）の特定をするための活用となっていました。
このような生殖補助医療においてSHAPを活用した研究はまだあまり数がなく、これからの発展が期待されます。

参考文献

論文1:
Ido Blass, Tali Sahar, Adi Shraibman, Dan Ofer, Nadav Rappoport and Michal Linial. Revisiting the Risk Factors for Endometriosis: A Machine Learning Approach. J Pers Med, 2022, 12(7): 1114
論文2:
Byung Soo Kang, Seon Ui Lee, Subeen Hong, Sae Kyung Choi, Jae Eun Shin, Jeong Ha Wie, Yun Sung Jo, Yeon Hee Kim, Kicheol Kil, Yoo Hyun Chung, Kyunghoon Jung, Hanul Hong, In Yang Park and Hyun Sun. Prediction of gestational diabetes mellitus in Asian women using machine learning algorithms. Sci Rep, 2023, 13: 13356

You get articles that match your needs
You can efficiently read back useful information
You can use dark theme

What you can do with signing up