はじめに
こんにちは。論文を1人で読んだ結果の紹介記事です。
今回紹介するのは、「Federated learning for predicting clinical outcomes in patients with COVID-19」という論文です。
- タイトル:Federated learning for predicting clinical outcomes in patients with COVID-19
- 出典:Ittai Dayan, et al.; Nature Medicine, 2021
- URL:https://www.nature.com/articles/s41591-021-01506-3.pdf
概要
複数の医療機関でデータを共有せず連合学習を適用してCOVID-19患者の酸素必要量を予測した。
AUCは0.92を達成し、単一の医療機関で学習させるよりも16%も平均AUCを向上した。
技術的特徴
- 連合学習(Federated Learning, FL)の1つであるクライアント・サーバー方式では、未学習モデルを他のサーバー(ノード)に送り、ノードで学習が行われる。その結果を中央のサーバーで統合(連合)し、訓練を終了させるまで(モデルが収束するまで)反復する。クライアントとサーバーの間ではモデルの重みや勾配のみが伝達される。
- 説明変数は20個の特徴量(胸部エックス線画像や血液検査の結果、酸素飽和度など)で、目的変数は救急診療部への入院から24時間後、72時間後の患者の酸素投与量(リスク)
- 目的変数は5種類の0から1の値をとる。分類ではなく回帰を行うので出力値は0~1。
- 画像データに対してはResNet34を使用して特徴抽出する。
- 重みの更新を25%しか共有しなくても連合学習モデルは同等の性能を発揮
- 2019年12月から2020年9月まで20機関から合計16,148件のデータが用意
想定される適用例
- データを共有できないシステム間でのモデルの統合
- エッジとクラウドで構成されるIoTシステム全般