医療✖️AIトレンドまとめ 2023/05/01-05/31
自然言語処理を用いた初期診療対話分析
- 医師と患者の対話に基づいて初期医療相談の臨床コードを識別するためのテキスト分類器を開発・評価するもの
- 初期医療相談の会話記録('One in a Million'データセット)を用いて、ナイーブベイズ、サポートベクターマシン、最近傍重心、従来のBERT分類器、そして少数ショットのBERT手法を使用したNLP分類器を訓練
- 全てのモデルの中で、ファインチューニングされたBERT分類器が最も優れた結果に
- 遠隔監督は、191のラベル付きトランスクリプトによる従来の監督に比べて、
モデルのパフォーマンスを0.45から0.51まで改善 - 医師の発言だけでなく患者の発言も取り入れることで、BERT分類器の
パフォーマンスが0.45から0.55まで改善 - NLP分類器がオーディオトランスクリプトから初期医療相談で話し合われている
臨床領域を識別するために訓練できることを示している - これは診察室でのスマートなデジタルアシスタントに向けた重要な一歩となる
可能性がある
乳がんスクリーニングのAI性能における撮影条件の影響
- AI性能は機器とソフトウェアの影響を受ける
- 装置のソフトウェアアップグレード後、リコール率が約 3 倍になり、バージョンごとの閾値が必要になった
- 品質保証を慎重に行う必要がある
高血圧に対する個別化治療の可能性
- 高血圧で個人に合わせた薬の選択が可能かどうかを調査
- 人によって薬の効果が異なり、個別治療が平均血圧を4.4mmHg低下させる可能性がある事が判明
RSNA(北米放射線医学会)による対談
「GPT4が画像診断に与える影響」
- 画像診断レポートの革命となるか?
- 若手とエキスパートにとって価値があるか?
- 医学部生の教育にどのような影響を与えるか?
- 診断を改善させるか? 最も価値のあるものは?
- 論文査読にどのような影響を与えるか?
医師よりChatGPTの方が患者さんに好まれる!?
Comparing Physician and Artificial Intelligence Chatbot Responses to Patient Questions Posted to a Public Social Media Forum
https://jamanetwork.com/journals/jamainternalmedicine/article-abstract/2804309
放射線診断 研修医のためのAI教育ワークショップ
An Artificial Intelligence Training Workshop for Diagnostic Radiology Residents
https://pubs.rsna.org/doi/10.1148/ryai.220170
- 3週間の医療AIワークショップ
- 実践的・教訓的な講義、文献のケーススタディ、プログラミング例で構成
- 約9割の研修医がワークショップにてAIの理解を深めたと回答
ヘルスケアデータを扱うためのNFT
Non-fungible tokens for the management of health data
https://www.nature.com/articles/s41591-022-02125-2
血液脳関門開放術による遺伝子治療法の開発
血液脳関門開放術による遺伝子治療法の開発
―身体を傷つけない脳疾患の治療を目指して―
https://www.kyoto-u.ac.jp/ja/research-news/2023-04-20
心理面における大規模言語モデル
Boosting Theory-of-Mind Performance in Large Language Models via Prompting
https://arxiv.org/abs/2304.11490
- メンタルなどの心理面のタスクで AIの性能を向上させることが重要
- 適切なプロンプトで、心理面の問いに対してGPT-4は100%の精度を出した
- 人とAIとの相互理解の為に重要なステップである
医薬品流通もブロックチェーン
光で脳の神経細胞の活動を操る光遺伝学
デジタル技術で歯科改革
脳内の言葉文字化するAI、ChatGPTと同手法
糖尿病患者の健康、AIが助言
過少評価されやすい脳卒中後の認知障害
「脳卒中後の認知症に関する科学的声明」
Stroke(米国心臓協会 AHA)
医療画像AIのバイアスの特定と軽減
Toward fairness in artificial intelligence for medical image analysis: identification and mitigation of potential biases in the roadmap from data collection to model deployment
https://www.spiedigitallibrary.org/journals/journal-of-medical-imaging/volume-10/issue-06/061104/Toward-fairness-in-artificial-intelligence-for-medical-image-analysis/10.1117/1.JMI.10.6.061104.full?SSO=1
- データ収集、データの準備と注釈、モデル開発、モデル評価、モデル展開の
5 つのステップで検討 - 29 の潜在的なバイアスの原因を特定
例: 興味深いもの
- 歴史的バイアス
- 資金調達バイアス
- 自動化バイアス
マンモグラフィにおける自動化バイアス
Automation Bias in Mammography: The Impact of Artificial Intelligence BI-RADS Suggestions on Reader Performance
https://pubs.rsna.org/doi/10.1148/radiol.222176
- 自動化バイアスは、自動決定システムからの提案を人間が好む傾向のこと
- 放射線医師は、AIによってマンモグラフィの評価が大きく影響を受けた(未経験者の方がその傾向が強かった)
YOLOの最新版
YOLOの最新版:YOLO-NAS(四角で物体検出するAIモデル)
- 動画はYoloの前のバージョンとの比較
- YOLO-NASは小さい奥の人たちや、右奥の小さい車を良く検出している
通常の放射線量の1%でのPET
AI Transformers for Radiation Dose Reduction in Serial Whole-Body PET Scans
https://pubs.rsna.org/doi/10.1148/ryai.220246
- 通常のPETの放射線量(3 MBq/kg)の1%の超低線量
- TransformerベースのAIにより、低線量でも、ノイズが大幅に少なく、より詳細な
構造を示すことが可能となった
→ PETのAIも珍しい
ChatGPTは形成外科試験で1年目の形成外科レジデントと同等
ChatGPT Is Equivalent to First-Year Plastic Surgery Residents: Evaluation of ChatGPT on the Plastic Surgery In-service Examination
https://academic.oup.com/asj/advance-article-abstract/doi/10.1093/asj/sjad130/7151262?login=false
-
ChatGPTは形成外科試験で1年目の形成外科レジデントと同等
-
日米の医師国家試験をパスした研究はありましたが、専門分野ははじめてかも
-
1129問の質問にChatGPTは630問(55.8%)を正確に回答
-
試験年度や試験セクションごとの正答率には有意な差はなし
-
2022年の形成外科のレジデントのパフォーマンスと比較すると、ChatGPTは
一年目の統合形成外科レジデントで49パーセンタイル、
二年目のレジデントで13パーセンタイル、
三年目と四年目のレジデントで5パーセンタイル、
五年目と六年目のレジデントでは0パーセンタイル
にランクされた
画像診断支援AIの業界地図
ホンダが医療向けドライビングシミュレーター
CTの肺梗塞データセットに解剖学的情報を追加
AI病院
- タブレット端末のAI問診
- 放射性物質を使う検査では、ロボットが患者を案内
- 自動調剤ロボット
- リアルタイムで医療機器の使用状況、集中治療室の入室日数などを見える化
AIがICU内での意思決定を支援
医療用AIの実用には、AI対応組織が必要
Clinical use of artificial intelligence requires AI-capable organizations
https://academic.oup.com/jamiaopen/article/6/2/ooad028/7150783?login=false
イタリア放射線学会による説明可能AIのホワイトペーパー
Explainable AI in radiology: a white paper of the Italian Society of Medical and Interventional Radiology
https://link.springer.com/article/10.1007/s11547-023-01634-5
手術の質問に対するGPT-4の活用
Evaluating Chatbot Efficacy for Answering Frequently Asked Questions in Plastic Surgery: A ChatGPT Case Study Focused on Breast Augmentation
https://academic.oup.com/asj/advance-article-abstract/doi/10.1093/asj/sjad140/7157259
- ChatGPT-4は質問に対して構造的に適切で、文法的に正確で、包括的な回答を提供
- しかし、パーソナライズされたアドバイスを提供する点では限界があり、時折不適切あるいは時代遅れの参照を生成することがあった
- ChatGPT-4は乳房増大に関する患者教育の補助ツールとして有望を示したが
改善の余地は大きい - チャットボットの信頼性と適用性を向上させるために、さらなる進歩とソフトウェア
エンジニアリングが必要
医療機器ソフトウェアにおけるAIと高リスク医療機器
Artificial intelligence in medical device software and high-risk medical devices – a review of definitions, expert recommendations and regulatory initiatives
https://www.tandfonline.com/doi/abs/10.1080/17434440.2023.2184685
- AIシステムは医療機器ソフトウェアとして認められるか、医療機器内に埋め込まれることがある
- EUのMDSWに関するガイダンスは、国際的な推奨事項に基づいているが、医療AIソフトに必要な臨床的証拠の記載はない
エクサウィザーズと阪大が認知症診断機器
- 簡易クイズで数分以内に認知症の度合いを診断する医療機器を開発する
- ウオーキングなどの運動と簡単な計算式などを解いてもらい、解答速度などから
認知症発症の有無や症状の程度を判別 - 認知症診断はスクリーニングテストなどに数十分かかる場合もあった。
- 認知症専門医でなくても開業医らが診断できるようになる。クイズ感覚で診断できる
がんワクチン開発の取り組み
- 米スタートアップのグリットストーン・バイオ
- がんへの免疫力を高める治療薬「がんワクチン」を患者ごとに作成
- 抗がん剤が効きにくい大腸がんの患者の半数で生存期間が3倍に延びたことを臨床試験で確認
- NECなども初期の治験で良い結果を得た。
- 20年代中盤には個別の患者に対応して効果を最大にするがんワクチンが実用化する可能性
中外製薬、全社にRPA浸透 20万時間分の業務削減へヘルスケア
MRIにおける良性悪性の椎体骨折診断のAIと放射線科医との比較
Benign vs malignant vertebral compression fractures with MRI: a comparison between automatic deep learning network and radiologist’s assessment
https://link.springer.com/article/10.1007/s00330-023-09713-x
- MRIのT1、T2で椎体骨折が両性花悪性化を判断するタスク
- ディープラーニングTwo-Stream Compare and Contrast Networkモデルを利用
- AIは放射線科医よりも診断性能が優れていた(精度90-95%)
一般医療AIモデルの可能性
Foundation models for generalist medical artificial intelligence
https://www.nature.com/articles/s41586-023-05881-4
AIによるOCT画像からの視力推定
An AI model to estimate visual acuity based solely on cross-sectional OCT imaging of various diseases
https://link.springer.com/article/10.1007/s00417-023-06054-9
- 光干渉断層法(OCT)スキャンを使用して、最良矯正視力を推定するためのAIモデルを開発
- 決定係数 0.512
- 外部データでは精度は落ちたが、将来的な可能性は示された
→ ここから得られた知見をどう発展させて行くかが重要
藤田医科大学、医療データ共有基盤を構築
グラフニューラルネットワークを用いた病理AI
Screening of normal endoscopic large bowel biopsies with interpretable graph learning: a retrospective study
https://gut.bmj.com/content/early/2023/05/11/gutjnl-2023-329512
Fitterfly 糖尿病デジタル治療プログラムの効果
- インド拠点の企業
- 持続血糖測定により、アプリとコーチを介して、個別化された食事および運動介入を提供
- 2型糖尿患者109名に対する90日間のプログラムによって、HbA1c値の有意な減少効果と体重減少効果を示した
外科領域におけるAI活用とリスク対策
- 外科領域におけるAI活用が進むことは自明とした上で、リスク軽減のための施策を提案
- 具体的には、医療専門家による二次的評価、非識別化プロトコルやセキュリティ手段、免責事項の見直し、患者教育、新しい同意書などが必要
ChatGPT: 退院サマリーの将来
ChatGPT: the future of discharge summaries?
https://www.thelancet.com/journals/landig/article/PIIS2589-7500(23)00021-3/fulltext
- ChatGPT応用の潜在的な分野の 1 つは退院概要生成
- 退院サマリーを作成するには時間がかかり、医師に負担がかかる
- 退院サマリーは大部分が標準化された形式であるため、この技術には明らかな適用可能性がある
- ChatGPTを使用すると、医師は特定の情報の要約、詳述すべき概念、説明すべき指導を入力し、数秒で正式な退院サマリーを出力することができる
- プロセスの自動化は初期研修医の作業負担を軽減し、患者ケアの提供と研修の機会の追求により多くの時間を割くことを可能にする
- 従来の方法で書かれた退院サマリーがしばしば詳細を欠いているという以前の研究から退院サマリーの質そのものを改善する可能性がある
要約AI市場は27年に2兆円に
精緻な医療データを製薬利用へ 法改正、個人情報は配慮
- 患者の医療情報を個人が特定できない形で値を加工せずに研究利用できるようにする改正次世代医療基盤法が5/17成立
- 氏名は伏せるが血圧や体重などのデータを使えるようにする仮名加工制度を設ける
- 政府は医療データを個人特定できないよう加工すれば、第三者が本人の同意なしに公益目的で使えるようにする
- 2024年以降に特別法法案を国会に提出
- 対象は電子カルテ・電子処方箋・レセプトなどのデータ
- 適切な二次利用か監督
医療専用の大規模言語モデル GPT-4を圧倒!?
「GPT-4 vs. Hippocratic AI」
- 米国医師国家試験
- 看護師試験
- 栄養士試験
- 薬剤師試験
- 医療専門のコード付け四角
全てにおいてHippocraticが上回った!
ChatGPTは問診実習の 模擬患者 になり得るか
米国司法試験の点数比較
- GPT-4(緑)はChatGPTよりも点数が26% up
- 学生の平均点(青)も上回っている
→ GPT-4以前の言語モデル(赤)は少しずつ点数が上がってきているけど、GPT-4で一気に飛び抜けている
大規模言語モデルに対するWHO声明
大規模言語モデルの利用に対するWHOの懸念
https://aitimes.media/2023/05/19/13364/
以下の5つの点を指摘
- AIの訓練データに潜む偏りの可能性が、健康、公平性、包摂性へのリスクとなり、誤解を生む不正確な情報を生成する場合がある
- LLMは一般ユーザーに権威性があるもっともらしい回答を生成するものの、健康情報については完全に誤っている場合や深刻なエラーを含む可能性がある
- ユーザーがLLMのアプリケーションに提供する機密情報が、適切に保護されない可能性がある
- LLMに説得力のある偽情報を生成させて拡散する手段として悪用されると、一般ユーザーは情報の信頼性を判断することが困難となる
- テクノロジー企業がLLMを商用化する過程で、患者の安全が保護されるよう、WHOは政策立案者らに提言を続けていく。
メディカル・イラストレーター
- 医療系の論文・手術記録/説明に掲載する図を描く、専門のイラストレーターがいる
- 最近はCT/MRI画像からリアル3D画像が構築できるようになっていますが、分かりやすく表現できることはとても有用
東工大や富士通が和製生成AI 富岳 使い23年度中に
-
スーパーコンピューター 富岳 を使って生成AIの基盤となる大規模言語モデル開発すると発表
-
富岳は世界ランキング2位
-
ただし、GPUを搭載していない
-
国内にあるAIの計算に特化したスパコンと比べても「富岳は高性能のCPU(中央演算処理装置)を多く搭載しており、AI開発でも性能は高い」(富士通)
-
一位のフロンティアは圧倒的(2位に3倍の速さ)
-
米国強いけど、日本・フィンランド・イタリア・中国も頑張ってる
-
富岳の開発には1100億円の国費が必要だった
遠隔デジタル術後創傷モニタリングの評価
Evaluation of remote digital postoperative wound monitoring in routine surgical practice
https://www.nature.com/articles/s41746-023-00824-9
富士フイルム、医師をAI開発者に 希少疾患向け画像診断
臨床試験におけるデジタルヘルステクノロジー
Digital health technology in clinical trials
https://www.nature.com/articles/s41746-023-00841-8
- DHTは臨床試験において重要な改善をもたらしている
- 患患者中心のアプローチを可能にしている
- 長期間にわたって自宅での個人データの収集が可能
- デジタル格差に苦しんでいる人々の不利益などの課題
根治的治療の対象となる前立腺癌のスクリーニングAI開発
- AIモデルは針生検の全スライドイメージを用いて前立腺腺癌を「積極的な監視」と「決定的治療が必要」に分類
- AUC 0.85-0.98
- 前組織学的診断フローの実用の可能性
脳外科のUS問題集に対するChatGPTの精度
ChatGPT versus the neurosurgical written boards: a comparative analysis of artificial intelligence/machine learning performance on neurosurgical board–style questions
https://thejns.org/view/journals/j-neurosurg/aop/article-10.3171-2023.2.JNS23419/article-10.3171-2023.2.JNS23419.xml
- 643の脳神経外科学会のSANS問題 (研修医のための学習問題集)
- 正解率 約53%
- 医学生 < 研修医 < ChatGPT < 平均的なSANSユーザー
→ GPT-4だと結果は違ってきそう
医療システム データの大規模な整理・記述
Ontologizing health systems data at scale: making translational discovery a reality
https://www.nature.com/articles/s41746-023-00830-x
- 一般的なデータモデルは電子カルテを標準化するために使用
- OBOオントロジーは生物学的知識の計算可能な表現を提供し、異種データの統合を可能にする
- 24の病院で、薬剤成分・測定結果に関するマッピングを生成
ChatGPT、GPT-4 は 米国消化器病学会の試験で不合格
- 画像問題を除く455問の選択式問題
- 合格基準70%に対し、GPT-3.5で65%、GPT-4で62%の正答率で不合格
- 理由: 有料購読の医学雑誌にアクセスできない。時代遅れや非科学的な情報源に基づく
→ 最新情報へのアクセスが課題
大規模言語モデルがEBMを推進する
- エビデンスに基づく医療(EBM)
- 膨大なエビデンスを評価することが困難になってきている
- 大規模言語モデルはこのエビデンスレベルの評価プロセスを迅速に行える可能性がある
AIと医療現場の間にある障壁
臨床現場に革新的技術を統合する障壁
- 医療側の知識不足。スタートアップとの文化の違い
- 厳しい規制と技術検証要件のコスト
- 医療システム側における技術調達プロセスの課題
- 大規模企業に比べスタートアップ側の多面的な不利
医用画像の AI 読影の現状と将来
The Current and Future State of AI Interpretation of Medical Images
https://www.nejm.org/doi/full/10.1056/NEJMra2301725
- 期待と臨床実装のギャップが存在するが希望もある
- 将来の大規模AIモデルは、画像データ、音声、医療文書を処理し、高度な医学的推論を反映した説明、音声による推奨事項、画像の注釈などの出力を生成できるようになると予想
AIが脳卒中認識で緊急通報ハンドラーを上回る
AI framework beats emergency call handlers in recognizing stroke for both sexes
https://www.news-medical.net/news/20230525/AI-framework-beats-emergency-call-handlers-in-recognizing-stroke-for-both-sexes.aspx
- コペンハーゲン救急医療に寄せられた150万件を超える電話のデータセット
- 脳卒中のリスクを予測するAIを開発
- AIは緊急通報ハンドラーよりも効果的に機能(F1値で35.7 vs. 25.8)
→ これは実装しやすそう
ChatGPT連携ヘルステックサービス事例25選(カオスマップ)
薬機法対応AI
- ZETA VOICE:コンテンツチェック機能
- ユーザーからの口コミ・Q&Aが「景表法・薬機法により制限されている表現」などに該当するか、AI (ChatGPTなど) により自動判定する機能
徳島大、AIで心不全の発症確率を診断 X線画像使用
- 心不全の疑いがある900人分の胸部画像と、カテーテルを使った精密検査の結果をAIに学習
- 心臓疾患の専門医がいない地域の医療機関などでも役立つ
診断・診療支援AIシステム市場予測
「診断・診療支援AIシステム市場予測」矢野経済研究所
https://www.yano.co.jp/press-release/show/press_id/3241
- 医療分野でのAI利活用は黎明期から普及期にシフトしつつあり、AI搭載型の医療機器の増加とともにAIアプリケーションの多様化が見込まれる
- 2027年の国内診断・診療支援AIシステム市場規模は165億円に拡大を予測
厚労省 医療AIの実態調査へ
- 主な医療AIは国が医療機器として承認し、メーカーが医療機関に販売しているが、普及状況やトラブル の有無など実態はわかっていない
- 2024年度までに利点や課題を抽出
- 医師の負担軽減や医療の質向上に役立つとみて、導入を促す考え
医療AI論文の推移(分野別)
A short guide for medical professionals in the era of artificial intelligence
https://www.nature.com/articles/s41746-020-00333-z