More than 1 year has passed since last update.

元医療言語処理erが医療ドメインのハッカソンに飛び込んでみた話

HealthTechHackathon

Last updated at 2023-07-08Posted at 2023-07-08

2023年7月1日（土）・2日（日）の2日間に渡り開催された Qiita × Fast DOCTOR Health Tech Hackathon に、チーム IC として参加させていただきました。

自己紹介 & 参加の経緯

普段はソフトウェアエンジニアとして、ノーコードAIモデル開発ツール『Node-AI』のプロダクト開発に従事しています（今回のハッカソンへの参加は、所属する会社を代表するものではありません）。

今年の3月までは大学院の修士課程で、自然言語処理という分野で研究を行っていました。修論のテーマとは別に、医療分野で日本語の言語モデルを作るプロジェクトに関わっており、最終的には JMedRoBERTa というモデルを HuggingFace で公開するまで至りました。
JMedRoBERTa は 2023 年 7 月現在、日本語の医療分野の言語モデルの中で最も簡単に使えるものであると自負しています。ChatGPT のような生成モデルではないのでテキストを生成することはできませんが、埋め込み(Embedding)の作成などには十分に使えるのではないかと思います。実際、下の記事で紹介されているように、OpenAI の text-embedding-ada-002 よりも性能が上回るケースもあるようです。

今回ハッカソンに参加した経緯として、自然言語処理を研究していた身からしても、ChatGPT 以後この分野が大きく様変わりしたように感じていたからです。
そもそも LLM が登場する前は、「日本語の自然言語処理」「医療ドメインの自然言語処理」はそれぞれ「英語の一般ドメインの自然言語処理」よりもかなり難しい、というのが研究界では常識でした。だからこそ私たちの研究では、日本語の医療ドメインの言語モデルを新しく作り、それが従来の日本語の言語モデルよりもタスク性能がうまくいくことを泥臭く示していたのです。
ところが、ChatGPT が登場してからというものの、もはや誰もが手軽に、言語やドメインを問わず自然言語を処理できるようになりました。こうなると、どうやって自然言語処理をやるかというよりも、自然言語処理を使って何をやるかというアイデア出しがより重要になります。

今回のハッカソンに参加したのは、自然言語処理のある種の「民主化」というフェーズを迎えた今、エンジニア達がどのような新しいアイデアをこの分野にもたらすのかにとても関心があったからです。また、LLM 周りの技術トレンドのスピードは凄まじく、自然言語処理で修士号を取ったというだけでは最早太刀打ちできなくなっているのではないかという危機感も同時にありました。

制作物

前置きが長くなってしまいましたが、今回私は医療の入り口である「病院の選び方」というフェーズに着目し、ChatGPT を用いた新しい病院検索サイトを開発してみました。

これは、Google Places API により取得できる口コミを、ChatGPT を使って様々な観点から要約する Web アプリケーションになります。このアプリが ChatGPT を通じて提供する価値は以下の2点です。

従来のレビューサイトでは、様々な人が様々な観点からレビューを書いているため、自分の知りたいポイントに絞って情報を得るのにに苦労する（=構造化されていない）。一方、今回作成したアプリでは、「医者・スタッフの対応の丁寧さ」等の特定の観点からレビューを要約できる。
レビューサイトにはサクラのいる可能性もあるので、Pros / Cons 両方から中立的に情報を得たいが、攻撃的なレビューも多いので読破するのはしんどい。一方、今回作成したアプリでは、メリット・デメリット双方を簡潔に提示できる。

なお、要約の部分では以下のようなプロンプトを与えています。

以下の口コミから、この病院の「医者・スタッフの対応の丁寧さ、相談のしやすさ」を箇条書きで簡潔にまとめてください。

【レビュー1】
...

【レビュー2】
...

Google Places API により取得できる口コミが高々 5 件しかないというのが欠点ではありますが、なかなかうまく ChatGPT は要約するものだなぁと作りながら感心していました。

おわりに

今回私はソロでハッカソンに参加していたのもあり、元から頭の中で温めていたアイデアをゴリゴリ実装する、という形で参加させていただきました。
他のチームを見ると、医療従事者とのディスカッションをもとに、ダイレクトに医療従事者の悩みを解決するようなプロダクトを開発しており、とても刺激を受けました。特に、最優秀賞チームの ANDEVER さんの、長谷川式認知症スケールの採点を ChatGPT で行うというアイデアはすごく面白いと思いました。
LLM を使ったプロダクト開発は多くの可能性を秘めていそうなので、今後も積極的に参加していきたい所存です。

You get articles that match your needs
You can efficiently read back useful information
You can use dark theme

What you can do with signing up