3
1

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?

More than 1 year has passed since last update.

【検証】GPT-3 で国立感染症研究所の速報文をどこまで可視化できるか

Last updated at Posted at 2023-03-04

はじめに

読むのが難しい文章をどこまで可視化・構造化できるか GPT-3 を用いて検証します。

今回、新型コロナウイルスのオミクロン株についての情報を調べていて、国立感染症研究所の「感染・伝播性の増加や抗原性の変化が懸念される 新型コロナウイルス(SARS-CoV-2)の変異株について(第24報)」という文書を見つけました。この文書は医療関係者、研究者向けの速報ドキュメントとして書かれているため、私のような素人が読むものではありません。ただ、大変な情勢の中、世界中の研究者達の成果の凄まじい情報量とこれをまとめた努力に敬意を払いつつ、個人的な興味からどこまで読めそうか検証したくなりました。

※本記事は正確な医療情報を提供するものではなく、個人的に GPT-3 の機能を検証するためのものです。

前提条件

  • 使用モデル: text-davinci-003
  • パラメーター:
    • tempreture: 0
    • Max length (tokens): 2048
    • Top probabilities: 1
    • Frequency penalty: 0
    • Presence penalty: 0
    • Best of: 1
  • オミクロン株は 2021年11月 に報告されました。使用モデル text-davinci-0032021年6月までのトレーニングデータですので、モデルはオミクロン株を知りません。
    ※ChatGPT は知ってました。

GPT-3.5 モデルはオミクロン株を知らない

オミクロン株とは何ですか?

オミクロン株とは、オミクロン株式会社が発行している株式のことです。オミクロン株式会社は、日本の大手電子部品メーカーであり、電子部品、半導体、電子機器などを製造・販売しています。

何にも情報を与えないで質問すると、欲しい回答が得られませんでした。知らないのであれば、知らないと答えてほしい。その場合は、

オミクロン株とは何ですか?知らない場合は知らないと答えてください。

知らない

ちゃんと知らないと回答してくれました。

GPT-3.5 モデルが知らなかったり間違った回答をする場合、In-context Learning の手法を使ってモデルのハイパーパラメータの更新を行うことなく、データを与えることができます。

オミクロン株とは何ですか?知らない場合は知らないと答えてください。

###
現在、流行している新型コロナウイルス(SARS-CoV-2)変異株は、第23報時点と同様に、B.1.1.529系統とその亜系統(オミクロン)が支配的な状況が世界的に継続している。2022年12月2日~2023年1月2日に、世界でゲノム解析され GISAID データベースに登録されたウイルスの98.4%をオミクロンが占め、その他の系統はほとんど検出されていない(WHO, 2023a)。オミクロンの中では多くの亜系統が発生しているが、BA.5系統が63.7%、BA.2系統が15.2%、 BA.4系統が0.7%(いずれも亜系統を含む)と、引き続き世界的にBA.5系統が流行の主流となっている(WHO, 2023a)。日本国内でも2022年7月頃にBA.2系統からBA.5系統に置き換わりが進み、BA.5系統が主流となったのち、10月以降BQ.1系統(BA.5.3系統の亜系統)及びBA.2.75系統の占める割合が上昇傾向にある。また、国内外でオミクロンの亜系統間のさまざまな組換え体も報告されている。世界保健機関(WHO)は、これらのB.1.1.529系統とその亜系統および組換え体を全て含めて「オミクロン」と総称する一方、いくつかの亜系統や組換え体(BA.2.3.20、BA.4.6、BA.2.75、XBBの各系統および、BA.5系統にN450D変異もしくはR346/K444/V445/N460のいずれかの箇所に変異を有するもの)を「監視下のオミクロンの亜系統(Omicron subvariants under monitoring)」としている。
###

オミクロン株とは、B.1.1.529系統とその亜系統を総称して呼ばれる新型コロナウイルス(SARS-CoV-2)変異株のことです。

モデルにコンテキストを与えることで、知らない事象についても回答してくれるようになりました。

(↓コピペ用)

オミクロン株とは何ですか?知らない場合は知らないと答えてください。
###
現在、流行している新型コロナウイルス(SARS-CoV-2)変異株は、第23報時点と同様に、B.1.1.529系統とその亜系統(オミクロン)が支配的な状況が世界的に継続している。2022年12月2日~2023年1月2日に、世界でゲノム解析され GISAID データベースに登録されたウイルスの98.4%をオミクロンが占め、その他の系統はほとんど検出されていない(WHO, 2023a)。オミクロンの中では多くの亜系統が発生しているが、BA.5系統が63.7%、BA.2系統が15.2%、 BA.4系統が0.7%(いずれも亜系統を含む)と、引き続き世界的にBA.5系統が流行の主流となっている(WHO, 2023a)。日本国内でも2022年7月頃にBA.2系統からBA.5系統に置き換わりが進み、BA.5系統が主流となったのち、10月以降BQ.1系統(BA.5.3系統の亜系統)及びBA.2.75系統の占める割合が上昇傾向にある。また、国内外でオミクロンの亜系統間のさまざまな組換え体も報告されている。世界保健機関(WHO)は、これらのB.1.1.529系統とその亜系統および組換え体を全て含めて「オミクロン」と総称する一方、いくつかの亜系統や組換え体(BA.2.3.20、BA.4.6、BA.2.75、XBBの各系統および、BA.5系統にN450D変異もしくはR346/K444/V445/N460のいずれかの箇所に変異を有するもの)を「監視下のオミクロンの亜系統(Omicron subvariants under monitoring)」としている。
###

要約

箇条書きでまとめる

次の文章を3つのポイントにまとめてください。
###
現在、流行している新型コロナウイルス(SARS-CoV-2)変異株は、第23報時点と同様に、B.1.1.529系統とその亜系統(オミクロン)が支配的な状況が世界的に継続している。2022年12月2日~2023年1月2日に、世界でゲノム解析され GISAID データベースに登録されたウイルスの98.4%をオミクロンが占め、その他の系統はほとんど検出されていない(WHO, 2023a)。オミクロンの中では多くの亜系統が発生しているが、BA.5系統が63.7%、BA.2系統が15.2%、 BA.4系統が0.7%(いずれも亜系統を含む)と、引き続き世界的にBA.5系統が流行の主流となっている(WHO, 2023a)。日本国内でも2022年7月頃にBA.2系統からBA.5系統に置き換わりが進み、BA.5系統が主流となったのち、10月以降BQ.1系統(BA.5.3系統の亜系統)及びBA.2.75系統の占める割合が上昇傾向にある。また、国内外でオミクロンの亜系統間のさまざまな組換え体も報告されている。世界保健機関(WHO)は、これらのB.1.1.529系統とその亜系統および組換え体を全て含めて「オミクロン」と総称する一方、いくつかの亜系統や組換え体(BA.2.3.20、BA.4.6、BA.2.75、XBBの各系統および、BA.5系統にN450D変異もしくはR346/K444/V445/N460のいずれかの箇所に変異を有するもの)を「監視下のオミクロンの亜系統(Omicron subvariants under monitoring)」としている。
###
  • 新型コロナウイルス(SARS-CoV-2)変異株の主流は、B.1.1.529系統とその亜系統(オミクロン)である
  • 日本国内ではBA.2系統からBA.5系統に置き換わり、BQ.1系統(BA.5.3系統の亜系統)及びBA.2.75系統の占める割合が上昇傾向にある
  • 世界保健機関(WHO)は、オミクロンの亜系統を「監視下のオミクロンの亜系統(Omicron subvariants under monitoring)」としている

どれも正しく要約されているように見えますが、最後だけ怪しく見えます・・

特定の人向けの要約

次の文章を5歳の子供でも分かるように要約してください。
###
現在、流行している新型コロナウイルス(SARS-CoV-2)変異株は、第23報時点と同様に、B.1.1.529系統とその亜系統(オミクロン)が支配的な状況が世界的に継続している。2022年12月2日~2023年1月2日に、世界でゲノム解析され GISAID データベースに登録されたウイルスの98.4%をオミクロンが占め、その他の系統はほとんど検出されていない(WHO, 2023a)。オミクロンの中では多くの亜系統が発生しているが、BA.5系統が63.7%、BA.2系統が15.2%、 BA.4系統が0.7%(いずれも亜系統を含む)と、引き続き世界的にBA.5系統が流行の主流となっている(WHO, 2023a)。日本国内でも2022年7月頃にBA.2系統からBA.5系統に置き換わりが進み、BA.5系統が主流となったのち、10月以降BQ.1系統(BA.5.3系統の亜系統)及びBA.2.75系統の占める割合が上昇傾向にある。また、国内外でオミクロンの亜系統間のさまざまな組換え体も報告されている。世界保健機関(WHO)は、これらのB.1.1.529系統とその亜系統および組換え体を全て含めて「オミクロン」と総称する一方、いくつかの亜系統や組換え体(BA.2.3.20、BA.4.6、BA.2.75、XBBの各系統および、BA.5系統にN450D変異もしくはR346/K444/V445/N460のいずれかの箇所に変異を有するもの)を「監視下のオミクロンの亜系統(Omicron subvariants under monitoring)」としている。
###

新型コロナウイルスの変異株であるオミクロンが世界的に流行している。日本でもBA.5系統が主流で、いくつかの亜系統や組換え体もある。WHOはオミクロンの亜系統を監視している。

tempreture パラメータを 0.7 に変更し、生成テキストのランダム性を増やして別パターンのテキストも見てみます。

世界中で新しいコロナウイルス変異株が流行している。その中で最もよく見られるのがオミクロンと呼ばれる系統で、さまざまな亜系統がある。特に、BA.5系統がよく見られる。日本でも、その中でもBQ.1系統やBA.2.75系統が増えている。

流石に 5 歳の子供向けはやりすぎましたが、かなり平易になっているように見えます。

質問応答

日本国内で主流となっている系統は何ですか?
###
現在、流行している新型コロナウイルス(SARS-CoV-2)変異株は、第23報時点と同様に、B.1.1.529系統とその亜系統(オミクロン)が支配的な状況が世界的に継続している。2022年12月2日~2023年1月2日に、世界でゲノム解析され GISAID データベースに登録されたウイルスの98.4%をオミクロンが占め、その他の系統はほとんど検出されていない(WHO, 2023a)。オミクロンの中では多くの亜系統が発生しているが、BA.5系統が63.7%、BA.2系統が15.2%、 BA.4系統が0.7%(いずれも亜系統を含む)と、引き続き世界的にBA.5系統が流行の主流となっている(WHO, 2023a)。日本国内でも2022年7月頃にBA.2系統からBA.5系統に置き換わりが進み、BA.5系統が主流となったのち、10月以降BQ.1系統(BA.5.3系統の亜系統)及びBA.2.75系統の占める割合が上昇傾向にある。また、国内外でオミクロンの亜系統間のさまざまな組換え体も報告されている。世界保健機関(WHO)は、これらのB.1.1.529系統とその亜系統および組換え体を全て含めて「オミクロン」と総称する一方、いくつかの亜系統や組換え体(BA.2.3.20、BA.4.6、BA.2.75、XBBの各系統および、BA.5系統にN450D変異もしくはR346/K444/V445/N460のいずれかの箇所に変異を有するもの)を「監視下のオミクロンの亜系統(Omicron subvariants under monitoring)」としている。
###

日本国内で主流となっている系統は、B.1.1.529系統の亜系統であるBA.5系統です。

1 回の API コールのトークン制限に収まりきらない文書については、チャンクに区切って Embeddings を生成し、 Vector Similarity Search を行うことで質問応答の検索が可能です。

エンティティ抽出

以下のテキストに記載されている重要なエンティティを抽出します。まずすべての組織を抽出し、次にすべての系統を抽出し、次に内容に合った特定のテーマを抽出し、最後に一般的な包括的テーマを抽出してください。

希望するフォーマット:
組織名: <comma_separated_list_of_org_names>
系統名: -||-
具体的なトピック: -||-
一般的なテーマ: -||-

###
現在、流行している新型コロナウイルス(SARS-CoV-2)変異株は、第23報時点と同様に、B.1.1.529系統とその亜系統(オミクロン)が支配的な状況が世界的に継続している。2022年12月2日~2023年1月2日に、世界でゲノム解析され GISAID データベースに登録されたウイルスの98.4%をオミクロンが占め、その他の系統はほとんど検出されていない(WHO, 2023a)。オミクロンの中では多くの亜系統が発生しているが、BA.5系統が63.7%、BA.2系統が15.2%、 BA.4系統が0.7%(いずれも亜系統を含む)と、引き続き世界的にBA.5系統が流行の主流となっている(WHO, 2023a)。日本国内でも2022年7月頃にBA.2系統からBA.5系統に置き換わりが進み、BA.5系統が主流となったのち、10月以降BQ.1系統(BA.5.3系統の亜系統)及びBA.2.75系統の占める割合が上昇傾向にある。また、国内外でオミクロンの亜系統間のさまざまな組換え体も報告されている。世界保健機関(WHO)は、これらのB.1.1.529系統とその亜系統および組換え体を全て含めて「オミクロン」と総称する一方、いくつかの亜系統や組換え体(BA.2.3.20、BA.4.6、BA.2.75、XBBの各系統および、BA.5系統にN450D変異もしくはR346/K444/V445/N460のいずれかの箇所に変異を有するもの)を「監視下のオミクロンの亜系統(Omicron subvariants under monitoring)」としている。
###

組織名: World Health Organization (WHO)
系統名: B.1.1.529, BA.5, BA.2, BA.4, BQ.1, BA.2.75, BA.2.3.20, BA.4.6, XBB, N450D, R346/K444/V445/N460
具体的なトピック: SARS-CoV-2変異株, ゲノム解析, GISAIDデータベース, 組換え体
一般的なテーマ: 新型コロナウイルスの流行

構造化

表の生成①

オミクロンの亜系統の名前と説明を表で示してください。
###
現在、流行している新型コロナウイルス(SARS-CoV-2)変異株は、第23報時点と同様に、B.1.1.529系統とその亜系統(オミクロン)が支配的な状況が世界的に継続している。2022年12月2日~2023年1月2日に、世界でゲノム解析され GISAID データベースに登録されたウイルスの98.4%をオミクロンが占め、その他の系統はほとんど検出されていない(WHO, 2023a)。オミクロンの中では多くの亜系統が発生しているが、BA.5系統が63.7%、BA.2系統が15.2%、 BA.4系統が0.7%(いずれも亜系統を含む)と、引き続き世界的にBA.5系統が流行の主流となっている(WHO, 2023a)。日本国内でも2022年7月頃にBA.2系統からBA.5系統に置き換わりが進み、BA.5系統が主流となったのち、10月以降BQ.1系統(BA.5.3系統の亜系統)及びBA.2.75系統の占める割合が上昇傾向にある。また、国内外でオミクロンの亜系統間のさまざまな組換え体も報告されている。世界保健機関(WHO)は、これらのB.1.1.529系統とその亜系統および組換え体を全て含めて「オミクロン」と総称する一方、いくつかの亜系統や組換え体(BA.2.3.20、BA.4.6、BA.2.75、XBBの各系統および、BA.5系統にN450D変異もしくはR346/K444/V445/N460のいずれかの箇所に変異を有するもの)を「監視下のオミクロンの亜系統(Omicron subvariants under monitoring)」としている。
###
オミクロンの亜系統 説明
BA.5系統 63.7%を占める世界的に流行の主流
BA.2系統 15.2%を占める世界的に流行の主流
BA.4系統 0.7%を占める世界的に流行の主流
BQ.1系統 BA.5.3系統の亜系統
BA.2.75系統 国内外でオミクロンの亜系統間のさまざまな組換え体
BA.2.3.20系統 監視下のオミクロンの亜系統
BA.4.6系統 監視下のオミクロンの亜系統
XBB系統 監視下のオミクロンの亜系統
N450D変異 BA.5系統に変異を有するもの
R346/K444/V445/N460 BA.5系統に変異を有するもの

表で示してと言うと Markdown 形式の表で返してくれるので、そのまま Qiita に貼り付けています。
世界的に流行の主流と書いてあるのは BA.5 系統なので、2,3 行目の解説は怪しいですし、BA.2.75系統の解説も?です。

前の結果をコンテキストに含めて問い合わせ

###
現在、流行している新型コロナウイルス(SARS-CoV-2)変異株は、第23報時点と同様に、B.1.1.529系統とその亜系統(オミクロン)が支配的な状況が世界的に継続している。2022年12月2日~2023年1月2日に、世界でゲノム解析され GISAID データベースに登録されたウイルスの98.4%をオミクロンが占め、その他の系統はほとんど検出されていない(WHO, 2023a)。オミクロンの中では多くの亜系統が発生しているが、BA.5系統が63.7%、BA.2系統が15.2%、 BA.4系統が0.7%(いずれも亜系統を含む)と、引き続き世界的にBA.5系統が流行の主流となっている(WHO, 2023a)。日本国内でも2022年7月頃にBA.2系統からBA.5系統に置き換わりが進み、BA.5系統が主流となったのち、10月以降BQ.1系統(BA.5.3系統の亜系統)及びBA.2.75系統の占める割合が上昇傾向にある。また、国内外でオミクロンの亜系統間のさまざまな組換え体も報告されている。世界保健機関(WHO)は、これらのB.1.1.529系統とその亜系統および組換え体を全て含めて「オミクロン」と総称する一方、いくつかの亜系統や組換え体(BA.2.3.20、BA.4.6、BA.2.75、XBBの各系統および、BA.5系統にN450D変異もしくはR346/K444/V445/N460のいずれかの箇所に変異を有するもの)を「監視下のオミクロンの亜系統(Omicron subvariants under monitoring)」としている。
###
<上記の表をくっつけています>

この表から監視下のオミクロンの亜系統のみを抽出した表を作成してください。
監視下のオミクロンの亜系統 説明
BA.2.3.20系統 監視下のオミクロンの亜系統
BA.4.6系統 監視下のオミクロンの亜系統
XBB系統 監視下のオミクロンの亜系統
N450D変異 BA.5系統に変異を有するもの
R346/K444/V445/N460 BA.5系統に変異を有するもの

BA.2.75 が抜けちゃってますね・・・
ただ表は結構見やすいことが分かったので、別のテキストも試してみます。

表の生成②

オミクロンの亜系統の名前と分類を国ごとに表で示してください。
###
これらの系統について、WHOはBA.2.3.20、BA.4.6、BA.2.75、XBBの各系統および、BA.5系統にN450D変異もしくはR346/K444/V445/N460のいずれかの箇所に変異を有するものを「Omicron subvariants under monitoring」に指定している。欧州疾病予防対策センター(ECDC)は、 BA.2.75系統及びその亜系統(BN.x系統、CH.x系統、その他の亜系統含む)、BQ.1系統、XBB系統を「Variants of interest」、BA.2.3.20系統、BF.7系統、BN.1系統(BA.2.75.5系統の亜系統)、CH.1.1系統を「Variants under monitoring」に指定している。英国健康安全保障庁(UKHSA)は、BA.2.12.1系統、BA.2.75系統、BA.4.6系統、XE系統、BQ.1系統、XBB系統を「Variants」、BA.2.75.2系統、BQ.1.1系統、BA.5.2.35系統、BN.1系統、BA.2.3.20系統を「Signals in monitoring」に指定している(ECDC, 2022a、WHO, 2023b、UKHSA, 2022)。
###

名前 分類
WHO BA.2.3.20 Omicron subvariants under monitoring
WHO BA.4.6 Omicron subvariants under monitoring
WHO BA.2.75 Omicron subvariants under monitoring
WHO XBB Omicron subvariants under monitoring
WHO BA.5 Omicron subvariants under monitoring
ECDC BA.2.75 Variants of interest
ECDC BQ.1 Variants of interest
ECDC XBB Variants of interest
ECDC BA.2.3.20 Variants under monitoring
ECDC BF.7 Variants under monitoring
ECDC BN.1 Variants under monitoring
ECDC CH.1.1 Variants under monitoring
UKHSA BA.2.12.1 Variants
UKHSA BA.2.75 Variants
UKHSA BA.4.6 Variants
UKHSA XE Variants
UKHSA BQ.1 Variants
UKHSA XBB Variants
UKHSA BA.2.75.2 Signals in monitoring
UKHSA BQ.1.1 Signals in monitoring
UKHSA BA.5.2.35 Signals in monitoring
UKHSA BN.1 Signals in monitoring
UKHSA BA.2.3.20 Signals in monitoring

このプロンプトの与え方だと、指示と ### の間に改行が混じると間違った答えを返すことがありました🤔。OpenAI のプロンプトエンジニアリングのベストプラクティスに、コンテキストを Text: """{text input here}""" と区切るのが良いと書いてありましたので修正したところ、良い結果が得られました。

(↓コピペ用)

オミクロンの亜系統の名前と分類を国ごとに表で示してください。
Text:###
これらの系統について、WHOはBA.2.3.20、BA.4.6、BA.2.75、XBBの各系統および、BA.5系統にN450D変異もしくはR346/K444/V445/N460のいずれかの箇所に変異を有するものを「Omicron subvariants under monitoring」に指定している。欧州疾病予防対策センター(ECDC)は、 BA.2.75系統及びその亜系統(BN.x系統、CH.x系統、その他の亜系統含む)、BQ.1系統、XBB系統を「Variants of interest」、BA.2.3.20系統、BF.7系統、BN.1系統(BA.2.75.5系統の亜系統)、CH.1.1系統を「Variants under monitoring」に指定している。英国健康安全保障庁(UKHSA)は、BA.2.12.1系統、BA.2.75系統、BA.4.6系統、XE系統、BQ.1系統、XBB系統を「Variants」、BA.2.75.2系統、BQ.1.1系統、BA.5.2.35系統、BN.1系統、BA.2.3.20系統を「Signals in monitoring」に指定している(ECDC, 2022a、WHO, 2023b、UKHSA, 2022)。
###

グラフ化

オミクロンの変異株の系統別の割合をグラフにするための chartjs コードを作成してください。
###
現在、流行している新型コロナウイルス(SARS-CoV-2)変異株は、第23報時点と同様に、B.1.1.529系統とその亜系統(オミクロン)が支配的な状況が世界的に継続している。2022年12月2日~2023年1月2日に、世界でゲノム解析され GISAID データベースに登録されたウイルスの98.4%をオミクロンが占め、その他の系統はほとんど検出されていない(WHO, 2023a)。オミクロンの中では多くの亜系統が発生しているが、BA.5系統が63.7%、BA.2系統が15.2%、 BA.4系統が0.7%(いずれも亜系統を含む)と、引き続き世界的にBA.5系統が流行の主流となっている(WHO, 2023a)。日本国内でも2022年7月頃にBA.2系統からBA.5系統に置き換わりが進み、BA.5系統が主流となったのち、10月以降BQ.1系統(BA.5.3系統の亜系統)及びBA.2.75系統の占める割合が上昇傾向にある。また、国内外でオミクロンの亜系統間のさまざまな組換え体も報告されている。世界保健機関(WHO)は、これらのB.1.1.529系統とその亜系統および組換え体を全て含めて「オミクロン」と総称する一方、いくつかの亜系統や組換え体(BA.2.3.20、BA.4.6、BA.2.75、XBBの各系統および、BA.5系統にN450D変異もしくはR346/K444/V445/N460のいずれかの箇所に変異を有するもの)を「監視下のオミクロンの亜系統(Omicron subvariants under monitoring)」としている。
###
<script>
var ctx = document.getElementById('myChart').getContext('2d');
var myChart = new Chart(ctx, {
    type: 'pie',
    data: {
        labels: ['BA.5系統', 'BA.2系統', 'BA.4系統', 'その他'],
        datasets: [{
            label: 'オミクロンの変異株の系統別の割合',
            data: [63.7, 15.2, 0.7, 20.4],
            backgroundColor: [
                'rgba(255, 99, 132, 0.2)',
                'rgba(54, 162, 235, 0.2)',
                'rgba(255, 206, 86, 0.2)',
                'rgba(75, 192, 192, 0.2)'
            ],
            borderColor: [
                'rgba(255, 99, 132, 1)',
                'rgba(54, 162, 235, 1)',
                'rgba(255, 206, 86, 1)',
                'rgba(75, 192, 192, 1)'
            ],
            borderWidth: 1
        }]
    },
    options: {
        scales: {
            yAxes: [{
                ticks: {
                    beginAtZero: true
                }
            }]
        }
    }
});
</script>

Javascript コードが生成されました。これを Chart.js ライブラリを読み込んだ HTML に表示すると、以下のようになりました。

スクリーンショット 2023-03-04 11.15.17.png

文章中にあるのは、「BA.5系統が63.7%、BA.2系統が15.2%、 BA.4系統が0.7%」だけですから、コード中のその他 20.4% はパーセンテージの残りを補うようにモデルが自動的に生成したものです。

計算

合計5,247件の登録のうち、欧米のみの登録数を合計するといくつですか?
Text:###
2023年1月10日時点で欧州、アジアなど34か国からGISAIDに5,247件の登録があるが、米国から4,308件のほか、英国430件、デンマーク114件、カナダ106件、ドイツ27件、フランス34件など、米国以外からの登録数は限られている(GISAID, 2023)。
###

5,819件

計算は不得意なようですね。米国4,308+英国430+デンマーク114+カナダ106+ドイツ27+フランス34=5,019 が欲しいです。ここで、Zero-shot-CoT という算術問題などを高精度で解ける魔法の呪文「Let’s think step by step.」を加えます。今回は日本語に訳して使ってみます。

合計5,247件の登録のうち、欧米のみの登録数を合計するといくつですか?一歩一歩考えていきましょう。
Text:###
2023年1月10日時点で欧州、アジアなど34か国からGISAIDに5,247件の登録があるが、米国から4,308件のほか、英国430件、デンマーク114件、カナダ106件、ドイツ27件、フランス34件など、米国以外からの登録数は限られている(GISAID, 2023)。
###

欧米のみの登録数は、4,308件(米国)+430件(英国)+114件(デンマーク)+106件(カナダ)+27件(ドイツ)+34件(フランス)で、5,019件となります。

いや天才!思考の連鎖という段階的な推論を出力するようになりました。この呪文を発見した Kojima さんらがすごいです。

おわりに

ちょっとこのレベルだとまだ結果に不安な点が残るので、Prompt engineering や In-context Learning、 Fine-tuning など、精度を上げる方法がたくさんあるのでまた検証してみたいと思います。結果の信頼度を上げる別の方法として、例えば要約であれば、元の文章から取り出すタイプの抽出的要約や、登録した情報の中のみの情報から回答を返すサービスの併用なども考慮するといいかもしれないと考えました。

出典

国立感染症研究所ホームページ
感染・伝播性の増加や抗原性の変化が懸念される 新型コロナウイルス(SARS-CoV-2)の変異株について (第24報)
https://www.niid.go.jp/niid/ja/2019-ncov/2551-cepr/11749-sars-cov-2-24.html
2023/03/04 に利用

注意 OpenAI の医療応用について

本記事は個人的な検証目的ですが、実際に医療サービス等への応用を考える方は以下を注意する必要があります。

OpenAI 利用規約

Telling someone that they have or do not have a certain health condition, or providing instructions on how to cure or treat a health condition OpenAI’s models are not fine-tuned to provide medical information. You should never use our models to provide diagnostic or treatment services for serious medical conditions. OpenAI’s platforms should not be used to triage or manage life-threatening issues that need immediate attention.

OpenAI のモデルは、医療情報を提供するためにファインチューニングされていないので、深刻な病状に対する診断や治療サービスを提供するために、当社のモデルを使用するべきではありません。

Consumer-facing uses of our models in medical, financial, and legal industries; in news generation or news summarization; and where else warranted, must provide a disclaimer to users informing them that AI is being used and of its potential limitations.

医療、金融、法律業界、ニュース生成、ニュース要約など、消費者向けに当社のモデルを使用する場合、AIが使用されていることとその潜在的な限界を知らせる免責事項をユーザーに提供する必要があります。

OpenAI Usage policies

安全のためのベストプラクティス

  • ヒューマン・イン・ザ・ループ (HITL)
  • ユーザー入力を制限し、出力トークンを制限する
  • ユーザーが問題を報告できるようにする
    などのアプリケーション開発に重要な情報があります。

Safety best practices

AI 技術を用いた医療機器への対応について

AI 技術を用いた製品のうち、その使用目的や提供形態等から医療機器に該当するものは、医薬品医療機器法に基づき安全性、有効性の確保が行われます。

AI技術を利用した医療機器の医薬品医療機器法上の取扱にかかる対応について(厚生労働省 医薬・生活衛生局)

3
1
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
3
1

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?