記事の目的
この記事は、自然言語処理(NLP)に詳しくない方を主な対象として、ChatGPT について特にビジネスでの利用法という観点で概説するものです。ChatGPT の現在の提供内容や機能および利用例を紹介し、専門外の方の理解を助けることを目的としています。
記事の内容は、2023年1月時点での情報です。
ChatGPTとは
ChatGPT とは、OpenAI が2022年11月に公開したチャットボットです。
従来のFAQチャットボットとは異なり、単に質問に答えるだけでなく、それ以外の使い方(例:文章の要約や翻訳など)もできます。他にも、チャットボット自身の間違いを認めたり、ユーザ(利用者)の質問の矛盾点を指摘・拒否する機能もあります。また、多言語対応しており、例えば英語や日本語を扱うことができます。
なお現時点(2023年1月)では、企業独自のマニュアル等、特定のデータでのチューニングができません。事前に学習した一般的な知識に基づく応答しかできません。
アカウント登録することで個人は誰でも無料で試してみることができます。
現在(2023年1月)、利用に関して公開されている情報は次の通りです。
- 今のところAPIは公開されていませんが、検討段階にあるようです。
We've learned a lot from the ChatGPT research preview and have been making important updates based on user feedback. ChatGPT will be coming to our API and Microsoft's Azure OpenAI Service soon.
— OpenAI (@OpenAI) January 17, 2023
Sign up for updates here: https://t.co/C7kMVpMAKv
- ChatGPTに入力された内容の機密性は確保されていません。機能改善のために開発者がチャット履歴を閲覧する可能性があります。
Will you use my conversations for training?
Yes. Your conversations may be reviewed by our AI trainers to improve our systems.
— ChatGPT General FAQ No.6
- APIライセンスについてもまだ不明ですが、出力結果の商用利用は認めています。
Can I use output from ChatGPT for commercial uses?
Subject to the Content Policy and Terms, you own the output you create with ChatGPT, including the right to reprint, sell, and merchandise – regardless of whether output was generated through a free or paid plan.
— ChatGPT General FAQ No.14
ChatGPTとGPTシリーズの違い
ChatGPTとGPT(GPT-3, GPT-3.5など)は区別されています。一言で言えば、ChatGPTは、GPTをベースに対話に特化させ人手をかけてチューニングしたものです。
膨大なWebサイトのデータで作られたGPT1を基に、対話データやプログラミングコードのデータも加えて学習させ、更に人間にとって自然な文を出せるよう多大なコストをかけて繰り返し人手を使ってチューニングしています。
有効な利用局面
ChatGPT には様々な機能(詳細後述)がありますが、有効利用できる場面は、チャットボット(対話形式)である必要があるケースです。
ユーザの入力に対して出力を1回だけ取り出すケースでは、対話形式のメリットが活かせません。例えば、文章を単に要約したいだけの場合、要約専用のモデルを用意する方が高い性能が得られる場合があります。翻訳したい場合は翻訳サービスを検討できます。
一方、ユーザの入力に対するChatGPTの応答に対して、ユーザが追加の入力をする場合には対話形式の利点を活かせます。例えば、1回目に要約された文章をユーザが見て、追加の指示(例:もっと短く要約したい)を与えるようなケースです。
機能
ChatGPTの特長と制限事項の概要は以下の通りです。各項目の詳細な例は5節で述べています。
特長
次のような機能があります。
- 文脈を理解して流暢な会話ができる
- 同じ入力に対して返答を変化させることができる
- 説明の長さを制御できる
- 多言語を扱うことができる
- 矛盾した質問に対して、誤りであることを指摘できる
- 情報の加工(要約、翻訳、情報抽出など)ができる
- 文章を創作できる
- 出力スタイルの制御ができる
制限
できることの限界として、次のような制限がありますので、利用時に注意が必要です。
- 発言内容が事実である保証がない
- Web検索はできない
- 一度に入力できる文字数には限りがある
- 応答の生成に時間がかかる
- 扱うデータはテキストのみ
- 特定のデータでチューニングはできない
- 2021年以降の知識は保証されない
ここまでのまとめ:ビジネス利用が想定できる局面
ビジネスで利用できる局面は、現状ではかなり限定的です。
特に、発言内容が事実である保証がないため、利用する場合は次のいずれかを前提とします。
-
出力結果を人手で事実確認できる
これは「最終的に人手で確認する前提だが、人手で書くコストをなるべく削減する」局面です。
例えばChatGPTに、メール文を書いてもらうとします。ChatGPTで下書きを作り、人手で細部の修正のみを行うことで、人手で全ての文を作る方法に比べて手間を削減できると期待できます。
※人手で事実確認できないユーザが、ChatGPTの回答を確認せずに利用するのは危険です。 -
正解を求めていない(どのような回答でも構わない)
これは「自由な応答が欲しい」局面が想定できます。
例えばChatGPTと外国語で話す練習を行ったり、面接の練習を行うなどのケースです。
いずれの場合も、特定のデータでチューニングできないため、一般的な知識に基づく利用しかできません。
機能の詳細・会話例
機能で挙げた内容について、それぞれ詳細や例を紹介します。
特長
文脈を理解して流暢な会話ができる
ChatGPTは、文脈(前の発言内容)を考慮した応答ができます。また、流暢な会話ができます。
以下の例1では、2つ目の質問で「自然言語処理」という単語を使わずに「それは、どのような時に使われていますか。」と尋ねていますが、ChatGPTは1つ前の内容に合わせて「自然言語処理」の利用例を答えています。
同じ入力に対して返答を変化させることができる
ユーザの入力に対して、返答を変化させることができます。(※確実に同じ返答を得る方法は今のところありません)
例1と同じ入力を行った例2では、少し異なる返答が得られています。
説明の長さを制御できる
ユーザの入力内容に応じて、返答の長さを変えています。
例1のように用語の説明を求めたケースでは、短すぎる回答(例えば「自然言語処理とは NLP と略されます。」など)や長すぎる回答(例えばWikipediaの全文を引用するなど)ではなく、概要のみを回答しています。
また以下の例3のように、最初に詳しい説明を促すと、それに合わせてより詳しい内容を一度に回答しています。
多言語を扱うことができる
ChatGPTは多言語に対応しています。言語モードを事前に指定する必要は無く、入力された言語や会話の状況に合わせた言語で返答します。
以下の例4のように、日本語と英語の両方の回答を求めるような、日本語の質問文にも上手く答えています。
矛盾した質問に対して、誤りであることを指摘できる
以下の例5のように、入力に対する正解が存在しない場合、それを指摘できることがあります。
情報の加工(要約、翻訳、情報抽出など)ができる
入力された情報を、指定に従って変換したり抽出したりすることができます。
例6では、4文の文章を2文に要約しています。
例7では、文章に基づいて質問に正しく答えています。
例6 要約2
例7 情報抽出2
文章を創作できる
ChatGPTが持つ知識に基づいて、文章を創造することができます。ユーザの情報入力を前提とする上記の「特長:情報の加工(要約、翻訳、情報抽出など)ができる」と異なり、ユーザが入力した僅かな情報から、新たな内容を創造することもできます。
例8では、タイトルのみ指示された状況で、それに沿った文章を書いています。
例9では、状況に合わせたメールの例文を書いています。
出力スタイルの制御ができる
出力するスタイルを制御できます。指定されたスタイルに合わせたり、応答として最適なスタイルで返答したりすることができます。
例10では、入力で指定された文体で応答しています。
制限
発言内容が事実である保証がない
ChatGPT は、流暢な会話が可能なため、いかにも正しいことを述べているかのように応答しますが、内容が事実と異なる場合があります。従って、ユーザが応答内容の事実確認をする必要があるため、専門分野外の知識を得るために使うのは危険です。
例11では、移動経路を尋ねていますが、存在しない空港や路線を説明しています。
例12では、医療についての問題ですが、致命的な選択肢を答えており、専門外の人が鵜呑みにしてしまうと人命に関わります。
例13では、計算結果が違います。
Web検索はできない
事前に学習した内容に基づいているため、最新のニュース等は参照できません
一度に入力できる文字数には限りがある
長いテキストを入力するには、複数の発言に分割することになりますが、入力中もチャットが返答するので、予期しない動きになる可能性があります(例:指示していないにも関わらず、要約を出力し始めるなど)。
なお、何度も入力すると、初めの方に入力した内容を明確に記憶できない可能性があります。
応答の生成に時間がかかる
具体的な生成速度については未公開です。日本語より英語の方が速く生成できる傾向にあります。有料プランは速くなるようです。
扱うデータはテキストのみ
扱うことができるデータはテキストのみであり、箇条書きやプログラミングコード等の書式は出力できますが、画像などは扱えません。
特定のデータでチューニングはできない
現時点では、特定のデータでチューニングできないため、企業内マニュアルや製品の仕様書など、企業独自の情報を登録できません。
少量のデータであれば、利用の度に入力すれば情報抽出などができますが、一度に入力できる文字数には限りがあり大量のデータは入力しにくいため、大規模な文書検索などへの応用は難しいです。
なお、独自データでチューニングするために、ChatGPTを自前で用意する方法は、あまり現実的ではありません。まず多大なコスト(資金・人手・時間)がかかりますし、データの量も必要です。資金力が確保できても技術力確保(分散処理の高度な知識などが必要です)の課題が考えられます。
2021年以降の知識は保証されない
学習データは主に2021年以前のWebデータを利用していますので、それ以降の知識は乏しくなっています。
その他の例(参考情報)
最初の発言として入力する「チャットに行ってほしい挙動の指示」の例をまとめたサイトがいくつかあります。
英語では「prompts」、日本語では「テンプレート」「入力例」などでWeb検索するとこのようなサイトにたどり着けます。
- Awesome ChatGPT Prompts (英語)
- 500+ Best ChatGPT Prompts (英語)
- ChatGPTに関するチートシート (日本語)
- ChatGPTがサポート!実践的なメールアイデア テンプレート集 (日本語)