OpenAIのChatGPT、MicrosoftのBing、GoogleのBardは、大規模言語モデル(LLM)と呼ばれる技術の上に構築された製品です。ChatGPTのようなWebインターフェイスで提供される単純な機能を超えて、企業の中で大規模言語モデル(LLM)を使用することは可能です。しかし、その前に、まず一歩踏み込んでみることが大切です。
ChatGPTのような大規模言語モデル(LLM)のバーチャルアシスタントやチャットボットを超えた、ビジネスでの有用かつ現実的な応用事例はどのようなものがあるのでしょうか?また、ChatGPT技術のユースケースはどう選択すればいいのでしょうか?組織内で大規模言語モデル(LLM)の有用性を検証することに興味がある方は、このブログ記事で、考慮すべき重要な要素について詳しくご紹介します。
→ Ebookはこちらから:ChatGPT、GPT-4、大規模言語モデル(LLM)の使用
ChatGPTのユースケースには、リスク許容度が求められる
LLM技術をはじめて導入する場合は、ある程度のリスクを許容できる領域を選びます。アプリケーションは、組織の運営に不可欠なものではなく、チームの利便性や効率性を向上させるものであるべきです。
人工知能(AI)プロジェクトが開始前に失敗することは、誰も考えたくはないことですが、それが現実なのです。IDCの最近の調査によると、28%のAIプロジェクトがいまだに失敗に終わっています。そして、失敗の理由の第一位(回答者の35%が挙げている)は、AI技術が期待通り、あるいは約束通りに動作しなかったためです。
大規模言語モデル(LLM)がどのように、そしてなぜ機能するのかについての理解がまだ部分的なものに過ぎないことを考えると、検証しているユースケースが期待通りに行かなかった場合の結果を評価することは重要です。
- ブランドの評判や顧客の信頼が損なわれることはないだろうか?
- AIプロジェクトに対する組織の信頼度にダメージはないだろうか?
- 規制遵守や顧客のプライバシーに関するリスクはあるか?
これらの質問は、あらゆるユースケースにおけるAIの使用を評価する際のグッドプラクティスですが、ChatGPTを支えるテクノロジーやビジネス向けのユースケースに関しては、特に重要です。大規模言語モデル(LLM)は複雑なモデルであり、企業の現場ではやはり慎重に運用する必要があります。
人をAIプロジェクトに介入させる
ChatGPTが信頼に足るかどうかについては、多くの議論があります。LLMの仕組みを理解すれば、ChatGPTの出力が正しいかどうかの保証にはなりませんが、正しいように聞こえるということだけはわかります。
結局、大規模言語モデル(LLM)が印象的なのは、事実を想起させるからではありません。例えば、ChatGPTは質問をしたときに、クエリについて何も調べていません。大規模言語モデル(LLM)の強みは、人間が書いたように読めるテキストを生成することにあります。多くの場合、正しく聞こえるテキストは、実際に正しいとも言えますが、常にそうとは限りません。
ある法律事務所では、契約書の第一稿を作るのに大規模言語モデル(LLM)の技術を使っても問題ないと言っていますが、それは、そのような仕事を若手の社員に任せても問題ないのと同じです。なぜなら、そのような文書はその後何度も見直されることになり、誤りを見逃すリスクを最小限に抑えることができるからです。
このように、はじめにテクノロジーに任せて、後から人間が手を加えるというユースケースは、たくさん考えられます。カスタマーサービスの問い合わせに対する回答、商品説明やコンテンツ作成など、さまざまな可能性が考えられます。
繰り返しになりますが、人間が介在するという考え方は、どのようなAIプロジェクトにおいても一般的なベストプラクティスです。しかし、強力なLLMモデルを活用する場合には、特に重要となります。最終的には、目標設定やガードレール、監督、信頼関係の構築など、機械にはできない難しいことを行う人間が必要です。
テキスト(またはコード)集約型のタスクにLLMを活用する
ChatGPTの技術を企業で活用するには、特に生成AIと大規模言語モデル(LLM)の強みを生かすことが重要です。特に、文章や段落を生成するような「束縛のない」タスクに対応させることです。自然言語処理(NLP)を活用した既存の専用ツールなら、低コストで複雑な作業もなく、優れた結果を得ることができます。
例えば、Dataikuは、この技術の社内テストとして、OpenAIのGPT-3モデルを使用して、Dataikuの広範な公開文書、知識ベース、コミュニティ投稿の全内容に関する全文の回答を提供することに成功しました。
これは、すべてのデータがすでに公開されているため、第三者によるモデルを活用するのに適したユースケースであり、大規模な第三者によるモデルは、ユーザーが質問するさまざまな表現に対応するのに適しています。
その結果、わかりやすい要約を提供し、しばしば回答に役立つ文脈を提供する、印象的な結果が得られています。ユーザーからは、高度に技術的なリファレンス文書に戻る単純なリンクよりも効果的であるとの報告を受けています。
すべてのAIと同じく大規模言語モデル(LLM)も:ビジネスバリューが第一
ある技術に対して大きな注目が集まっているときは、いつもそうですが、おそらく、より重要なのは、基本に戻って、その技術がビジネスにとって実際に価値があるかどうかを問うことでしょう。大規模言語モデル(LLM)はさまざまなことができますが、それが価値あるのか否かは、別の問題です。
あるユースケースにおいてLLMを使用することで 得られるであろうメリットが、既存のプロセスを置き換えるのに かかる時間と投資を正当化できるかどうかを考えてみてください。AIを使ってもそれ以上の価値や投資対効果(ROI)が得られないのであれば、そのユースケースには最適な投資とは言えないかもしれません。LLMのこのユースケースは、どのように収益を上げ、費用を節約し、今日することができないことをするのに役立つのだろうか」と常に問いかけましょう。
例えば、Dataikuのパートナーは、電子カルテシステム内の医師のメモを集約して要約する実証実験を実施しました。
このシステムは、オープンソースのBARTモデルを使用して、医学文献を学習させ、医療における非構造化エンタープライズデータを構成する大量の医師のメモを患者の記録に要約する作業を自動化することができるようになりました。また、詳しい診療録はシステム上に残され、必要なときに診察医が詳細なデータを入手することができます。これは、価値が明確なChatGPTのビジネスユースケースの一例で、人間が行うには面倒でコストがかかるものです。
補足:このユースケースでは、要約の一部を人間の専門家が確認して、期待通りに機能していて、関連性の高い情報が取得されていることを確かめます。つまり、本番で使用する前に、人間がループに入っておくということです。
企業で大規模言語モデル(LLM)を活用してさらに先へ
大規模言語モデル(LLM)とは何か?LLMを企業でどのように活用できるのか?どのようなユースケースがあるのか?大規模言語モデル(LLM)はDataiku上で使えるのか(ネタバレ注意:使える!)?10分で読めるEbookに、すべての答えが書かれています。
完全版のEBookはこちらから入手可能です。