みなさん、ChatGPT使ってますか?
この前、おかんの口からChatGPTというワードが出てきてビックリした@ManabuTechです。
僕のおかんが知っているということは、おそらくほぼ全ての人類がChatGPTの存在を知っていると思われます、はいー。
今回は、PDFやテキストファイルの内容をChatGPTに簡単に教えてもらう方法を紹介します。
例えば、英文で書かれたライセンス規約のPDFファイルから、日本語で質問してChatGPTさんに回答してもらうことができます。
ChatGPTをビジネスで使うにはまだ早い?
ChatGPTさんは非常に優秀で、最新のChatGPTでは弁護士試験の上位になれると言われています。
しかし、範囲を絞らないと質問に対して正確な答えを出すことは現在できません。
例えば、「プテキリオンザウルスについて教えて」と質問すると、即座に回答してくれます。素晴らしいスピードです。
しかし、残念なことに「プテキリオンザウルス」はいかにも実在しそうな恐竜なんですが、私が作った恐竜ですので、この恐竜の化石はどの博物館や研究施設に行っても見ることはできません。
ChatGPTさんは、真顔で6メートルだの海棲爬虫類だの大嘘をつくことがありますので、ビジネスシーンで使うことはまだ難しいでしょう。
ちなみに、Google先生は正直に知らないと言ってくれます。
ChatGPTに特定の文書に関する質問をするデモ
ChatGPTを利用してインターネットから正確な情報を取得することは現時点では難しいのですが、現在でも特定ファイルのテキスト情報に限定すれば、ある程度正確に回答を返すことができます。この使い方であれば、ビジネスでも使うことができると思われます。
ChatGPTは便利ですが質問の内容が学習に利用されているとも言われています。情報漏洩を懸念してイタリアはChatGPTの使用を禁止する声明を出しました。会社で使用する際は、ChatGPTを使ってもいいか事前に確認したほうがいいでしょう。
ChatGPTのサイトにファイルのテキストをコピペしても行う方法もありますが、今回はUiPathというRPAツールを使い、特定ファイルからテキストを読み取りChatGPTに質問を投げる処理を自動化してみます。
UiPathは世界中で多くの企業に採用されていますが、個人利用であれば無料で使用できるCommunity版も用意されています。
今回、文書に関してChatGPTで質問するデモを3つ用意しました。
処理は簡単なのですが、色々なシーンで使えるレベルだと思います。
- 半定型文書(請求書)
- 非定型 日本語文書(童話:赤ずきん)
- 非定型 英語文書(UiPathセキュリティホワイトペーパー)
デモ1.半定型文書
請求書の情報をChatGPTで読み込むデモです
(クリックするとデモ動画の再生が開始されます)
請求書から読み取りたい場合も多いですよね。
どの程度情報を取得できるかやってみましょう。
質問1:
素晴らしい、正解です!
質問2:
惜しい、口座番号が抜けています。
質問3:
質問を訂正することで口座番号も含めて取得することができました。
AIに正確な回答を取得する質問を作るスキルが重要になってきますね。
質問4:
メールアドレスも難なく取得できました、素晴らしい。
デモ2. 非定型 日本語文書
グリム童話の赤ずきんの情報をChatGPTで読み込むデモです
著作権フリーのため、グリム童話の赤ずきんを使用しています。
(クリックするとデモ動画の再生が開始されます)
質問1:
正解です。ChatGPTさんにはちょっと簡単すぎたかもしれません。
質問2:
素晴らしい、翻訳者を取得できています!
質問3:
作成日付の定義をどうするか微妙ですが、日付を取得できています。
質問4:
UiPathのAskGPTアクティビティには文字数制限があるようで、要約されていませんでした。要約などの回答の文字数が多くな用途には利用できないようです。
質問5:
これは間違いですね。オオカミがなぜか赤ずきんちゃんを助けたとなっています。ツンデレおおかみと赤ずきんちゃんの恋愛が始まりそうな予感がしますが、ChatGPTの今後の精度向上に期待ですね。
デモ3. 非定型 英語文書
UiPathホワイトペーパーの情報をChatGPTで読み込むデモです
(クリックするとデモ動画の再生が開始されます)
UiPathホワイトペーパーは全文英語で書かれています。
英語が苦手な人は骨の折れる作業ですよね。ブラウザは簡単に翻訳かけられるのですが、PDFは手間だったりするので、情報が取得できれば利用シーンは多そうですね。
質問1:
30日間という回答が出ました。これは正解です。
エビデンスは怪しいですが、ログデータは30日保存されます。
質問2:
回答が英語になっていますが、正解です。
質問3:
回答が英語になっていますが正解です。
おそらく、質問に続けて日本語で教えてと付け加えると日本語で返してくれると思います。
UiPath Studio 自動化処理の作り方
それでは、作り方を解説します。
今回のUiPathの「Ask GPT」を使用する方法は「APIって何ぞ?」というプログラミング経験の無い人でもAPI登録やHTTPリクエストなど難しい作業を行わなくても良いので、ご安心ください。
(クリックすると作成動画の再生が開始されます)
InternalLabs.OpenAI.ActivitiesはInternalLabs.GPT.Activitiesという名称になりました。動画内ではInternalLabs.OpenAI.Activitiesとなっていますのでご注意ください。
作った自動化処理はGithubに格納していますので、ダウンロードすればみなさんのPCのUiPath Studio / Robotで動かすことができます。
https://github.com/manabutech-kyushu/uipath-ask-gpt
基本的な作り方は動画で確認していただくとして、この記事では動画で解説できていなかった箇所を重点的に解説します。
UiPath Studioの準備
ここでは、UiPath Studioがインストールされている状態からスタートします。
個人利用の場合は、無償で利用可能なCommunity版がUiPath公式サイトからダウンロードできます。企業で使用したい場合はトライアルを申請してください。
詳しいインストール方法はChatGPTさんに聞いてください。
UiPath トライアルの方法を解説したこちらの記事もおすすめです
パッケージのインストール
UiPath Studio上部のパッケージを管理よりパッケージを追加します。
必要なパッケージは2つです。
パッケージ | 取得元 | 概要 |
---|---|---|
InternalLabs.GPT.Activities | マーケットプレース | ChatGPTへのアクセス |
UiPath.PDF.Activities | オフィシャル | PDFファイルからテキスト情報取得 |
今回使用した「Ask GPTアクティビティ」はMarketplaceのInternalLabチームにより公開されているものです。
UiPathが公式に作成してサポートしているものではありませんので、ご注意ください。
今回使用したPDFは文字情報が入っているものを使用しています。
文字情報が入っていないPDFファイルや画像ファイルからもOCRアクティビティを使用することによって対応可能です。
UiPath 日本語対応のOCRはDocument Understandingが必要になります。
使用するアクティビティ
UiPath Studioではアクティビティと言われる部品を組み合わせて自動化処理を作っていきます。
アクティビティ | 概要 |
---|---|
ファイルを参照 | PDFファイルの読み込み画面 |
PDFのテキストを読み込み | PDFからテキスト情報を読み込む |
入力ダイアログ | 質問の入力画面 |
ASK GPT | ChatGPTに質問を投げて回答をもらう |
入力ダイアログ | 回答の表示画面 |
繰り返し(後判定) | ある条件の時に処理を繰り返す |
回答をウィンドウに表示していますが、Excelなどのファイルに書き出すこともできます。
フォルダに格納された複数のPDFファイルに質問をして、Excelファイルにまとめることもできます。
AskGPTアクティビティについて
AskGPTアクティビティはUiPathマーケットプレースで公開されているInternalLabs.GPT.Activitiesパッケージをインストールすると使えるようになります。
UiPathにはファイルからテキストを読み取る色々な方法が用意されているので、簡単にテキスト情報を取得できます。
取得したテキストと質問をAskGPTに設定するとChatGPTが回答を返してくれます。
UiPath AskGPTアクティビティはAzure上に構築されたOpenAIリソースを利用しています。
OpenAIに情報が送信されないため、自動化で使用したテキスト情報が再学習に使用されるリスクはありません。
InternalLabs.GPT.Activitiesは公式にサポートされているものではありませんのでご注意ください。現在、デモやPoCなどに無料で利用することができます。将来的にUiPath公式のアクティビティに統合される予定です。
文字列連結処理
今回の自動化処理で一番難しい回答を表示する入力ダイアログの文字列連結について解説します。
アクティビティ間で情報を受け渡すために変数というデータを入れる箱を作って情報をやり取りします。
UiPath Studioはローコードツールですが、難しいことを使用とするとこの変数を理解する必要があります。
Ask GPTアクティビティは、複数の質問を一気に受け付けることができるようになっています。
入力のQuestion ListがStringのList型で質問を複数格納することができます。
出力のResponse ListはDictionary(String,String)のList型で、回答、質問、エビデンスをChatGPTさんが格納してくれます。今回は回答リストという名前で変数を作っています。
取得したい内容 | 書き方 |
---|---|
1つ目の質問 | 回答リスト(0)("question") |
1つ目の質問の回答 | 回答リスト(0)("answer") |
1つ目の質問のエビデンス | 回答リスト(0)("evidence") |
一括で質問を投げる時は、2つ目の質問は回答リスト(1)("question")のように数字が増えていきます。繰り返し処理などで作る必要がありますが、今回は質問を1つずつ行うため、0固定で取り出しています。
プログラミング経験の無い方は何を言っているか分からない、いわゆるポルナレフ状態におちいると思いますが、そんな時は素数を数えて落ち着き、おまじないと思って入力ラベルに次の文字列をコピペしてください。UiPath Studioで業務を自動化していくうちに分かってきます。(たぶん)
"質問:" + 回答リスト(0)("question") + Environment.NewLine + "回答:" + 回答リスト(0)("answer") + Environment.NewLine + "エビデンス:" + 回答リスト(0)("evidence") + Environment.NewLine + Environment.NewLine + "続けて質問する?"
気づき
実際に触ってみて、今回のデモのようにフォーマットが決まっていない非定型文書である契約書などから情報を取得する場合には非常に有用だと思いました。
しかし、フォームのような定型文書、請求書のような半定型文書から情報を読み取る場合は、UiPathが用意しているDocumentUnderstanding機能を使った方が精度は高くなると思います。
UiPathをあまり触ったことが無かった人も、使い倒している方も、ChatGPTを業務に組み込んで効率化を検討してみてはいかがでしょうか?
励みになりますので、内容が面白かった人はいいね・フォローお願いします!
UiPathでExcelとChatGPTを連携させて住所から市区町村などに分割するデモを作成しました。