上手く動作しない場合は、動作しない時のTipsを確認してみてください。
Twitterにて質問承ります!
最近話題のChatGPT。
3月1日に公開されたAPIを用いたサービスが続々と登場し、最近はGPT-4が公開され、ワクワクが止まりません。
それを踏まえ前回、AIチャットくんのようなChatGPTのLINEボットを作りました。
今回は、文脈を理解し、独自の知識を学習させることで専門性のあるGPTベースのチャットボットを無料で、30分で、プログラミングせずに作ってみましょう!
独自の知識を学習させることができれば、例えば社内Slack上のすべての会話を学習させて、「A社のCTOって誰だっけ?」と聞くと「Xさんです。2022年3月8日に#randomに投稿されたスレッドによると、Xさんは廃墟巡りが趣味だそうです。」と回答するようなボットを作ることができます。
これはChatGPTにはできない所業です。
嫌いな上司に「まだそんなこともわからないのか」といびられる心配がなくなりますね😇
この記事ではLINEボットを作るため、社内Slackボットの作成は範囲外です。
より多くの人にこの技術を応用してより良いサービスを作っていただたいので、反響次第では開発者向けの記事も公開したいと考えています。
前置きはこの辺にして、30分ディベロッピング、スタートです。
前提
この記事の対象は「開発の経験は少ないけど、とりあえず動くものを作ってみたい方」です。
詳細な説明はなく、正確性よりも簡潔さを優先していることをご了承ください。
前回の続きなので、LINEボットの作成やOpenAIアクセストークンの取得は完了しているものとします。
今回のやり方で、岸田総理の発言を学習させるとこのようになります。
文脈を理解しているのが見て取れます。
方針
今回紹介するのは、Googleスプレッドシートをデータベースとして利用する方法です。
文脈を理解させるには、会話履歴を保存しておく必要があります。会話履歴などのデータを保存しておくファイルのことをデータベースと言ったりするのですが、今回はGoogleスプレッドシートをデータベースとして利用します。
料金
料金は3ヶ月間ほぼ0円です。
OpenAIのAPIには最初の3ヶ月間有効な18ドルの無料枠があります。かなり良心的な価格設定なので、無茶な使い方をしない限り18ドルを超過することはないと考えていただいて結構です。
流れ
- スプレッドシートを用意
- 学習データの用意
- LINEボットと連携
スプレッドシートを用意
スプレッドシートのコピー
まずは以下の手順で、私が用意したGoogleスプレッドシートを自分のドライブにコピーしてください。
-
スプレッドシートを開く
こちらから開けます。
APIキーとアクセストークンの設定
コピーしたスプレッドシートで「拡張機能」>「Apps Script」をクリックし、GASプロジェクトを開いてください。
Apps Scriptの画面が開かれたら、2, 3行目のOPEN_AI_KEYとLINE_ACCESS_TOKENに前回の記事で取得したものを設定してください。
絶対に第三者に公開しないよう注意してください。
ちなみにこのプログラムは「会話履歴」シートからデータを取得したり、「学習データ」シートを参照してプロンプトにデータを挿入したりしています。
学習データの用意
「学習データ」シートの用意
今回紹介するのは、Googleスプレッドシートをデータベースとして利用する方法です。
サンプルデータとして、コピーしていただいたスプレッドシートの「学習データ」シートには今回岸田総理の発言を格納しています。
このシートには自社サイトのFAQなり社内Slackのスレッドなり、ご自身の学習させたい内容を格納してください。
この時、一つのセルに含まれる文章量に比例してコストが高くなるため、話題ごとに行を分けるのがおすすめです。(FAQなら質問ごと、社内Slackならスレッドごとなど)
「学習データベクトル表現」シートの用意
スプレッドシートの「学習データベクトル表現」シートを開き、以下の5ステップを行ってください。
承認が完了しボタンが作動すると、学習データベクトル表現シートに数字がたくさん書き込まれるはずです。
これにより、コンピュータが学習データを理解できるようになりました。
「学習データ」と「学習データベクトル表現」シートの行数が同じであることを確認してください。
LINEボットと連携
前回と同じ要領で、GASプロジェクトをデプロイし、前回作ったLINEボットアカウントのwebhookにURLを設定してください。
こちらの記事が参考になると思います。
デプロイした瞬間からセキュリティ的に危険な状態になるので、取得したURLは公開しないことをお勧めします。
動作確認
自分が作ったLINEボットにメッセージを送ってみてください。
数秒後に返信が来るはずです。
スプレッドシートの「会話履歴」と「ログ」のシートが更新されていれば完成です。
動作しない時のTips
テスト関数の実行
今回はtest関数を用意しました。LINEは介さず、本番同様にリクエストを送りデータベースを更新するような関数です。
GASプロジェクトを開き、test関数を実行すれば、エラーを確認することができます。
「会話履歴」と「ログ」のシートが更新されていればOpenAIに関する挙動には問題がなく、LINEの方に問題があると推察されます。
OpenAIの初期設定を確認する
OpenAIのAPIを使うには、クレジットカード登録と使用上限の設定が必要です。
意外といろんなメディアで触れられていない部分でもあります。
これらの記事を参考に、設定を行ってください。
なお、これらの設定によって無料枠が使われなくなるという報告があります。
これについては情報が混在しており、現時点で断言はできません。
少なくとも私のアカウントでは課金されていませんが、心配な方は控えるのが得策かと思います。
アクセストークンやURLを確認
以下の項目を確認してください。
- OpenAI APIキーやLINEのアクセストークンが正しく設定されているか
- webhookに設定しているURLが最新のデプロイURLになっているか
- GASでは修正した時に、デプロイを上書きする必要があります。
- 新しいURLを発行していたり、上書きされていなかったりすると修正は適用されません。(参考:GoogleAppsScriptの新しいエディタで更新デプロイする方法)
- 誤字脱字がないか
- 意図せずどこかを変更してしまったのかもしれません。
- 一度全体をコピペし直して、デプロイを上書きしてみてください。
OpenAIサーバのパンクを疑う
リクエスト過多により、OpenAIのサーバからエラーが返されるトラブルが稀に発生します。
私たちにできることはないので、気長に待ちましょう。だいたい数十分で解決する気がしています。
ログを確認する
本記事は初学者向けなので、小難しいことはしたくないのですが、どうしても解決しない場合はGASのログを確認する必要があります。
この記事を参考にログを確認してみてください。
エラーメッセージがわかったら、ググるかChatGPTに聞けば十中八九解決します。
Twitterにて質問を承りますので、お気軽にお問い合わせください!
まとめ
いかがでしょうか?
今回は文脈を理解し、大量の独自データを学習させた専門性のあるチャットボットを作りました。
実際に使ってみて、レスポンスが遅いと感じましたか?
そうです。今回紹介した方法は、外部に公開するサービスとしてはパフォーマンス的にもセキュリティ的にも問題だらけです。
回答の精度が低いと感じた方もいるでしょう。
精度向上には学習データやリクエストの投げ方に工夫が必要なのですが、適切な設計は少々高度な技術になります。
そこで私たちは、より高速で安全なチャットボット製作サービスの提供を開始しました。
高速で安全なチャットボットを用意するだけでなく、回答の精度を高めたり、学習データの用意をサポートしたりすることも可能です。
冒頭に紹介した、「A社のCTOって誰だっけ?」と聞くと、「Xさんです。2022年3月8日に#randomに投稿されたスレッドによると、Xさんは廃墟巡りが趣味だそうです。」と回答するような社内Slackボットも提供しています。
すでにいくつかの企業さんからお声をいただき、試験的に導入を開始しています。
実用を検討されている方は、baaang.tech@gmail.comまでお問い合わせください。
最後までお読みいただきありがとうございました!