はじめに
ChatGPTの衝撃
OpenAIが開発したチャットボットChatGPTが注目を浴び始めたのは2022年11月からで、わずか半年の間にG7で生成系AIが主要トピックとして取り上げられるまでに至りました。
ChatGPTや生成系AIに関する詳細は他のページで述べられているため、ここでは特に語りませんが、これらが非常に面白い技術であることは間違いありません。人間とチャットしているかのような自然な会話を可能にし、様々なテキスト処理を行えます。さらに、コードを書かなくても多くのことができ、コードを書く際の相談相手にもなれる、驚くべき存在です。
マルチキャラクターチャットボットアプリケーション
ChatGPTのAPIを利用し、私はマルチキャラクターチャットボットアプリケーションを開発しました。"ChatGPTはすでにチャットボットではないのか?"と疑問に思われるかもしれませんが、以下の機能を追加することで新たな体験を実現しました。
- 複数の設定を持たせ、複数のキャラクターを表現した
- 会話の履歴を管理し、それぞれのキャラクターが継続した会話を行えるようにした
- それぞれのキャラクターが自分自身と他者を認識し、会話するようにした
- 個別のキャラクターの設定を画面から簡単に変更可能にした
- その他の設定も可能な限りシート上に保持し、変更を容易にした
複数のチャットボットに同時に質問したい、あるいはチャットボット同士が会話する様子を見てみたい。これが私の開発の動機でした。そして、この機能をできるだけ手軽に、小さな環境で実現しました。
事前にOpenAIのAPIキーの取得が必要ですが、APIキーがあれば、Google Sheetsを開くことができる環境であれば使用可能です。マルチキャラクターのチャットボットがどのように実現できるか理解できるように、OpenAI APIとやり取りするPayloadをシートにログ出力する機能も搭載しています。使用している言語モデルはGPTの中で最新のgpt-3.5-turboです。現時点では更に高性能なgpt-4も限定公開されていますが(ウェイトリスト登録が必要)、APIとしての利用は現実的にはgpt-3.5-turboが最適です。
APIに興味がある方、仕組みを見てみたいという方、ぜひ使ってみてください。もちろん、自分だけのキャラクターを作り、ひっそりと会話を楽しむことも可能です。このアプリケーションは完全にあなた専用です。
どんなことができるのか
チャット画面を表示する
設定が完了したら、ブラウザでウェブアプリのURLを開いてください。すると以下のような画面が表示されます。
左側にはキャラクターの名前、アイコン、そしてそのキャラクターの設定が表示されます。右側には実際の会話が表示されます。
チャットしてみる
まず最初に行うべきことは、チャット画面で実際にチャットボットたちに話しかけることです。画面右下には入力ボックスと2つのボタンが配置されています。入力ボックスにメッセージを打ち込み、送信ボタンをクリックします。
一番初めにやることは、チャット画面で実際にチャットボット達に話しかける事です。
画面右下に、入力ボックスとボタンが2個並んでいます。
入力ボックスにメッセージを入力し、送信ボタンを押します。
少し待つと、チャットボットたちは順に返答します。通常、1つのキャラクターからの応答には約30秒から1分ほどかかります。全てのキャラクターからの返答を待つには、少し時間が必要になるかもしれません。
チャットボット同士を会話させてみる
次に、自分から話しかけずにチャットボットたちに会話させてみましょう。
右下のボタン群から、「キャラクターたちに自由に話してもらう」ボタンをクリックします。
すると、会話が続けられます。
チャットボットの設定を変えてみる
キャラクターごとの設定は自由に変更可能です。例えば、左上の猫の設定を変更してみましょう。入力ボックスで文章を編集し、保存ボタンをクリックします。
その後、キャラクターは変更した設定に従って会話を進めます。キャラクターの会話は会話の履歴に影響を受けますので、すぐに変化するわけではありませんが、しばらく話し続けると変わります。もし必要であれば、一度会話の履歴を消去し、再度試すこともできます。
履歴を消去した後、再度自己紹介をリクエストしてみました。すると自己紹介の内容が変わっていました。
マルチキャラクターチャットボットアプリケーションを設置する
OpenAI API キーを取得する
あらかじめ、OpenAI API キーを取得する必要があります。
OpenAI APIキーについては、ChatGPTに質問したところ、以下のような回答でした。
OpenAI APIキーとは、OpenAIのAPIにアクセスするために必要な一意の識別子です。OpenAIは人工知能を開発・提供する組織であり、その技術を利用するためのAPI(Application Programming Interface)を提供しています。
APIキーは、ユーザーが自身のアプリケーションからOpenAIのAPIを安全に呼び出すことを可能にします。このキーを使用することで、ユーザーのリクエストをOpenAIが確認し、認証します。これにより、ユーザーのアプリケーションはOpenAIのAPIが提供する各種機能(例えば、自然言語処理やテキスト生成など)を利用することができます。
APIキーは非常に重要な情報であり、他人に知られると不正に使用される可能性があります。したがって、これは秘密に保持し、安全な場所に保存するべきです。また、OpenAIのAPIを使用するときには、常にAPIキーが必要になります。これはAPIリクエストの一部として送信され、リクエストがあなたから来たものであることを証明します。
OpenAI APIキーは、OpenAIのウェブサイトに登録し、ダッシュボードから生成・取得することができます。このキーは通常、長い英数字の文字列で構成されています。
取得方法については、以下のページの「OpenAIのAPIキーの発行手順」の項目が参考になります。
APIの利用は基本的に有料ですが、アカウントの新規登録時に18ドルのクレジットが付与されます。有効期間は3か月で、この間は実質無料でAPIを利用することが可能です。
ファイルを自分のドライブにコピーする
Googleアカウントにログインし、以下のリンクからファイルを開いてください。
次に示すようなGoogle Sheetsのワークシートが表示されます。
このファイルは、閲覧のみの設定で共有されています。したがって、ご自身のドライブにこのファイルをコピーしてください。
スクリプトが含まれているため、警告メッセージが表示されますが、コピーボタンを押して、マイドライブか任意のフォルダにコピーしてください。
ウェブアプリケーションをデプロイする
次に、sheetsをウェブアプリケーションとして公開します。
しかしご注意ください、ウェブアプリケーションとして公開しても、アクセス可能なのはコピーしたファイルの所有者、つまりあなた自身だけです。
他の人がチャット画面を表示することは基本的にはできません。
Sheetsの拡張機能から、App Scriptを選択します。
スクリプトエディタが開きますので、右上の「デプロイ」をクリックします。
「新しいデプロイ」を選択します。
以下の設定を確認し、「デプロイ」ボタンを押します。
- 次のユーザーとして実行:自分
- アクセスできるユーザー:自分のみ
このアプリケーションは、内部でhttpリクエスト(APIの呼び出し)を行うため、実行前にあなたの承認が必要となります。
そのため、「アクセスを承認」ボタンを押してください。
自分のアカウントを選択します。
「Advanced」を選びます。
「Go to ChatBook (unsafe)」を選びます。
※警告画面が表示されますが、これは内部でOpenAIのAPI呼び出しを行う(つまり、外部サイトに情報を送信する)ために必要な確認です。
「Allow」をクリックします。
デプロイが成功すると、ウェブアプリのURLが発行されます。表示されたURLをコピーし、「完了」ボタンをクリックします。
APIキーを設定する
OpenAIのAPIを使用するために、まずAPIキーを設定します。
ChatBookのスプレッドシートを開き、「Setting」タブをクリックします。
「OPENAI_API_KEY」の右側のフィールドに、事前に取得したAPIキーを入力します。
以下のように入力することになります。入力したデータは自動的に保存されます。
チャット画面の表示
前述した手順でコピーしたURLをブラウザに貼り付け、アクセスします。
お疲れさまでした。これでチャットアプリケーションの設置は完了です。
マルチキャラクターチャットボットアプリケーションはすでに実行されています。
チャットボット達に話しかけてみたり、設定を変えてみたり、色々と試してみてください。
マルチキャラクターチャットボットアプリケーションの仕組みについて
Google Sheetsを利用したチャットアプリケーションの構築
Google Sheetsは、App Script内でHTMLを管理し、デプロイしたURLを通じて該当HTMLをウェブページとして表示する機能を備えています。クライアントアプリケーションの動作には、Vue.jsというオープンソースのJavaScriptフレームワークを採用しています。サーバーサイドはApp Scriptで構築され、Google Sheetsのスプレッドシートがデータベースとして機能しています。
gpt-3.5-turbo を用いたマルチキャラクターチャットボットによるチャットの仕組み
OpenAI APIには、'completions'というモードがあり、これには会話履歴を解釈する機能が含まれています。このチャット機能は、複数のユーザーを識別する能力を持っています。当該アプリケーションでは、この機能を利用して、複数のキャラクターが互いを識別しながら異なる役割を演じることができます。
今後このアプリケーションが注目を集める場合、その技術的な側面について詳細な記事を公開する予定です。
GitHubにAppScript部分のコードを公開しています。内容にご興味ある方は、併せてご確認ください。
変更履歴
2023/05/27
- 履歴が0行だった時に画面が表示できないバグを修正
- キャラクター設定の文字数を変更
- ボタンの表記を修正