はじめに
本記事執筆時点(2024/4/21時点)ではベータ版となっているようですが、OpenAI の Assistants API に新バージョンのものが出たらしいので、それを見てみたという話です。
v2 に関する公式ドキュメント
OpenAI公式ドキュメントでは以下に情報が掲載されています。
●What's new in the Assistants API - OpenAI API
https://platform.openai.com/docs/assistants/whats-new
v1 から v2 への移行について
合わせて、v1 から v2 へ移行する場合のガイドも出ているようです。
●Migrating from v1 to v2 - OpenAI API
https://platform.openai.com/docs/assistants/migration
v2 に関する説明をいくつか見てみる
それでは、v2 に関する説明をいくつか見てみます。
ざっと見た感じでは、一部の内容は、「これまで他の API ではできていたことが、Assistants API でもできるようになった」という内容があるようでした。
File Search
公式ドキュメントの箇条書きで、最初に登場していたのが以下の「File Search」です。
●File Search - OpenAI API
https://platform.openai.com/docs/assistants/tools/file-search?context=streaming
1アシスタントあたり 1万までのファイルを扱うことができ、それを高速に検索できたりするようです。
トークンの最大数の制御
コストを管理する際に関係してくる機能が追加されたようです。
具体的には、Assistants API を実行した際の、1回あたりで使用するトークン数の最大値を設定できるようです。
tool_choiceパラメータ
「file_search、code_interpreter、function」などを実行する際に設定できるパラメータで「tool_choice」が追加されたようです。
これを設定することで、ツールの選択を任意のものに指定できるようです。
会話履歴のロール設定やパラメータ設定関連
会話履歴を作成する部分のロールの設定で assistant を指定できるようになったようです。
また、モデルの設定パラメータで、temperature、response_format (JSON mode)、top_p などの、ポピュラーなパラメータがサポートされるようになったようです。
ファインチューニングされたモデルの利用
Assistants API で、ファインチューニングされたモデルが利用できるようになったようです。その際、対象にできるモデルは「gpt-3.5-turbo-0125」をファインチューニングしたもののみになるようです。
SDK関連など
Node.js と Python の SDK に、ストリーミング・ポーリングのヘルパーが追加されたようです。
また、上記で話が出てきているストリーミングは、今回の v2 で利用可能になった状況のようです。
おわりに
OpenAI の Assistants API の新バージョンの情報を見てみました。
今回はまずは情報を見てみただけでしたが、今後、実際に API を試してみようと思います。