文字コードEUC-JPのデータにてChatGPT-3.5のAPIを利用しようとしたら、データが空で返ってきたのでメモ。
【環境】
文字コード:EUC-JP
言語:php7.4
OS:Amazon Linux
chatGPT-3.5に原因を聞いたところ下記内容が返ってきた。
★chatGPT-3.5★
文字コードEUC-JPは、日本語の文字エンコーディング方式の一つですが、
GPT-3.5モデルはEUC-JPを直接サポートしていません。
GPT-3.5はUTF-8文字エンコーディングを使用しており、日本語のテキストを
正しく処理するためには、入力テキストをUTF-8に変換する必要があります。
EUC-JPのテキストをUTF-8に変換する方法は、プログラミング言語や
環境によって異なりますが、多くのプログラミング言語には
文字エンコーディングを変換するための便利なライブラリや関数が存在します。
他の文献を調べても詳しい情報が見つけられなかったため、
今のところChatGPT側に送る時はutf-8に変換する必要があるとのことで認識。