LoginSignup
2
0

ChatGPT-3.5のAPIを利用する際、文字コードEUC-JPのままだとうまくいかない

Last updated at Posted at 2023-05-22

文字コードEUC-JPのデータにてChatGPT-3.5のAPIを利用しようとしたら、データが空で返ってきたのでメモ。

【環境】
文字コード:EUC-JP
言語:php7.4
OS:Amazon Linux

chatGPT-3.5に原因を聞いたところ下記内容が返ってきた。

★chatGPT-3.5★

文字コードEUC-JPは、日本語の文字エンコーディング方式の一つですが、
GPT-3.5モデルはEUC-JPを直接サポートしていません。
GPT-3.5はUTF-8文字エンコーディングを使用しており、日本語のテキストを
正しく処理するためには、入力テキストをUTF-8に変換する必要があります。

EUC-JPのテキストをUTF-8に変換する方法は、プログラミング言語や
環境によって異なりますが、多くのプログラミング言語には
文字エンコーディングを変換するための便利なライブラリや関数が存在します。

他の文献を調べても詳しい情報が見つけられなかったため、
今のところChatGPT側に送る時はutf-8に変換する必要があるとのことで認識。

2
0
2

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
2
0