0
0

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?

LLMに文字化けメッセージを送るとどうなるか

Posted at

興味本位の実験です。

WebスクレイピングとLLMを組み合わせたプログラムを作成していたところ、Shift JISでうっかり文字化けしたテキストを送信しても意外と理解してくれたように見えました。

どうなってるんだ?と試してみました。

実験手順

こんにちは。あなたの名前は何ですか?

をShift JISで保存、UTF-8として読み込み、文字化けさせます。

����ɂ��́B���Ȃ��̖��O�͉��ł����H

これをLLMに渡して反応を見ます。

OpenAI ChatGPT 4o

文字化けしてるとメタ認知してるものの、「こんにちは」までを推測した様子。

CleanShot 2025-02-24 at 21.28.54@2x.png

Anthropic Claude 3.5 Sonnet

なぜか正しく答えてくれたものの、どうしてわかったの?と聞いても要領を得ない回答でした。

CleanShot 2025-02-24 at 21.30.06@2x.png

xAI Grok3

正しく答えてくれて、文字化けもメタ認知しているようです。さすが(自称)世界一賢いAI。

CleanShot 2025-02-24 at 21.30.52@2x.png

Google Gemini 2.0 Flash

こういうのでいいんだよ、という感じの回答です。確率的に続きを紡ぎ出すTransformerは直感的にこうなりそうですよね。

CleanShot 2025-02-24 at 21.34.12@2x.png

まとめ

個性が出て面白いです。

チャットUIということもあり、それぞれユーザーの意図を推測する固有の前処理が入っているように感じました。

それでも「文字化け」を認識するのは不思議だなと思います。「こんにちは」の文字化け例はポピュラーなので学習データにも含まれているからでしょうかね。

0
0
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
0
0

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?