この記事で取り扱う問題
文字コード変換を起こった時の、下記のようなエラーが発生することがある。
"\x87@" from Shift_JIS to UTF-8
この時、実際に問題を起こしている文字を特定する手法について記載している。
実際の手順
エラー文から、今回はShift-JISからUTF-8への変換を行おうとしたことが分かる。
"\x87@"
を分解すると
"\x87"
と "@"
の二文字として解釈できる。
"@"
という文字はUTF8で \x40
の位置にある文字なので、これを \x40
と解釈する。
"@"
を読み変えることで、エラーを起こした文字はShift-JISにおける "\x87\x40"
であることが分かる。
上記の情報を元にShift-JISのコード表を探す。
この文字はSJISの機種依存文字の①だとわかる。