Pythonista 3でUTF-8ファイルopen時に出るUnicodeDecodeErrorへの対処法

Posted at 2025-03-28

概要

Pythonista 3 (バージョン3.4)

以下のコードをPythonista 3上で実行させ、
日本語ファイル(UTF-8)を読みこませようとするとエラーが発生する。

test_code.py

file_name = 'japanese_utf-8_file.txt'
with `open`(file_name) as f:
    print(f.read())

UnicodeDecodeError: 'ascii' codec can't decode byte 0xe3 in position 171: ordinal not in range(128)

0xe3とpositionの後の数値は読み込ませたファイルによって異なる。

どうやらUTF-8ファイルをUS-ASCIIファイルと勘違いして、
無理にデコードしようとしてエラーになっている模様。

なおこの事象はPython 3におけるopenの仕様である。
たまたまこの仕様がPythonista 3の環境でこうなったというだけである。

エラー表示の変数(Vars)の項目で、ファイルオブジェクトのencodingが'UTF-8'ではなく
'US-ASCII'になっていたことで気付いた。

以下のように、openの際にencoding='utf-8'を付けるとエラーが出なくなる。

test_code_recovered.py

file_name = 'japanese_utf-8_file.txt'
with `open`(file_name, encoding='utf-8') as f:
    print(f.read())

直接参考にした資料のみ記載。
Python 3の文字コード関連についてはQiitaを探せばいろいろと出てくる。

今更だし車輪の再発明の気もするが、Pythonista 3で直接この件について
言及した記事が見つからなかったので作成してみた。