1
0

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?

Pythonista 3でUTF-8ファイルopen時に出るUnicodeDecodeErrorへの対処法

Posted at

概要

  • Pythonista 3でUTF-8が含まれるファイルを迂闊にopenするとエラーが出る
  • Pythonista 3ではopen時にencoding='utf-8'の明示的指定が必要
  • このエラーが発生するのはPython 3におけるopenの仕様による
  • Pythonista 3でもこの仕様によるエラーが発生する環境である

発生した環境

Pythonista 3 (バージョン3.4)

起きたこと

以下のコードをPythonista 3上で実行させ、
日本語ファイル(UTF-8)を読みこませようとするとエラーが発生する。

test_code.py
file_name = 'japanese_utf-8_file.txt'
with `open`(file_name) as f:
    print(f.read())

UnicodeDecodeError: 'ascii' codec can't decode byte 0xe3 in position 171: ordinal not in range(128)

0xe3とpositionの後の数値は読み込ませたファイルによって異なる。

原因

どうやらUTF-8ファイルをUS-ASCIIファイルと勘違いして、
無理にデコードしようとしてエラーになっている模様。

なおこの事象はPython 3におけるopenの仕様である。
たまたまこの仕様がPythonista 3の環境でこうなったというだけである。

気付いた理由

エラー表示の変数(Vars)の項目で、ファイルオブジェクトのencodingが'UTF-8'ではなく
'US-ASCII'になっていたことで気付いた。

対策

以下のように、openの際にencoding='utf-8'を付けるとエラーが出なくなる。

test_code_recovered.py
file_name = 'japanese_utf-8_file.txt'
with `open`(file_name, encoding='utf-8') as f:
    print(f.read())

結論

  • openでのUnicodeDecodeError問題はPythonista 3でも発生する
  • openの際はencoding='utf-8'を付ける

参考資料

直接参考にした資料のみ記載。
Python 3の文字コード関連についてはQiitaを探せばいろいろと出てくる。

その他

今更だし車輪の再発明の気もするが、Pythonista 3で直接この件について
言及した記事が見つからなかったので作成してみた。

1
0
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
1
0

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?