2
3

More than 3 years have passed since last update.

PyOCRでエラーが出た話

Last updated at Posted at 2020-02-28

tesseractって「テッサラクト」ですよね?ここ読んで理解してください。
Jupyterはジュピターだし、Tensorflowはテンサーフロウです。
元英語教師としてここは譲れない。

エラーの内容

-psmっていう引数がダメってお叱りを受けました。

File "C:\Users\hogehoge\Anaconda3\envs\pyocr\lib\site-packages\pyocr\tesseract.py", line 362, in image_to_string

raise TesseractError(status, errors)

pyocr.error.TesseractError: (1, b"Error, unknown command line argument '-psm'\r\n")

直したこと

-psmっていう引数がダメだけど、--psmならOKらしい。ほえー。

C:\Users\hoge\Anaconda3\envs\pyocr\Lib\site-packages\pyocr\lib\site-packages\pyocr\

tesseract.py
command = [TESSERACT_CMD, "input.bmp", 'stdout', "--psm", "0"]

C:\Users\hoge\Anaconda3\envs\pyocr\Lib\site-packages\pyocr\

builders.py
tess_flags = ["--psm", str(tesseract_layout)]

ここのページを参考にしたのですが、Googleのキャッシュなんですよね。

ブログ全体を見てみるとハック系の記事ばかりなので、カテゴリを統一したいという意図でしょうかね?

(いやまぁこの問題は解決したっぽいんですけど、本来のOCRを用いて解決したい問題は解決していないのがなんとも。。。)

2
3
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
2
3