Python の初心者です。
先輩たちにご教授願えると幸いです。
質問
1.Python で扱える OCR パッケージのうち、マニュアルが存在するもの(英語可)、あるいはネット上で実例が豊富な(検索でよく当たる)ものを教えて頂けないでしょうか。
2. また、精度の高いパッケージはどれでしょうか。フリーとシェアで教えてもらえると助かります。
3.扱い方を説明しているおすすめのサイトなどあれば教えて頂きたいです。
環境
OS: X Yosemite
Anaconda 4.3.1 (python 3.6.0)
やりたいこと
・jpeg ファイルからの英数字の認識
現状:
1. pytesseract をインストールする。
2. マニュアルを見つけられず(私の探し方が悪いだけな気がしますが。)、ネットから調べて書いてみる。=> エラーを返される。
3. 下記のような数字限定での読み取りはなんとか成功した。精度も悪くなかったが、数字だけ。。。
word_lines = pytesseract.image_to_string(img, config = "nobatch digits")
config 以降の数値のみ設定を消すとエラー。
4. 数字だけでは使えないため、pytesseract を python で動かすのではなく、元の tesseract をインストールして、mac のターミナル動かしてみた。
5. 動いたが今度は読み取り精度にかける。
宜しくお願いします。