EasyOCRとは
まずOCRとは(Optical Character Recognition/Reader)の略称で、文字をカメラや写真から読みとり、コンピュータが利用できるデジタルの文字コードに変換する技術のことである。
EasyOCRはGitHubで公開されているPython用のOCRである。
EasyOCRをインストールして実装まで何度かエラーが発生したのでメモ。
EasyOCRの環境構築
環境
python 3.9.2
pyenvにて環境構築
windows 10 22H2
こちらのサイトをもとにインストール
pipでインストール
pip install easyocr
上記のサイトではeasyocr\utils.pyの
img_cv_grey = cv2.imread(image, cv2.IMREAD_GRAYSCALE)
をコメントアウトしないといけないとあるがコメントアウトを行うとエラーが発生するのでそのままでOK
def cv2_readimg(filename, mode):
img_date = np.fromfile(filename, dtype=np.uint8)
img = cv2.imdecode(img_date, mode)
return img
こちらの関数は追加する。
EasyOCRをインストールするとpillowも同時にインストールされるが、インストールされるバージョンがpillow10.0でありエラーの原因になるため、一度消してpillow9.5.0を再インストールする。
pip uninstall Pillow
pip install Pillow==9.5.0
これでEasyOCRの環境を構築が完了。