フリーの日本語OCR(と学習済みのモデル)を公開しています。
日本語OCRです。
OCRとは、画像を入力して、文字を認識するプログラムです。
今回、趣味で作った日本語OCRのプログラムと学習済みのモデルを公開しました。
以下のGitHubからダウンロードして使うことが出来ます。
GoogleVisionとかのOCR APIと何が違うの?
- 無料です
- 改変自由です
- 商用利用可です
- というかMITライセンスです
- サーバー無しで動かせます
認識出来る文字の種類は?
- ひらがな、カタカナ、常用漢字、幾つかの英数記号を認識します
- 白抜き文字にも対応します
- 縦書き・横書き両対応します
動かせる環境は?
- Python3
- 推奨環境:GPUメモリ≧6GB、Linux OS、Pytorch、OpenCV-Python
モデルの学習は?
- 今のところ、学習に使ったデータと学習用プログラムは公開していません
- 是非にと言う場合、個別に相談してくれれば、仕事として対応します
実行例
$ python3 ocr_japanease.py testshot1.png
file "testshot1.png" detected in 72 dpi
[Block #0]
がんばろう
[Block #1]
日本
[Block #2]
コロナウイルスにまけるな
解説
後で別の記事に書こうと思っています