LoginSignup
23
33

More than 3 years have passed since last update.

フリーの日本語OCR(と学習済みのモデル)を公開しています。

Last updated at Posted at 2020-04-08

フリーの日本語OCR(と学習済みのモデル)を公開しています。

OCR概要

日本語OCRです。

OCRとは、画像を入力して、文字を認識するプログラムです。
今回、趣味で作った日本語OCRのプログラムと学習済みのモデルを公開しました。
以下のGitHubからダウンロードして使うことが出来ます。

GoogleVisionとかのOCR APIと何が違うの?

  • 無料です
  • 改変自由です
  • 商用利用可です
  • というかMITライセンスです
  • サーバー無しで動かせます

認識出来る文字の種類は?

  • ひらがな、カタカナ、常用漢字、幾つかの英数記号を認識します
  • 白抜き文字にも対応します
  • 縦書き・横書き両対応します

動かせる環境は?

  • Python3
  • 推奨環境:GPUメモリ≧6GB、Linux OS、Pytorch、OpenCV-Python

モデルの学習は?

  • 今のところ、学習に使ったデータと学習用プログラムは公開していません
  • 是非にと言う場合、個別に相談してくれれば、仕事として対応します

実行例

$ python3 ocr_japanease.py testshot1.png
file "testshot1.png" detected in 72 dpi
[Block #0]
がんばろう
[Block #1]
日本
[Block #2]
コロナウイルスにまけるな

入力画像
testshot1.png
認識結果
testshot1.png-detections.png

解説

後で別の記事に書こうと思っています

Reference

日本語OCR https://github.com/tanreinama/OCR_Japanease

23
33
1

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
23
33