Go to Qiita Advent Calendar Top

34

More than 5 years have passed since last update.

@tanreinama(俊之坂本)

フリーの日本語OCR（と学習済みのモデル）を公開しています。

Last updated at 2020-04-08Posted at 2020-04-08

フリーの日本語OCR（と学習済みのモデル）を公開しています。

OCR概要

日本語OCRです。

OCRとは、画像を入力して、文字を認識するプログラムです。
今回、趣味で作った日本語OCRのプログラムと学習済みのモデルを公開しました。
以下のGitHubからダウンロードして使うことが出来ます。

GoogleVisionとかのOCR APIと何が違うの？

無料です
改変自由です
商用利用可です
というかMITライセンスです
サーバー無しで動かせます

認識出来る文字の種類は？

ひらがな、カタカナ、常用漢字、幾つかの英数記号を認識します
白抜き文字にも対応します
縦書き・横書き両対応します

動かせる環境は？

Python3
推奨環境：GPUメモリ≧6GB、Linux OS、Pytorch、OpenCV-Python

モデルの学習は？

今のところ、学習に使ったデータと学習用プログラムは公開していません
是非にと言う場合、個別に相談してくれれば、仕事として対応します

実行例

$ python3 ocr_japanease.py testshot1.png
file "testshot1.png" detected in 72 dpi
[Block #0]
がんばろう
[Block #1]
日本
[Block #2]
コロナウイルスにまけるな

入力画像

認識結果

解説

後で別の記事に書こうと思っています

Reference

日本語OCR　https://github.com/tanreinama/OCR_Japanease

34

Register as a new user and use Qiita more conveniently

You get articles that match your needs
You can efficiently read back useful information
You can use dark theme

What you can do with signing up

34