norichintnk
@norichintnk (t. m.)

Are you sure you want to delete the question?

If your question is resolved, you may close it.

Leaving a resolved question undeleted may help others!

We hope you find it useful!

Tesseract OCRとClova OCRでなぜこんなにも精度が違うのか

はじめに

1.具体的にここがエラーで詰まってるとかの話ではないです。
2.こういう系の質問ができる他のサービスがございましたら教えていただけると幸いです。

質問内容

プログラミング初学の者です。最近OCRに興味が湧き、手元で試したくなったため引用画像を使って以下のコードをGoogle Colab上で実行し、OCRを試みましたが全然うまく認識されませんでした。

from PIL import Image

import pyocr

import pyocr.builders

import cv2

img1 = Image.open('drive/My Drive/Colab Notebooks/maiky.jpg')

tools = pyocr.get_available_tools()

tool = tools[0]

builder = pyocr.builders.TextBuilder()

builder.tesseract_layout = 11

txt1 = tool.image_to_string(img1, lang='jpn', builder = builder)

print(txt1)

スクリーンショット 2021-09-10 22.09.20.png

一方、LINEでその画像を開き文字認識させるとしっかり「いねえよなぁ!!?」と抽出できておりました。(LINEさんすごい。。)これを実現してるのはClova OCRかと思います。
S__14016514.jpg

こんなにも精度に差があるのにTesseract OCRを使うメリットはあるのでしょうか。今回の結果からするとLINEさんが開発してるClova OCRの方がよっぽど実用的です。また、Tesseractを使った場合、手元で精度を上げる方法などございましたらご教授いただけると幸いです。よろしくお願いいたします。

0

1Answer

Tesseract OCRのメリットとしては

  • 無料
  • オープンソース
  • 追加学習などが可能
  • オフライン(←追記)

というところでしょうか。

商用サービスには全く及びませんが、縦書き版の使用、追加学習で多少は精度は上げられると思います。

0Like

Your answer might help someone💌