More than 3 years have passed since last update.

Windows 10のChromeで文字認識(OCR)

Last updated at 2021-02-20Posted at 2020-01-22

Shape Detection APIのTextDetectorで Text Detection not implemented. というエラーが出たのでメモ。

【重要】Windows 10にEnglishの言語機能(光学式文字認識)をインストール

日本語のWindowsには、Englishの言語機能は入ってないので注意が必要。
PowerShellを管理者権限で開く

Add-WindowsCapability -Online -Name "Language.OCR~~~en-US~0.0.1.0"

# インストールできたか確認
Get-WindowsCapability -Online -Name "Language.OCR*en-US*"

chrome://flags/#enable-experimental-web-platform-featuresにアクセスし、Enabledに変更し、ChromeをRelaunch

画像を選択すると自動でOCRを行います。

See the Pen Windows 10 Chrome OCR by John Doe (@04) on CodePen.

WebカメラからOCRを行います。リアルタイムでBoundingBoxが付きます。

[Violation] Feature policy violation: camera is not allowed in this document. で動かないので右上の EDIT ON CODEPEN を押して動かしてください。

FullHD、フルスクリーンでOCRするサンプルもあります。
https://codepen.io/04/pen/wvBRQYg

英数字や記号しか認識できませんが、Tesseract.jsよりも高速で精度が高いので追跡番号などを認識するのにおすすめです。
オフラインで動作するので、Google VisionやAmazon Textractが使えない環境にもおすすめです。画像をクラウドにアップすると時間がかかりますが、エッジでやれば、高速でお金もかかりません。