Tesseract.jsとは
http://tesseract.projectnaptha.com/
Tesseract.js is a pure Javascript port of the popular Tesseract OCR engine.
って書いてるのでJavaScriptでかかれたOCRエンジンです。
HTMLのなかで
<img src="./images/cosmic.png" class="img"></img>
って言う風にimgタグでイメージ表示させて
JavaScriptで
var image = document.getElementsByClassName("img");
でimage取得して
Tesseract.recognize(image[0])
.progress(message => console.log(message))
.catch(err => console.error(err))
.then(result => console.log(result))
.finally(resultOrError => console.log(resultOrError));
で処理してあげるとresultにOCR結果が返ってくる素敵なものになってます。
にサンプルとして作ったのあげてます(環境はnodejsでパッケージ管理&http-server立ち上げ)