More than 5 years have passed since last update.

Tesseract.jsを試す

JavaScript

Last updated at 2016-10-13Posted at 2016-10-13

Tesseract.jsはPure JavascriptなORCするライブラリのようです。
書いた時点では62言語に対応してます。もちろん日本語も含まれています。

試す

ブラウザで見ます。
画像はこれです

index.html

<!DOCTYPE html>
<html>
<head>
	<title>test</title>
</head>
<body>
	<div id="test"></div>
	<img src="test.png">
	<div id="test2"></div>
	<img src="test2.png">
	<script src='https://cdn.rawgit.com/naptha/tesseract.js/0.2.0/dist/tesseract.js'></script>
	<script type="text/javascript" src="index.js"></script>
</body>
</html>

index.js

Tesseract.recognize("./test.png",{lang:"jpn"}).then(function(result){
    const a = document.querySelector("#test");
    a.innerHTML = result.html;
})
Tesseract.recognize("./test2.png").then(function(result){
    const a = document.querySelector("#test2");
    a.innerHTML = result.html;
})

ちょっと待つと文字を認識した結果が出てきます。

結果

日本語: 二れはサンプルテキス卜て"す
英語: Sample TexT Sample Text Tes’r Tes’r

ある程度は認識してくれていますね。

You get articles that match your needs
You can efficiently read back useful information
You can use dark theme

What you can do with signing up