無償で試してみる
下記に「アカウント申請」という件名(本文なし)でメールを送付頂ければ、数分程度でアカウント情報を返信します。
ocr.lastonemile@gmail.com
- 利用規約に同意の上、ご利用ください。 https://tanoshimane.stores.jp/news/603313afc19c4527490eb72e
- kintoneというクラウドアプリ上に構築しており、そのゲストIDを発行します。
- 30日間又は100ページまで(kintoneの利用料含めて)無償で利用可能です。
詳細:https://qiita.com/Lastonemile/items/65b9102c868e09b3248e
プラグインのダウンロード
kintone用OCRプラグイン及びテンプレートが、下記よりダウンロード(無償で購入)可能です。
利用(設定)方法
- IEではご利用いただけません(Chrome,edgeは動作確認済、その他ブラウザは未検証です)
- 初回利用時から1か月間無償でご利用いただけます。
- ご利用にあたり、ご利用者のドメイン情報を取得します(ドメイン毎に利用期間を管理しています)。
- 利用にあたり、別途Google Cloud Vision のAPIキーを取得頂く必要がございます。(取得代行も行っています)
Cloud Visionの詳細:https://cloud.google.com/vision/docs?hl=ja
APIキー取得方法:https://syncer.jp/cloud-vision-api
APIキーの管理には十分ご注意ください
はじめに
この記事では、OCRシステム(Vision API arr.by LOM)で利用する文書テンプレートについて説明します。
ユーザー登録
下記の記事より、ユーザー登録してください。
https://qiita.com/Lastonemile/items/65b9102c868e09b3248e
文書テンプレート
OCRを実施する前に、文書種類毎に文書テンプレートを作成する必要があります。この文書テンプレートは文書の種類(様式)が同様であれば最初に1テンプレート作成すれば大丈夫です。文書の設計図のようなものだとご理解いただければと思います。*「文書の種類(様式)が同様」とは、具体的にはKEYWORDの文言及びその(大まかな)座標が変わらないことを指します。
文書テンプレートの作成手順
文書テンプレートの作成手順は、大まかに①Template assistアプリで概要を作成し、(必要があれば)②文書テンプレートアプリで詳細な設定を追記します。(Template assistアプリのみで完結する場合もあります)
文書テンプレートアプリのみで作成することも可能ですが、Template assistアプリを利用することで検索KEYWORDの設定やそのOCR範囲をより簡単に実施することが可能になります。具体的には、それぞれのKEYWORDごとにある程度の範囲を自動設定する機能や設定変更時に画面上で値を表示する機能が備わっておりますので、直観的に文書テンプレートを作成いただけます。
事前準備(対象文書の用意)
Template assistを利用するためには、同一様式で内容が異なる文書を2文書用意する必要があります。今回の例(請求書)から値を取得する前提として、下記2文書を用意しました。
実際の作成方法(Template assist アプリ)
事前に準備した2文書を(PDFなら対象ファイル(pdf)、png jpegなら対象ファイル(png or jpeg)へ)添付し、文書テンプレート名・scaleを設定し保存後、「KEYWORD取得」ボタンを押します。*scaleはpdf→png変換時の解像度(倍率)です。基本的に数値が高いと高画質になります。
すると、画面下部のKEYWORD一覧テーブルに候補となるKEYWORDとその値が表示されます。
KINTONEの編集(えんぴつ)マークからレコード編集画面に移り、不要なKEYWORDを削除します。
*ここで必要だが表示されていないKEYWORDは、後で追加します。(後述)
この時点で目的の「値」が上手くとれているKEYWORDについては、このままで構いませんが、上手く取れていないKEYWORDについては、この画面上で設定を行います。具体的には、value位置・LIMIT_KEY・上下左右の範囲・正規表現をそれぞれ調整していきます。
今回は請求番号、請求日、支払期限は上手く取得出来ていますので、振込先の諸設定を調整していきます。
ちなみに、画面上に表示される「画像を表示」ボタンを押すことで、元画像が表示されます(設定の参考に活用ください)。
まず、value位置は複数行ありますので、「下複数行」に変更します。
すると、画面が更新され値が変化します。今回は取りたい値より下まで取得してしまっていることがわかります。そのため、LIMIT_KEYを設定し無駄な範囲を取得しないように調整します。振込先は「品名」というKEYWORDよりも必ず上になるはずなので、LIMIT_KEYに「品名」と設定します。
これで、振込先は上手く値が取得出来ました。
あとは明細部分になる、品名・数量・単位・単価・金額を設定します。これらはKEYWORD取得で取得されなかったため、マニュアルで追加していきます。まず品名について、value位置・LIMIT_KEYを入力します。
すると、値に「対象範囲に値が見つかりません」と表示されました。よく見ると左範囲が少し大きいように感じます。そこで左範囲の値を「0.2078」から「0.1」に変更します。尚、範囲の設定は大体の感覚で大まかに設定するイメージで構いません。あまり細かく設定するとKEYWORDの場所が動いた際に対応できなくなり、ロストする原因になります。
不要な文字(商品名の頭の数字)は含めれていますが、範囲としては大体上手くとれました。一先ず、ここ(Template assist)ではこれで良しとします。*今回の品名のようにTemplate assistで上手く取得できなかったKEYWORDは文書テンプレートアプリで細かく設定します。
同じ要領で、数量を設定します。
数量はvalue位置:テーブル・LIMIT_KEY:小計と設定したところ、単位列も併せて取得してしまいました。
ここで右範囲を調整することで値を上手く取得できれば良いのですが、今回の場合だと単位を同じ文字列として取得してしまっているため、右範囲の調整では上手くいきませんでした。そのような場合、正規表現で値をフィルターすることで上手く取得出来る場合があり、数量は「数字のみ」と設定することで上手く値を取得出来ました。
尚、Template assistでは、数字のみ・数字+記号・数字以外(記号除く)・数字以外+記号 の4種類から設定できます。より細かな正規表現での設定を行いたい場合は、文書テンプレートアプリで行います。
以降、同じ要領で単位・単価・金額を設定することが出来ましたので、保存 → 文書テンプレートを登録します。尚、単価の値で上手く取得出来ていない値(100を10Dと誤認している)についても品名同様に文書テンプレートアプリで調整していきます。
実際の作成方法(文書テンプレートアプリ)
文書テンプレートアプリでは、Template assistアプリにはない、文字列置換(全体)_csv・マスタ_csv・文字列置換(個別)_csv・正規表現が設定可能です。前3つ(_csvとついているもの)はcsvファイルを添付することで、正規表現は直接入力することで設定が可能です。
文書テンプレートアプリの詳細な設定方法:
今回はTemplate assistアプリで上手く取得できなかった、品名と単価を追加設定したいと思います。
まず、品名については、Template assistアプリでの設定結果は下記のようになっていました。問題は品名の前に「|」(たぶん罫線のご認識)と数字(SEQ番号)を取得していることですので、これらを除去していきます。
品名には必ず1文字以上の数字以外の文字が含まれますので、正規表現に[^0-9]と入力します。これで数字だけの文字列である「3、5~12」は取得しなくなります。
「|」については、罫線がある文書ではよく見受けられるもので、基本的に他のKEYWORDでも値に「|」が含まれることは考え難いため、文字列置換(全体)_csvで除去します。文字列置換(全体)_csvに下記のcsvを添付します。
また、品名には数字は含まれません(と仮定します)ので、文字列置換(個別)_csvに下記のcsvを添付します。
そのため、文字列置換(個別)_csvでアルファベットを数字に変換します。今回はDだけではなく、よくありそうなアルファベットと数字の組み合わせをまとめて登録します。単価以外にも数量と金額列は数字しかありませんので、こちらにも同様のcsvを添付しておきます。
実際にOCRを実行したところ、上手く値が取得できました。
- OCRプラグイン(Vision API arr.by LOM)利用方法:https://qiita.com/Lastonemile/items/0651e9845410f12fc660