本記事と併せて以下の記事もご覧ください。
IDP by Workatoは、生成AIベース、かつスキーマフリーなOCR機能です。スキーマフリーですので、特定のテンプレートに依存することなく(テンプレートを用意し、テンプレートに対する認識エリアの事前マッピング等の作業を行うことなく)様々な文書の認識を行うことが可能です。
IDP by Workatoでは、以下のように認識させたいフィールドのスキーマを定義するだけで、目的のフィールドの値を取得することが出来ます。
フィールドを認識させるために必要な手順
フィールドを認識させるためには、そのフィールドが何であるのかをAIに対して伝える必要があります。
例えば、次のような健康保険証をIDP by Workatoで認識させてみるとします。
この場合、Workatoにおいては、次のように認識させたいフィールドの定義を行います。
例えば、「被保険者番号」を認識させたい場合は、次のような定義になります。
※以下サイトより引用
以上のようなフィールド名の定義だけでもIDP by Workatoはフィールドを認識できる場合はありますが、ほとんどの場合(特に日本語など英語以外の言語の文書の場合)認識に失敗し、次のように一切の結果を返さない場合があります。フィールド名のみではAIにおいて対応する項目を判別できないため、このような問題が生じます。
例えば、 insured_person_no
は「被保険者番号」であることをAIは理解していませんし、判断することもできません。このため、insured_person_no
は「被保険者番号」であることを理解させるために、人(レシピビルダー)による意味づけの対応が必要となります。
IDP by Workatoのフィールド定義においては、Description
という項目が存在します。必須項目ではないゆえに一見するとメモ欄と勘違いしてしまうのですが、こちらはメモ欄ではなくフィールドを識別するための重要な項目です。こちらに意味づけを追加することで、IDP by Workatoは文書上の対応する箇所を認識できるようになります。
以上の通りフィールド定義を行い、レシピを実行すると、IDP by Workatoより次の通り認識結果を取得できるようになります。