More than 1 year has passed since last update.

Azure Form Recognizerv3.0で日本の運転免許証の項目読取りモデルを作成してみた

Last updated at 2023-04-25Posted at 2023-04-25

概要

Azure FormRecognizerで提供されている身分証明書 (ID)事前構築済みモデルでは、運転免許証の読み取りは米国のフォーマットを対象としているため日本の免許証はうまく読み込めません。そこでFormRecognizerのカスタム抽出モデルを活用し、日本国内の運転免許証用の読み込みモデルを作成してみました。

参考：身分証明書モデル

Azure FormRecognizerとは

名刺や免許証、請求書、レシートなどのドキュメントからテキストと構造データを抽出できるOCRサービス。事前構築済みの機械学習モデルに加え、カスタムモデルの構築も可能です。

FormRecognizerのカスタム抽出モデルの設定

プロジェクトの作成

事前にAzurePortalより、カスタム抽出モデルのプロジェクト作成時に必要となる下記のリソース作成を行います。

・Form Recognizer
・ストレージアカウント（モデル生成に必要なBLOBデータを格納するストレージ）
・コンテナ（ストレージアカウント内のBLOBデータの保管先ディクレトリ）

リソースの作成後、Form Recognizer Studioよりカスタムモデル（Custom extraction model）のプロジェクト作成を行います。

・Form Recognizer Studioの下部にあるCustom extraction modelを選択します。

・My projectからプロジェクトを作成します。

・事前に作成したリソース（Form Recognizer、ストレージアカウント、コンテナ）を含め必要な情報を入力します。

・Form Recognizerリソースの選択

・ストレージアカウント、コンテナリソースの選択

登録が完了すると下記のカスタム抽出モデルのトレーニング画面（ラベル付け）に遷移します。

モデルのトレーニング

カスタム抽出モデルのトレーニング（ラベル付け）画面にて学習用のファイル（運転免許証画像）をアップロードします。モデルのトレーニングを行うのに少なくとも５枚以上のファイルを登録する必要があります。

アップロードした画像ファイルに対し、抽出したいフィールド（画像内の項目）を追加の上、マウスのクリック操作でラベル付けを行います。
ラベル付けされた項目値はフィールド名の下部に表示されます。

※画面右側のフィールド一覧上部の＋ボタンからFieldを選択し、名称を入力し設定します。
*画像はフリー素材を利用しています

５枚以上のファイルのラベル付けを完了したら、右上のTrainボタンよりトレーニングを開始します。

Model IDに任意の名称を入力、ModeにTemplateを選択しTrainボタンを押し、しばらく待つとモデルのトレーニングが完了します。

参考：ドキュメントのラベル付けについて

今回追加設定したフィールド

フィールド名	免許証項目
name	氏名
address	住所
delivery	交付日
expiration date	有効期限
number	免許証番号
birthday	生年月日
condition	免許の条件等

モデルのテスト

トレーニング完了したモデルをテストします。
免許証画像*をアップロードし、Analyzeボタンを選択し、モデルのテストを開始できます。
テスト結果はメイン画面に表示され、画像から抽出された各フィールドの値が右側のナビゲーションバーに表示されます。

各フィールドの抽出結果を評価し必要に応じてモデルのトレーニングを継続します。

参考：モデルの正確性を高める方法

右側のナビゲーションバーでは、モデル利用のコードサンプル（python,javascript,C#）、テスト結果のJSONデータの確認もできます。

また作成したモデルは、RESTAPIから呼び出すことも可能です。詳細は下記のドキュメントからご確認ください。

おわりに

Form Recognizer v3.0をサポートするForm Recognizer Studioを使ってのカスタムモデルの作成がGUIベースで直感的に行えました。studio上でコードサンプルも提示してくれるのでモデルを利用したアプリの作成などもスムーズに行えそうな感触を持ちました。
機能追加のペースもそれなりの頻度で行われていきそうなので今後も試していきたいと思います。

You get articles that match your needs
You can efficiently read back useful information
You can use dark theme

What you can do with signing up