概要
今回はオープン社提供のAIパンチャーサービスを利用し、複数の会社から送られてきたそれぞれに異なるフォーマットの請求書PDFをもとに、AIパンチャーに読み込ませ、最終的に1つのExcelファイルとしてダウンロードさせてみます。
最初は手でアップロードとダウンロードをしますが、その後はオープン社から提供されているRPAツールであるBizRobo!を使って自動化してみます。
AIパンチャーとは?
紙、写真、PDFを取り込むだけでデータの 仕分け / エクセル化 と 資料作成 を自動化できるサービスです。
請求書は自社で作成する文書と異なり、それぞれ別の企業から送られるため、フォーマットも異なります。
PDFで電子化はされていても、結局はそれぞれ請求書を目で見て手作業で自社のシステムに書き写す手間が発生しがちです。
それが大変だということで、AI-OCRで読み込ませてCSVなどのデータに直し、RPAでシステムへの入力を自動化したりするわけです。
ただ、一度フォーマット登録してしまえば比較的正確に読み込んでくれるのですが、各社分それぞれにフォーマット登録するのが手間だったり、いちいち作成毎に都度費用がかかったりするのがネックになったりします。
しかし、AIパンチャーでは、非定型のフォーマットであっても、1つの設定だけで一度に複数ファイルをアップロードしてデータ化でき、フォーマットごとの追加費用もかかりません。
読み込ませる請求書PDF
さすがに本物の請求書をQiitaで公開するわけにはいかないので、AIにサンプルを3つ作らせてみました。
それぞれ少しずつ異なるフォーマットで、請求金額も異なるようにしてみました。
このように差異があると、通常のOCRでは1つのフォーマット登録だけでは読み取れないはずです。
AIパンチャー側の設定
今回は以下のように支払い期日や請求日、発行者や各金額を読み込ませるように設定してみました。

それぞれの項目に異なるプロンプトを与えていることが分かると思います。
例えば、支払い期日では、フォーマットの指定、請求書に書かれている日付フォーマットの例の提示などでAIが解析しやすいように命令しています。
また、ファイル名ルールでアップロードしたファイルから抽出した発行者や請求日でファイル名を付け直すように設定してみました。
こちらはアップロードしたままのファイル名にすることもできるので必須ではありません。

ファイル解析の流れ(手動)
実際にファイルをアップロードしてみます。
まずは手でアップロードして解析させてみましょう。
1. プロジェクトとドキュメントタイプを選択
あらかじめ設定しておいたプロジェクトやドキュメントタイプを選択します

2. ファイルをアップロード
アップロードファイルを選択してアップロードをクリック

3. 解析が進行し、一覧に表示
ドラフトの項目にアップロードしたファイルが表示され、解析されていきます。

4. ファイル名が発行者名+請求日に変化
解析が完了すると、ドラフト項目からなくなり、請求書の一覧にアップロードしたファイルが出てきます。
この時点で、それぞれのファイル名が読み取ったファイルに記載されていた発行会社名と請求日に変わっています。

読み取り結果の確認
読み取った内容を確認してみます。
このようにそれぞれの項目がきちんと読み取れていることが分かります。
ここで、もし誤った内容になっている項目がある場合は個別に訂正することも可能です。
Excelとしてエクスポート
ファイルをエクスポートする場合、Excel形式でのダウンロードだけでなく、あらかじめ設定したフォーマットに沿った書類作成も可能です。

シート形式とすると、アップロードした複数ファイルの内容を網羅したExcelまたはCSVとしてダウンロードすることもできます。

Excelとしてエクスポートすると、このように、3ファイルから読み取った値がデータ化されています。
この状態になれば、社内システムへの転記もRPAであれば効率よく実施できるでしょう。

RPAでのアップロード&エクスポート
AIパンチャーはWebブラウザで操作できますので、BizRobo!の得意な分野です。
BizRobo!のアプリケーションに内蔵され、デスクトップ上でのブラウザ起動を要さず、端末を占有せずにバックグラウンド処理が可能なChromiumブラウザを用いてアップロードが可能です。
実施手順は先ほどの手で行ったのと同じなので割愛しますが、このように動作してくれます。
アップロード

ちょっと動画が分かりにくいのはご勘弁ください。
デモとして雰囲気が伝わりましたら幸いです。
あと、BizRobo!でのロボット実行はバックグラウンドでの処理なので通常はChromiumでの操作画面を見ることができません。
今回は以下オープン社の方が開発したモニタリングツール「daDashCam」を使わせていただき、録画したものを加工しています。
ParakeetOnTheHead氏にこの場を借りて謝意を表します。
該当記事:BizRobo!のデスクトップとヘッドレスブラウザのモニタリングツールを公開しました。
https://qiita.com/ParakeetOnTheHead/items/e0cb1b64784a7bb4321b
まとめ
今回は、AIパンチャーに3種類のサンプル請求書を読み込ませてみて、情報を取り出せるか試してみました。
支払い期日や請求日、発行者名などをプロンプトで指定することで、かなり精度の高い読み取りができました。
そして、読み取ったデータはExcelにまとめて出力可能なため、社内システムへの転記もスムーズに行えます。
また、BizRobo!と組み合わせれば、アップロードからエクスポートまでの作業も自動化できます。
非定型フォーマットにも対応できる柔軟性と、RPAによる自動化の組み合わせは様々な業務へ応用できると思いますので、今後お客様のお役に立てるのが楽しみです。






