forestdoor95
@forestdoor95 (もりとぅ)

Are you sure you want to delete the question?

If your question is resolved, you may close it.

Leaving a resolved question undeleted may help others!

We hope you find it useful!

レシート(jpg/jpeg)から指定箇所の文字・数字を抽出したい

解決したいこと

レシート(jpg/jpeg)の必要な項目を抽出し、テキスト化したいです。

例)
商品をスキャンした際に発行されるレシートを写真(社用携帯)で撮って、
報告に必要な項目(指定箇所)をテキスト抽出し、Excelに転記できるようにしたいのですが、
レシートの指定箇所のテキスト化でつまずき、うまくいきません。

解決方法を教えて下さい。

発生している問題・エラー

添付レシートの「合計¥1,201」「お預かり¥10,201」「お釣 ¥9,000」の3行の項目抽出を考えています。
レシート課題>キャプチャ縦と横.PNG

しかし、メッセージウインドウは真っ白でした。
レシート質問>応答.PNG

自分で試したこと

①jpgから指定箇所を抽出できているか確認するために、シンプルなフローを作成しています。
レシート質問>フロー .PNG

②Power Automate for desktopから【OCRを使ってテキストを抽出】、「Tesseract」を用いて指定箇所をテキスト化するために「検索モード」は「特定のサブ領域のみ」を選択しました。
レシート質問用.PNG

③「X1」「X2」「Y1」「Y2」は添付のように記載しています。
レシート質問X軸とY軸.PNG

0

1Answer

YouTuberのいまにゅさんがOCRをまとめていますよ。

動画内ではGoogleのColabで実行していますが、ローカル環境でも簡単にOCRすることができるので動画を参考にしてぜひやってみてください。

https://github.com/tesseract-ocr/tessdoc
このリンクは公式のGithubリポジトリです。
この中にDownloadのリンクが貼ってあるのでそこからDLしてみてください。

0Like

Comments

  1. @forestdoor95

    Questioner

    回答ありがとうございます。
    動画を参考に試してみます!!!

Your answer might help someone💌