thomas270318
@thomas270318

Are you sure you want to delete the question?

If your question is resolved, you may close it.

Leaving a resolved question undeleted may help others!

We hope you find it useful!

ocr_fileにデータが入らない

解決したいこと

[Python] PDFをOCR処理して、テキスト埋め込みPDFを作成するの[実装例のソースコード]
を実公するとocr_fileにデータが入らない。
入る方法を教えてください。

発生している問題・エラー

エラーはありません

該当するソースコード

言語名
python

ソースコード

4.元のPDFにテキストオンリーPDFをオーバーレイ

    cmd = f'qpdf --overlay "{tmp_path}_txtonly.pdf" -- "{pdf_path}" "{ocr_file}"'
    returncode = subprocess.Popen(cmd, shell=True)
    returncode.wait()

自分で試したこと

bard,Bingなどで解決方法を調べた。

0

2Answer

[Python] PDFをOCR処理して、テキスト埋め込みPDFを作成するの[実装例のソースコード]を実公実行するとocr_fileにデータが入らない。

ここのコードだと思われますが、ocr_fileにデータが入らないとだけ言われても・・・

実行画面のスクショや、エラーが出るなど症状があれば、それのスクショとかを貼ってください。
(作者の@takafiさんにお聞きになるのが、一番早いかもしれません)

1Like

ocr_fileにデータが入らないというのは、
ocr_fileフォルダにテキスト埋め込みPDFが作成されない ということでしょうか。
(たとえば**.pdfを処理したときに、**_ocr.pdfが作成されていない)

起動時に外部ソフトウェアのインストールチェックをしているので、確認するなら以下の点だと思います。

  • tmp_fileフォルダに**.tif**_txtonly.pdfは作成されているか
  • コマンドプロンプトでqpdf --overlayを実行してみて作成できるか
1Like

Your answer might help someone💌