pdf-redactor を使って可能でした。
https://github.com/JoshData/pdf-redactor
Install
https://github.com/JoshData/pdf-redactor からZIPファイルをダウンロード
ライブラリをインストールする。
pip3 install -r requirements.txt
構文ファイルを書く
この例ではPDF ファイル中の 123456 を、ABCDEFに置換している。
hoge.py
import re
from datetime import datetime
import pdf_redactor
options = pdf_redactor.RedactorOptions()
options.content_filters = [
(
re.compile(u"123456"),
lambda m : "ABCDEF"
),
]
pdf_redactor.redactor(options)
動作させてみる
conv.bat
python hoge.py < input.pdf > output.pdf
諸問題
PDFはフォントを埋め込むため、ドキュメント中で使用されていない文字に置換しようとすると、文字が歯抜けになります。。