PDFフォームにデータを挿入したい。
以下の環境で試してきた。
- Java
- iText
- PowerShell
- iTextSharp
Pythonでできないかを探していた。
やっと見つけた。
How to Populate Fillable PDF's with Python
英語読めてPythonお得意なら上記のサイトを見てやるといいよ。
環境
僕の環境は下記の通り
多分、LinuxやmacOSの方が快適に動くと思う。
- Windows10 Pro x64
- Python 3.5.5
- pdfrw
pdfrwはPythonのLibrary
下記のようにpipを使ってインストールしておくといいでしょう。
# pdfrwをインストールしておく
C:\> python -m pip install pdfrw
サンプルコード
コードに書くとこんな感じです。
fillform.py
#! /usr/bin/python
import os
import pdfrw
INVOICE_TEMPLATE_PATH = 'pdfform.pdf'
INVOICE_OUTPUT_PATH = 'fillform.pdf'
ANNOT_KEY = '/Annots'
ANNOT_FIELD_KEY = '/T'
ANNOT_VAL_KEY='/V'
ANNOT_RECT_KEY = '/Rect'
SUBTYPE_KEY = '/Subtype'
WIDGET_SUBTYPE_kEY='/Widget'
def write_fillable_pdf(input_pdf_path,output_pdf_path,data_dict):
template_pdf=pdfrw.PdfReader(input_pdf_path)
annotations=template_pdf.pages[0][ANNOT_KEY]
for annotation in annotations:
if annotation[SUBTYPE_KEY]==WIDGET_SUBTYPE_kEY:
key=annotation[ANNOT_FIELD_KEY][1:-1]
if key in data_dict.keys():
annotation.update(
pdfrw.PdfDict(V='{}'.format(data_dict[key]))
)
pdfrw.PdfWriter().write(output_pdf_path,template_pdf)
data_dict={
'name':'齋藤さん',
'gender':'男'
}
if __name__ == '__main__':
write_fillable_pdf(INVOICE_TEMPLATE_PATH,INVOICE_OUTPUT_PATH,data_dict)
GitHubに上げておきました。
https://github.com/arachan/pdffillformpy
問題
僕の作ったPDFでは問題はない。
invoice_templateの方はTextBoxNameが邪魔してFormに挿入したデータが見えない。
印刷してもTextBoxの名前だけが印刷されてしまう。
PDFの仕様とpdfrwの問題なのだとは思うが、きっちり調査できてない。