PythonでPDFをExcelに変換したときのメモです。いろいろモジュールが出てる中でspire.pdfは品質よくシンプルなコード実装だったのでお気に入りです。
from spire.pdf import *
# PdfDocumentのインスタンスを作成
pdf = PdfDocument()
# PDFドキュメントをロード
pdf.LoadFromFile("input.pdf")
# XlsxLineLayoutOptionsのインスタンスを作成
options = XlsxLineLayoutOptions(True, False, False, True)
# 変換オプションを適用
pdf.ConvertOptions.SetPdfToXlsxOptions(options)
# PDFドキュメントをXLSXファイルに変換
pdf.SaveToFile("output.xlsx", FileFormat.XLSX)
# リソースを解放
pdf.Close()