A | B | Diff |
---|---|---|
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
pdfdiff
というシェルスクリプトを作りました。入力したPDFの各ページを比較し、
- 追加した箇所を緑色
- 削除した箇所を赤色
- その他変更した箇所を黄色
で強調した画像を出力します。それぞれのピクセル数も出力するので、後続の処理でフィルタするとよいでしょう。
マスク画像で特定箇所の変更を無視することも可能です。
LaTeXなどを用いて執筆された、相互参照を多用する大規模な文書では、一部分を変更するだけで文書全体に影響が及ぶ可能性があります。変更箇所がどこか別の箇所から参照されている場合はもちろんのこと、たとえその部分自体に参照がなくても、文章の長さが変われば後続の段落やページ番号がずれ込み、結果的に索引や目次が変化することもあり得ます。LaTeXの典型的な組版フローでは、参照を正しく解決するために文書全体を複数回タイプセットします。このような仕組み上、文書の一部だけを切り出して最終的なレイアウトを反映させることは、原理的に困難といえます。一方、色校修正や増刷修正などのケースでは、修正前後の出力を比較し、差分を明らかにする必要があります。pdfdiff
は、そのような場面での利用を目的としたスクリプトです。
callas pdfToolboxの検版機能を拝見し、簡単なものであれば自作できるのではないかと感じて作ってみました。Adobe Acrobatにも比較機能はありますが、自動組版との相性を考えると、コマンドラインで利用しやすい形にまとめるのは有用だと考えています。当初は既存のツール、特にImageMagickのcompare
を活用すれば目的を達成できると考えていましたが、まさにこれといえる出力を得ることはできませんでした。
まだまだ改善の余地はあり、使いながら直していくつもりです。