PDFリネームツール「PDF-renamer」のご紹介
PDFファイルをダウンロードした際、例えば、ファイル名が「講演001.pdf」や「資料_20251006.pdf」など、内容がわかりづらい名前になっていることがあります。
特に大量のPDFを扱う場合、後から目的のファイルを見つけるのが困難になることもあります。
そんな時に役立つのが、PDF-renamerというGroovy製のCLIツールです。このツールは、指定したディレクトリ内のPDFファイルを再帰的に検索し、各PDFのタイトルメタデータをもとにファイル名を自動で変更します。タイトルのプロパティがあった場合のみしか使えないですが、
主な機能
- 再帰的なディレクトリ探索:サブディレクトリも含めて全てのPDFファイルを処理します。
- PDFメタデータの抽出:PDFファイルのタイトルプロパティを読み取り、それをファイル名に反映します。
-
変更内容の確認・編集:
renamelist.csv
で変更内容を事前に確認・編集可能です。 - ファイル名のサニタイズ:Windowsで使用できない文字を自動的に置換します。
- 除外条件の設定:特定のパターンのファイルを処理から除外できます。
- UTF-8エンコーディング:出力ファイルはUTF-8で生成されます。
- 大量ファイルへの対応:大量のPDFファイルも効率的に処理できます。
- エラー耐性:壊れたファイルがあっても処理を継続します。
- 安全な3段階処理:ファイル名変更前に確認・実行・適用の3段階で処理を行い、安全性を確保しています。
インストール方法
-
GitHubリポジトリからソースコードをダウンロードします。
-
Groovyがインストールされていない場合、公式サイトからインストールします。
-
コマンドラインで以下のコマンドを実行し、ツールを起動します。
groovy renamePDFs.groovy /path/to/your/pdf/directory
操作の流れ
-
最初にツールを実行すると、指定したディレクトリ内のPDFファイルのリストを取得し、
renamelist.csv
というファイルを生成します。このリストには、ファイル名変更予定の詳細が記載されます。 -
renamelist.csv
を開き、変更内容に問題がないか確認・編集を行ってください。誤って変更してしまった場合に備え、元のファイル名も記録されていますので、安全にチェック・修正が可能です。 -
目視確認後、問題がなければ実際のファイル名変更作業に進みます。これにより、安全にファイル名を変更することができます。
注意点
-
PDFファイルにタイトルメタデータが含まれていない場合、ファイル名は変更されません。
-
ファイル名変更前に必ず
renamelist.csv
で内容を確認してください。 -
大量のファイルを処理する際は、バックアップを取ることをおすすめします。
まとめ
「PDF-renamer」は、講演資料や報告書などの、名前が機械的なものになりがちなPDFファイルを整理する際に非常に便利なツールです。ファイル名が内容を反映していないと、後から目的のファイルを探すのが大変ですが、このツールを使うことで、PDFのタイトルに基づいてファイル名を自動で変更し、整理整頓が容易になります。
GitHubリポジトリからダウンロードできます、
このツールはtikaのvibe coding で作りました。はじめてtikaで作ってみたのですが、specをどんどん量産して、期待値の上を狙ってくるので、ちょっと振り回されましたけど、tikaいいですね。