LoginSignup
0
2

More than 5 years have passed since last update.

wgetコマンドで外部からPDFを取り出してpdftkでPDFを結合しよう

Last updated at Posted at 2017-01-05

はじめに

外部からpdfを取ってきて、それを最終的に結合するところまで持っていきます。自分へのメモです。

環境

Ubuntu 14.04 LTS

wgetで持ってくる

-r

URL名で指定したディレクトリ内のファイルを再帰的に取得しています。

-np

そのディレクトリ以外のディレクトリは遡らないことを明示しています。

--http-user=ユーザー名 --http-passwd=パスワード

basic認証が必要なサイトに対して適用します。

--restrict-file-names=nocontrol

日本語文字化けを防ぐためにあります。ファイル名を変えずにwgetするように指定しています。restrict-file-namesというオプションがnocontrolという意味です。Qiitaで見るとfileと-namesが離れて見えてしまいますが繋げてください。

結局

最終的にこのコマンドを打ちます。
wget URL名 -r -np --http-user=ユーザー名 --http-passwd=パスワード --restrict-file-names=nocontrol
例を挙げるとしたのようになります。
wget hoge.com -r -np --http-user=1234 --http-passwd=5678 --restrict-file-names=nocontrol

wgetで持ってきたものを統合する

wgetしてきたファイルを結合していきます。(PDF)

まずpdftkをインストール

sudo apt-get install pdftk

pdftkコマンドを使う

pdftk *.pdf cat output tougou.pdf
これでtougou.pdfに全て統合されました。

Error: Unexpected Exception in open_reader()

とか出てくる時あります。
この時はpdftkはやめて、pdfuniteを使いましょう。
pdfunite *.pdf tougou.pdf

参考

あらくさな日々をつれづれと:UbuntuでのPDFの結合、分割の方法
Linux とかで PDF を結合とか n-up とかするコマンドたち

0
2
2

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
0
2