#はじめに
外部からpdfを取ってきて、それを最終的に結合するところまで持っていきます。自分へのメモです。
#環境
Ubuntu 14.04 LTS
#wgetで持ってくる
##-r
URL名で指定したディレクトリ内のファイルを再帰的に取得しています。
##-np
そのディレクトリ以外のディレクトリは遡らないことを明示しています。
##--http-user=ユーザー名 --http-passwd=パスワード
basic認証が必要なサイトに対して適用します。
##--restrict-file-names=nocontrol
日本語文字化けを防ぐためにあります。ファイル名を変えずにwgetするように指定しています。restrict-file-namesというオプションがnocontrolという意味です。Qiitaで見るとfileと-namesが離れて見えてしまいますが繋げてください。
##結局
最終的にこのコマンドを打ちます。
wget URL名 -r -np --http-user=ユーザー名 --http-passwd=パスワード --restrict-file-names=nocontrol
例を挙げるとしたのようになります。
wget hoge.com -r -np --http-user=1234 --http-passwd=5678 --restrict-file-names=nocontrol
#wgetで持ってきたものを統合する
wgetしてきたファイルを結合していきます。(PDF)
##まずpdftkをインストール
sudo apt-get install pdftk
##pdftkコマンドを使う
pdftk *.pdf cat output tougou.pdf
これでtougou.pdfに全て統合されました。
###Error: Unexpected Exception in open_reader()
とか出てくる時あります。
この時はpdftkはやめて、pdfuniteを使いましょう。
pdfunite *.pdf tougou.pdf
#参考
あらくさな日々をつれづれと:UbuntuでのPDFの結合、分割の方法
Linux とかで PDF を結合とか n-up とかするコマンドたち