0
2

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?

More than 5 years have passed since last update.

wgetコマンドで外部からPDFを取り出してpdftkでPDFを結合しよう

Last updated at Posted at 2017-01-05

#はじめに
外部からpdfを取ってきて、それを最終的に結合するところまで持っていきます。自分へのメモです。
#環境
Ubuntu 14.04 LTS
#wgetで持ってくる
##-r
URL名で指定したディレクトリ内のファイルを再帰的に取得しています。
##-np
そのディレクトリ以外のディレクトリは遡らないことを明示しています。
##--http-user=ユーザー名 --http-passwd=パスワード
basic認証が必要なサイトに対して適用します。
##--restrict-file-names=nocontrol
日本語文字化けを防ぐためにあります。ファイル名を変えずにwgetするように指定しています。restrict-file-namesというオプションがnocontrolという意味です。Qiitaで見るとfileと-namesが離れて見えてしまいますが繋げてください。
##結局
最終的にこのコマンドを打ちます。
wget URL名 -r -np --http-user=ユーザー名 --http-passwd=パスワード --restrict-file-names=nocontrol
例を挙げるとしたのようになります。
wget hoge.com -r -np --http-user=1234 --http-passwd=5678 --restrict-file-names=nocontrol

#wgetで持ってきたものを統合する
wgetしてきたファイルを結合していきます。(PDF)
##まずpdftkをインストール
sudo apt-get install pdftk
##pdftkコマンドを使う
pdftk *.pdf cat output tougou.pdf
これでtougou.pdfに全て統合されました。
###Error: Unexpected Exception in open_reader()
とか出てくる時あります。
この時はpdftkはやめて、pdfuniteを使いましょう。
pdfunite *.pdf tougou.pdf
#参考
あらくさな日々をつれづれと:UbuntuでのPDFの結合、分割の方法
Linux とかで PDF を結合とか n-up とかするコマンドたち

0
2
2

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
0
2

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?