webページをまるごと保存したい
HTML制作業者(って言うの?)に運用中の既存ページを修正してもらう場合、いわゆる最新版を渡さないといけないシーンが存在する(少なくとも私には)。
jspとかphpとかのままだと渡せないのでhtmlに保存してから渡すのですが、業者からしてみればhtmlだけ渡されても困ったもので、参照しているすべてのファイルが欲しいと言われるのが関の山。
そもそもやり方が古いとか、そーゆーツッコミは無しでお願いします。数年前にカットオーバーしたサイトのメンテナンスだと、仕組み自体が変えられないのである程度レガシーなやり方になるんです。(開き直り)
全体の流れ
前置きはそれくらいにして、以下の流れで実現できました。
wget
で実現するのですがMacのターミナルでは wget
が使えないのでインストールします。
wget
をインストールするために homebrew
もインストールします。
- homebrewをインストール
- wgetをインストール
- wgetでwebページをまるごと保存
1. homebrewをインストール
ruby -e "$(curl -fsSL https://raw.githubusercontent.com/Homebrew/install/master/install)"
わりと時間がかかります。パスワードも聞かれます。
2. wgetをインストール
brew install wget
シンプル!!
3. wgetでwebページをまるごと保存
mkdir work-dir
cd work-dir
wget -p -H -E -nH -k https://www.google.com
ディレクトリを変えないと「わーっ!」ってファイルが出来てしまうので
ワークのディレクトリを作成して移動しておきます。
あとは wget
を指定のパラメタで動かすだけ。
作成するディレクトリ名と取得対象のURLは自分の好きに書き換えてください。