20
24

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?

More than 5 years have passed since last update.

wgetでWebサイトのリンク切れをチェック

Posted at

wgetは --spider オプションをつけると、指定したURLのリンクの存在をチェックします。
そして --recursive オプションをつけると、URLのHTMLを解釈してリンクを再帰的に辿ります。
--spiderオプションと --recursive オプションを組み合わせることで、Webサイトのリンク切れをチェックできます。

例を次に示します。

wget \
  --spider \
  --recursive \
  --level=inf \
  --no-verbose \
  --execute robots=off \
  localhost:8000
  • --level=inf: --recursive オプションでたどる深さを上限なしに
  • --no-verbose: 出力を簡素に
  • --execute robots=off: robots.txt を取得しない

JavaScriptの実行などはしないため、動的に作られるリンクを調べることはできません。
しかしこのテクニックを使うと、CIなどで事前にリンク切れを検知することができます。
Jekyll、Middleman、MkDocsといったページジェネレータなどでその威力を発揮します。

20
24
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
20
24

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?