grep | awk | sort | uniq を全部つなげる理由

Posted at 2026-01-27

〜ログ集計で「なぜこの並び順なのか」を丁寧に解説します〜

はじめに

ログ集計のワンライナーで、次のようなコマンドを見たことはないでしょうか。

grep "ERROR" access.log | awk '{print $1}' | sort | uniq -c

正直なところ、最初は

と感じる方も多いと思います。
本記事では、なぜ grep | awk | sort | uniq をこの順番で全部つなげるのかを、IT初心者の方にも分かるように説明します。

まず、それぞれのコマンドの役割を簡単に整理します。

重要なのは、uniq は並んでいないと正しく動かないという点です。

ログファイルは、ほとんどが「今回欲しくない情報」です。
そのため、最初に grep で対象を絞ります。

grep "ERROR" access.log

これをしないまま後続処理をすると、

といった問題が起きます。
grep はフィルタの入口だと考えると分かりやすいです。

ログ1行には、時刻・IP・URL・ステータスコードなど、さまざまな情報が含まれています。
集計したいのは、その中の一部だけ、というケースがほとんどです。

awk '{print $1}'

ここで不要な情報を落としておかないと、

といったことが起こります。

uniq は名前の通り「重複をまとめる」コマンドですが、隣り合っている行しかまとめません。

例えば、次の入力があるとします。

A
B
A

このまま uniq を実行すると、結果はこうなります。

A
B
A

正しくまとめるためには、事前に並び替えが必要です。

sort | uniq

この sort を省略するのは、ログ集計で最もよくある失敗の一つです。

ここまでで、

が作られました。
その上で uniq -c を使うことで、初めて正しい件数が出ます。

uniq -c

grep | awk | sort | uniq は、

という処理の流れそのものです。

順番を変えたり、どれかを省略すると、

といったトラブルにつながります。

最初は「おまじない」に見えるパイプ処理ですが、
一つずつ役割を理解すると、ログ集計がかなり楽になります。