More than 5 years have passed since last update.

grepでこういう時はどうする?

Last updated at 2019-01-24Posted at 2016-03-10

文字列を抽出するときも、抽出除外するときも便利なGREP、LinuxでCUI操作をするには無くてはならない存在です
ほとんど抽出にしか使いませんが、多少覚え書きがありましたので共有しておきます

よく使う使い方

grep 検索したい文字列 検索したいテキストファイル

コマンド | grep 検索したい文字列

grep -e 検索したい文字列1 -e 検索したい文字列2 検索したいテキストファイル

grep -i 検索したい文字列 検索したいテキストファイル

正規表現を使う

grep -E '正規表現' source.txt

# 利用できる正規表現

.                    改行文字以外の任意の1文字
*                    直前の1文字の0回以上の繰り返しに一致。直前の文字は正規表現でも構わない
^                    行の先頭
$                    行の末尾
[ ]                  かっこ内の任意の1文字に一致。ハイフン（-）で範囲指定もできる
[^ ]                 かっこ内の任意の1文字に不一致。ハイフン（-）で範囲指定もできる
\+                   直前の文字の1個以上の繰り返しに一致
\?                   直前の文字の0または1文字に一致
\{n\}                直前の文字のn個の繰り返しに一致
\{n,\}               直前の文字のn個以上の繰り返しに一致
\{,m\}               直前の文字のm個以下の繰り返しに一致
\{n,m\}              直前の文字のn個以上，m個以下の繰り返しに一致
pattern1\|pattern2   pattern1またはpattern2のいずれかに一致
\(pattern\)          patternをグループ化する。マッチした内容は\numで参照できる
\                    正規表現に使われる記号を普通の文字として扱う

例
grep '\[0-9]' source.txt                           # '[0-9]'の文字列を検索
grep -E '(\[0-9]){2}' source.txt                   # '[0-9]'が2回続く文字列を検索
grep '[Ll]inux' source.txt                         # 「Linux」または「linux」が含む行を検索する
grep '\<[Ll]inux\>' source.txt                     #  独立した「Linux」または「linux」が含む行を検索する、RedhatLinuxとかは含まない
grep '[1-9][0-9][0-9][A-Z][0-9]' source.txt        # 先頭に0を含まず123A7のようなパターンに一致
grep '^[0-9]' source.txt                           # 数字を含まない行を検索する
grep '.....' source.txt                            # 5文字以上の行だけ探す
grep '\<W...s\>$' source.txt                       # 先頭がW、末尾がsの文字列を探す
grep '.' source.txt                                # 空行を除外
grep '^\<EX\>\{1,3\}' source.txt                   # EXという文字が1～3回出る行
grep '\<[A-Z]\{\6,15\}\>' source.txt               # 大文字アルファベットが6～15文字含む行
grep '\<[A-Za-z]\{\6,15\}\>' source.txt            # 大文字小文字アルファベットが6～15文字含む行
grep '\<[^0-9A-Za-z]\{\6,15\}\>' source.txt        # 大文字小文字アルファベットと数字以外の文字が6～15文字含む行
grep '[0-9]\{3\}-[0-9]\{3\}-[0-9]\{4\}' source.txt # 電話番号000-000-0000を含む行

フォルダ内のファイルを再帰的に指定し"パターン"を見つけたら行番号をつけて表示

grep -rn 'パターン' *

アクセスログをリアルタイムに表示する

tail -f access_log | grep --line-buffered 'パターン'

if文の条件にする

if grep 'パターン' "ファイル" >/dev/null; then
    echo "パターンが含まれています"
else
    echo "パターンが含まれていません"
fi

標準入力から見つける場合は

if echo "$STR" | grep 'パターン' >/dev/null; then
    echo "パターンが含まれています"
else
    echo "パターンが含まれていません"
fi

-マッチした行の前後数行を表示する

# 関連オプション
-B, --before-context=NUM  一致した前の NUM 行を表示する
-A, --after-context=NUM   一致した後の NUM 行を表示する
-C, --context=NUM         一致した前後 NUM 行を表示する

# マッチした行とその前5行、後ろ3行を表示
grep -A3 -B5 banana thing.txt

複数のパターンで検索する

grep -E 'パターン1|パターン2' source.txt

大文字小文字区別せずに検索する

grep -i 'パターン' source.txt

行頭または行末に限定してパターンを検索する

# 行頭に#がついている行だけ
grep '^#' source.txt
cat /etc/my.cnf | grep '^#' 

# 行末にlogがついている行だけ
grep 'log$' source.txt
cat /etc/my.cnf | grep 'log$'

ハイライトをつける

grep --color=always 'パターン' source.txt

パターンを除外して表示

grep -v 'パターン' source.txt

# たとえばps auxをした際
ps aux | grep java
# とすると"grep java"自体もヒットしてしまうが
ps aux | grep java | grep -v grep
# とすれば、grep自体は引っ掛からない

パータンの出現行数を数える

grep -c 'パターン' source.txt

独立パターンだけ抽出

grep -w 'パターン' source.txt

# たとえば
grep -w 'if' source.txt
# とやると、elseifやendif、iftopなどifを含むものは引っ掛からず、" if "と独立しているモノだけ引っ掛かる

615

592

You get articles that match your needs
You can efficiently read back useful information
You can use dark theme

What you can do with signing up

Why not login to Qiita and try out its useful features?

grepでこういう時はどうする?

Qiita Conference 2025 will be held!: 4/23(wed) - 4/25(Fri)