WinMerge (日本語版)、便利ですよね。(最近もっぱらVSCodeのcompare機能使ってるけど…)
で、最近仕事で「Tera Termの作業ログをdiffしたいけど、行の頭にタイムスタンプついてるから単純比較できない」と小耳に挟んだのですが、うーん、、まぁなんか適当なフィルタスクリプトかまして削ればいいのでは…とは思ったけど、割とプラグインが充実してるWinMerge単体でそんなフィルタ機能あるんじゃないかなと思い、探してみた。
ら、まさにそういうことを解決するプラグインが標準装備してた。
急いでる人向け
WinMerge(2.14.0-jp-152以降)のPrediffLineFilterフィルタプラグインに正規表現で比較処理前のフィルタ書ける。
例題
Tera Termのこのログ
の、「タイムスタンプ」にチェックしてログ出力設定して
こういう操作を行うと
こんなログファイルが出力されます。
[2019-11-21 21:52:54.434] pwd
[2019-11-21 21:52:55.020] /home/zaki
[2019-11-21 21:52:55.020] [zaki@manager ~]$ id
[2019-11-21 21:52:56.263] uid=1000(zaki) gid=1000(zaki) groups=1000(zaki),10(wheel) context=unconfined_u:unconfined_r:unconfined_t:s0-s0:c0.c1023
[2019-11-21 21:52:56.264] [zaki@manager ~]$ date
[2019-11-21 21:52:58.086] 2019年 11月 22日 金曜日 01:40:43 JST
[2019-11-21 21:52:58.088] [zaki@manager ~]$ hostname
[2019-11-21 21:53:05.237] manager.local.jp-z.jp
[2019-11-21 21:53:05.237] [zaki@manager ~]$
比較用に、全く同じ操作をして出力したログを用意します。
[2019-11-21 21:54:48.081] pwd
[2019-11-21 21:54:49.171] /home/zaki
[2019-11-21 21:54:49.171] [zaki@manager ~]$ id
[2019-11-21 21:54:50.404] uid=1000(zaki) gid=1000(zaki) groups=1000(zaki),10(wheel) context=unconfined_u:unconfined_r:unconfined_t:s0-s0:c0.c1023
[2019-11-21 21:54:50.404] [zaki@manager ~]$ date
[2019-11-21 21:54:51.270] 2019年 11月 22日 金曜日 01:42:27 JST
[2019-11-21 21:54:51.270] [zaki@manager ~]$ hostname
[2019-11-21 21:54:52.995] manager.local.jp-z.jp
[2019-11-21 21:54:52.995] [zaki@manager ~]$
これで二つのファイルは
- 実行するコマンドは同じ
- コマンドの結果は
pwd,id,hostnameは同じ -
dateの実行結果は異なる - 行頭のタイムスタンプは異なる
という状態
WinMergeで比較
当然ながら行頭のタイムスタンプが異なるので、全行差分アリとなります。
やりたいことは、この行頭のタイムスタンプ部分を無視して差分をチェックすること。
このサンプルログでいうと、dateの実行結果が違うことを確認したい。
PrediffLineFilterフィルタ
そこで使用するのが PrediffLineFilter プラグイン。
※ PrediffLineFilterプラグインは 2.14.0-jp-152 で追加されてるので、古いWinMerge使ってる人はアップデートしましょう。
初期状態ではフィルタ設定は何も登録されてるので何も変化しません。
PrediffLineFilterフィルタ設定
「プラグインの設定」から。
「PrediffLineFilter.sct」を選択して「プラグインの設定(L)」
すると、ファイルのdiffを行う前に正規表現を使って文字列処理を行う設定画面が表示される。
もうおわかりですね。
ここに「行頭のタイムスタンプを削除する正規表現」を入れておけば、タイムスタンプ部分を無視して差分チェックができるようになります。
サンプルなので雑に「先頭(^)の[から、最初の]までを消去」するように、以下のように設定。
| 設定 | 入力 |
|---|---|
| 大文字小文字の違い | |
| 正規表現を使用 | ✓ |
| 検索文字列 | ^\[.*?\] |
| 置換後の文字列 | (空白) |
こんな感じ
これで[OK]して、プラグイン設定のダイアログも[OK]で抜けて、メイン画面の[プラグイン]->[比較前処理プラグイン]->[PrediffLineFilter.sct]にチェックが入った状態にします。
すると、こんな風に、フィルタに設定した行頭のタイムスタンプ部分を無視(薄い色はついてるけど)して差分チェックが行われます。
簡単正規表現の説明
^\[.*?\] を簡単に説明すると以下の通り
-
^: 行頭を表すメタ文字 -
\[: "["文字そのもの。[は正規表現の範囲指定のメタ文字(開始)なので、エスケープしてる -
.: 任意の一文字 -
*: 直前の文字(ここで言うと↑の任意の一文字)の0回以上繰り返し -
?: 最短一致。 ↑の.*で任意の文字の繰り返しはデフォルトは最長一致で最も長くマッチしようとするので、↓の]が出てくるまで全部マッチしようとするので、プロンプトの[username@hostname dir]の終端の]までマッチ してしまう。そこで、.*?とすることで、最初の]までしかマッチしないようにする- ちなみにこれは、
*や+などの「繰り返し」に付加されるオプション -
?単体で出現した場合は、?の左の文字が「0文字か1文字か(有るか無いか)」を表す。zaki?であれば、zakかzakiにマッチ
- ちなみにこれは、
-
\]: "]"文字そのもの。]は(中略)エスケープしてる
正規表現まとめもいちど書いておきたいな。。布教用に。
いま気付いたけど、このmanagerってサーバ、時計めっちゃズレてるな…
ちなみにみんなTera Termログって使ってます?
個人的にはscriptコマンドで育ったので、scriptプラスPS1に時刻表示でもいいのではーとか思ってたりしますが。
「ネットワーク機器などで、ログを取得する環境が(scriptとかが使える)LinuxなOSとは限らない」とのコメントを頂きました。確かに……











