皆様のやらかし記事を見て力をもらいましたので、微力ながら私も投稿します。
何年か前の記事となり、現在の仕様と異なる可能性がありますのでご了承ください。
・構成
冗長化されたSRXを中心に「内部」「旧外部」「新外部」「Gr会社内部」の4つに
ゾーン分割しているが、「旧外部」は未使用となった。
・作業内容
未使用となった「旧外部」接続向けのインタフェースを削除する。
rethインタフェースの使用数が減るため、reth-countの数も減らす。
・本番作業
事前に検証した通り、コンフィグを順調に削除し作業完了。ところがGr会社様より
インターネット向け通信ができなくなったと連絡があった。
「新外部」「Gr会社内部」のコンフィグは変更していないので、別の事象も疑ったが
他の作業もなく、どう考えても当該SRXが怪しいため削除したコンフィグのうち
retch-countを元に戻した〈reth-count 3 -> reth-count 4)ところ通信が復旧した。
後日サポートに問い合わせたところ以下のような仕様とのこと
reth-count 4だと以下が使用可能
reth0, reth1, reth2, reth3
reth-count 3にすると以下が使用可能
reth0, reth1, reth2
rethインタフェースは若番から順に使用可能になるため、
今回reth-count 4 -> reth-count 3に変更したことで
reth3(Gr会社内部)が使用不可となった。
・その「やらかし」はなぜおきてしまったのか
事前の検証ではコンフィグチェックしか行っておらず、show log messagesの確認を
行っていなかった。(本当は動作確認までできればよかった)
# ログの詳細は忘れたがreth-count変更による注意喚起のようなエラーが出ていたはず
・その「やらかし」を起こさないために次どうすればいか
①検証時にshow log messagesを確認してコンフィグ編集後に意図しないエラーが発生していないかチェックする。
②可能な限り実機にて動作確認を行う。