状態がおかしくなった Linux マシンをさくっと再起動する方法

  • 7
    いいね
  • 0
    コメント
この記事は最終更新日から1年以上が経過しています。

kernel panic まではいかないけど、私物の遠隔地にある Linux 物理マシンが原因不明の理由で反応がものすごい遅くなり、おかしくなったことがありました。
業務のサーバであれば、データセンタにリセットを依頼する、仮想サーバの管理画面からリセットボタンをポチるなど一定のフローがあると思います。

今回は、一刻も復旧させたかったので、shutdown コマンドではなく、カーネルの magic SysRq key を使うことにしました。

# kernel panic が起きたら1秒後に自動リセットする
echo 1 > /proc/sys/kernel/panic

# 意図的に kernel panic を起こす
echo c > /proc/sysrq-trigger

sysrq-trigger で使えるコマンドは、カーネルソースの linux-4.3.3/Documentation/sysrq.txt に色々載っています。

'c'     - Will perform a system crash by a NULL pointer dereference.
          A crashdump will be taken if configured.

サーバがどうしようもない状況になったときのために、一度読んでおくと捗りそうですね。