55
12

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?

「今日ネットワークめっちゃ重くない?」の真犯人は私だった話

Last updated at Posted at 2025-12-17

この記事は「本番環境などでやらかしちゃった人 Advent Calendar 2025」の18日目です。

1.はじめに

新人時代の話です。あるプロジェクトのキッティング環境で、1日ネットワークが重いという事件がありました。

炎上ではないけど、現場はざわざわ。

「今日ネットワークめっちゃ重くない?」

当時の私は、内心めちゃくちゃ焦っていました。

ネットワーク全体がとんでもなく重くて、他チームの作業も止まるレベル。
新人の私は、「何をどうすればいいのかわからない」状態…

今回は、新人時代の「苦いけど、今ならちょっと笑える」やらかし話を軽く振り返ります。

本記事は、技術的な詳細よりもネットワークが重いという事件当日の新人時代の失敗談と、そこから得た学びに焦点を当てています。

2.新人時代の私とオンプレ環境

当時の私は、オンプレの L2 / L3 スイッチを扱うプロジェクトにアサインされていました。
サーバ・ストレージ・ネットワークの3チーム構成で、私はネットワーク担当。

対象プロジェクトのネットワーク構成はざっくりこんな感じでした。

  • スイッチは3台(実際はもっと複雑だけどシンプル化)
    • うち2台はスタックで論理的に1台(以降、スタックスイッチ)として動作
    • 残り1台は単体スイッチで、スタックスイッチとリンクアグリゲーション(以降、LAG)で接続
  • 作業用 PC やサーバなどが各スイッチに接続され、チームごとにキッティング

001.png

構成図を見て「ふむふむ…なるほど」とは言うものの、ただ言ってるだけで、完全に理解できていませんでした笑

そこに、先輩からの質問。

「なんで今回この構成になる?」
「なんでその設定が必要?」
「仕組み的にどう動く?」
「環境全体への影響は?」

聞かれるたびに思考がパンク。
設定作業もほぼ写経。

そんな状態で迎えたキッティング作業が、この後のやらかしの布石になりました…

3.事件当日

その日の朝、私は L2 / L3 スイッチの設定をちょこちょこ触っていました。
すると、他チームから記事のタイトルの言葉が飛んできます。

「今日ネットワークめっちゃ重くない?」

その日は、先輩から「今日はキッティング環境だし、大した作業はないから一人で大丈夫」と言われ、ネットワーク担当で現場にいたのは私一人。
とりあえず状況を確認しようとしましたが、何が起きているのかまったく分からず…

最初は「たまたまちょっと重いだけ?」と思っていましたが、早々に悪化していきます。

  • ping が通らない
  • リモート画面が止まる
  • Web 画面の応答がない

気づけばプロジェクト全体の作業がストップ。
あちこちから言葉が飛んできますが、完全に思考がパンク。

結果、私が取った行動は…

椅子に座ってただボーッとするだけでした…

4.ネットワークの重さの原因

午後になり、頼れる先輩が現場に来てくれました。
軽く状況を聞いた上で実機を確認。来てそうそう、画像内の LAN ケーブルを抜くと…ネットワークの重さは一瞬で解決。

002.png

その後、即座に原因も特定してもらいました(かっこよかった…)。

ネットワークが重くなった直接の原因は、ブロードキャストストームです。
たとえば、こんなシナリオで発生します。

  • 1.スイッチ同士を複数の LAN ケーブルで接続している
    ↪この時点で、ネットワーク的には「ぐるっと一周できるループ構成」になっている
     
  • 2.その状態で、ARP などのブロードキャストフレームが流れる
    ↪ブロードキャストフレームは、受信ポート以外のすべてのポートに転送される
     
  • 3.ループ構成のため、ばらまかれたフレームが別ルートで元のスイッチに戻ってくる
    ↪スイッチはそれを新しいフレームだと思って、またすべてのポートにばらまく
     
  • 4.これが繰り返され、ブロードキャストフレームがどんどん増殖する
    ↪ネットワーク帯域やスイッチ・接続機器の処理能力がブロードキャストで埋まり、
    本来必要な通信パケットが処理しきれず捨てられてしまう
    ↪結果として、ネットワーク全体が重くなり、通信できなくなる(=ブロードキャストストーム)

ブロードキャストストームの詳しい説明を自分で書こうと思ったのですが、当時読んだ記事を見つけたのでご興味があればどうぞ。

で、なんでブロードキャストストームが起きたかというと…
真の原因(=真犯人)は、私の設定ミス。本来なら、画像内の対象ポートに LAG 設定が必要でした。

003.png

当日はスイッチの設定をちょこちょこ触っただけで、ケーブル配線は変えてません。
つまり、スタックスイッチと単体スイッチ間はもともと2本の LAN ケーブルで接続されてましたが、なぜかネットワーク全体は重くなってませんでした(え、なんで?ここまでの説明だと、重くなるんじゃ…?)。

原因を整理するとこんな感じです。

  • 1.作業前はスパニングツリー(以降、STP)が有効で、片方の LAN ケーブルがブロッキング済みだった
    ↪ この状態だとループは発生せず、ネットワークは安定する

004.png

  • 2.私は設計書通りに STP を無効化した

005.png

  • 3.無効化する場合は代替の LAG 設定が必要だったが設定し忘れていた

006.png

  • 4.その結果、ブロードキャストストームが発生した

LAG は、ループを防ぎつつ冗長化と帯域拡大ができる仕組みです。

ざっくり言うと、複数のケーブルをまとめて
「今回はスイッチから見ると LAN ケーブル1本」みたいに扱える技術です。
そのため、ケーブルが複数あってもループになりません
(=ブロードキャストストームが発生しません)。

  • 恩恵①:どれか1本が切れても、通信はそのまま(冗長化)
  • 恩恵②:複数本ぶん使えるので、通信帯域も広がる(帯域拡大)

こうやって整理すると「そりゃそうだろ」と思えますが、当時の私は完全にキャパオーバー。
先輩が来るまで、原因の全体把握ができませんでした。

結局、先輩に原因を特定してもらい、画像内のように LAG 設定を入れて、この日の作業は無事に終了…というわけです。

007.png

008.png

5.痛感したこと

この日のやらかしで強く感じたのは、技術力だけじゃ、チーム作業はうまく回らないってことです。
複数人で動くときは、頭の中を整理して言葉にする力がめちゃくちゃ大事だと痛感しました。

たとえば、

  • 直前に何をしたか整理できていない
  • 今どこで何が起きているか言えない
  • 影響範囲も自分で把握できていない

こういう状態だと、原因特定はどんどん遅れます。

今思い返すと、このときは「まず自分の頭を整理して言葉にする」段階にすら入れておらず、「相手が理解しやすい表現で伝える力=言語化能力」のある段階には程遠かったんだなと思います。

とはいいつつ、当時の私に今ツッコむなら、「そんな話より、キッティング環境とはいえ、まずはケーブル抜いてループ解消しよう!他チームの作業止めて迷惑かけてる…」って感じです。
まず動く・確認するだけでも、チーム全体の被害はかなり減ります。

新人の私は焦って固まり、ただ座ってボーッとするだけ。
先輩が来てくれたおかげで助かりましたが、一人だったら相当時間を無駄にしてたでしょうね…

ここで整理しているのは、事件後の私の動きについてです。
LAG 設定し忘れの原因やレビュー体制など、他にも痛感したことがたくさんありますが、今回は「ネットワークが重くなった事件後」から学んだことに焦点を当ています。

6.あの日から経験したもの

あの日は焦りと後悔でいっぱいでしたが、振り返ると今の私を作った大きな経験だったなと思います。
ざっくりまとめると、あの日から次の3つの「重要性」を学びました。

ちなみに今はハイブリッドクラウドが主な担当領域ですが、あの日の経験は今でも普通に役立っています。

①技術理解と全体把握の重要性

  • 小さな設定でも環境全体に影響が出ることを痛感
  • L2 / L3、STP、LAG など「使う技術の基礎の理解」は大切で、あの日から基礎学習を開始
  • 技術的な問題は、各技術の基礎があると全体を見渡しやすく、解決の糸口が見つかりやすい

今の「物事に対してまずは全体像を把握する」スタイルにつながるきっかけに!

ネットワークの基礎学習で実際に使った教材はこちら
「5-2.ネットワークを学ぶためのおすすめ教材」

②状況整理と伝え方の重要性

  • トラブル時は「直前の作業 → 発生した事象 → 影響範囲」をざっと並べるだけで思考がクリアに
  • 当時は気づいていなかったけど、頭の中が散らかっていると何も始まらない
  • チームで動くなら、頭の中を整理して言葉にする力がめちゃくちゃ大事

今の「物事を相手に伝わる形で説明する力(=言語化能力)」向上につながるきっかけに!

言語化能力を鍛えるときに実際に意識していることはこちら
「3.Qiita 投稿で得られた3つの価値(メリット)」

③自己理解と改善サイクルの重要性

  • 「焦る → パンク → 固まる → ボーッとする…」といった自分のクセを知っておくと対処法が見つかりやすい
  • 「発生した事象・原因整理 → 予防策 → 不足スキル強化 → 類似事象での活用」のサイクルを回すと理解が一気に深まる
  • 失敗はつらいけど、自分に合った改善をすると再発率がほんとに下がる

今の「自分の特性(性格)とうまく付き合いながら物事を進める」スタイルにつながるきっかけに!

7.おわりに

ネットワークが重くなったあの日は、正直つらくて、思い出すだけで胃がキリッとする経験でした。
でも、あのときの失敗があったからこそ、今の私があるんだと思います。

私の場合、技術は成功体験よりも、やらかしから学ぶことのほうが多かった気がします。

この記事が、同じように焦ってしまった誰かの「まぁ落ち着けばなんとかなるか」という気持ちにつながれば嬉しいです。

ここまで読んでいただき、ありがとうございました。

We Are Hiring!

55
12
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
55
12

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?