0
0

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?

Ciscoでpingが間欠ロスする時の切り分け|microburst・QoSドロップ・CPU高負荷

0
Posted at

はじめに

「pingが時々こけてる」と言われたとき、完全断線じゃなくて間欠ロスだとめちゃくちゃ厄介。100発中に1〜3発だけ落ちる、あの状況です。Ciscoスイッチで間欠ロスが出るときの主犯はだいたい次の3つに収束します。

  • microburst(TXキュードロップ)
    • QoSドロップ
    • CPU高負荷(Control-plane punt)

この記事ではそれぞれの切り分けコマンドをまとめます。

症状で原因の当たりをつける

症状 疑うべき原因
通過pingが間欠ロス microburst / QoS
スイッチ宛pingだけ落ちる CPU高負荷 / CoPPドロップ
CRC/input errorが増える 物理層・SFP・ケーブル
特定VLANだけ通信不安定 MAC Flapping / STP収束

スイッチ自体宛のpingだけ落ちるなら、ほぼCPU側です。通過パケットが落ちるならキュー or QoS。

Step 1: show interfacesでoutput drops

Switch# show interfaces GigabitEthernet1/0/24 | include drops|errors|rate
  5 minute output rate 875000 bits/sec, 1102 packets/sec
       0 input errors, 0 CRC, 0 frame, 0 overrun, 0 ignored
            Output queue: 0/40 (size/max)
                 Total output drops: 14523
                 ```

                 `Total output drops`が増え続けてたらmicroburstかキューサイズ不足。input errorsもCRCも0なら物理層は無罪です。

                 ## Step 2: ハードウェアキューを見る(Catalyst 9000系)

                 ```
                 Switch# show platform hardware fed switch active qos queue stats interface Gi1/0/24
                 DATA Port:24 Drop Counters
                  Q  Drop-TH0  Drop-TH1  Drop-TH2  SBufDrop  QebDrop
                   0  0         0         9824      0         0
                   ```

                   Drop-TH2が増えてたら、しきい値超過のドロップ。`show platform`系はCPU負荷を一時的に上げるので連続実行は注意。

                   ## Step 3: CPU使用率とプロセス

                   ```
                   Switch# show processes cpu sorted | exclude 0.00
                   CPU utilization for five seconds: 78%/45%; one minute: 62%; five minutes: 41%
                    PID Runtime(ms) Invoked   uSecs  5Sec   1Min   5Min  TTY Process
                     158  4521203    23415021   193  18.27  12.33   8.41   0  IP Input
                      312  3210551    14523011   220  11.05   9.21   6.55   0  ARP Input
                      ```

                      「78%/45%」の右側は割り込み(interrupt)。これが30%超えたら、ハードウェア転送できないパケットが大量にCPUに上がってる(punt状態)。

                      ## Step 4: QoSポリシー

                      ```
                      Switch# show policy-map interface Gi1/0/24
                         Class-map: class-default (match-any)
                              queue limit 272 packets
                                   (queue depth/total drops/no-buffer drops) 0/8721/0
                                   ```

                                   class-defaultのtotal dropsが伸びてたら、QoSが原因でICMPが落ちてる。pingはclass-defaultに分類されがちで、これが間欠ロスの原因になることが現場では結構ある。

                                   ## 対処の方向性

                                   - microburstなら:queue-limitを上げる、ポートチャネルで帯域追加、発生源にレートリミット
                                   - - QoSなら:ICMPだけ別クラスに切り出してbandwidth保証
                                   - - CPUなら:DAI / CoPP / SNMPやSyslogのレベル見直し

## SNMPの罠

SNMPの5分平均だけ見て安心しちゃダメ。10ms単位ではフルに張り付いてることがあります。NetFlow/Telemetryなど細かい粒度で見ないとmicroburstは見つからない。

## 詳しくはブログで

この記事の完全版(HTMLテーブル付きの切り分けフロー、ハードウェアキューの詳細解説、CoPP設定例、FAQなど)はブログで公開しています。

👉 [Ciscoでpingが間欠ロスする原因と切り分け|microburst・QoSドロップ・CPU高負荷【実機検証】](https://inunuit.com/2026/05/02/cisco-ping-intermittent-loss-microburst-qos-cpu/)
0
0
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
0
0

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?