■CoPP(コントロール プレーン ポリシング)にまつわるトラブル
センター機器のCatalystスイッチをリプレース後、拠点間の通信が遅くなったというクレームが入った。拠点のルーターにログインして他の拠点にpingを1000発ほど打つと、たしかにパラパラとパケットロスが発生する。
ネットワークは以下のような構成で、リプレースしたのは中央上部のCatalyst2台(VSS構成)、1系と2系で別回線に接続されている。
ちなみに各拠点のデフォルトルートは中央のCatalystに向いていて、一旦Catalystを経由して通信している。
試験を重ねていくと、siteAからsiteB、siteXからsiteYへの通信ではパケットロスが発生するが、siteAからX・Y、siteXからA・Bへの通信ではパケットロスが発生しない。すなわち、Catalystの同一インターフェースを折り返す通信のみでパケットロスが発生していることがわかった。
ネットで調べると、Cisco機器の一部シリーズでは、同一インターフェースを折り返すL3通信が発生した場合にCPU処理が行われるため、新しいIOSではCPU保護のためCoPPなるものにより流量が制限されていることがわかった。
class class-copp-icmp-redirect-unreachable
police rate 100 pps burst 10 packets
conform-action transmit
exceed-action drop
police rateの値を、CPU使用率を見ながら少しづつ上げていき、最終的に20倍程度まで変更することでパケットロスは発生しなくなり、事象は収まった。
class class-copp-icmp-redirect-unreachable
police rate 2000 pps burst 200 packets