LINX(https://www.linx.net/) が今年ホワイトボックススイッチによるIXサービスを開始しました。
おもしろいなーといろいろ調べてましたが手元においておくだけじゃもったいないのでメモを晒します。
すべて公開資料からの参照です。詳細は参照元リンクを掘ってみてください。
#NANOG74発表
- 知る限りでこれが一番くわしい
-
Features
- MAC ACL
- 多対1のVLANマッピング
- VLAN毎のトラヒックポリシー制御on単一ポート
- VLAN毎のARP・IPv6 ND
- MAC学習の無効化とMACの静的設定
- バッググランドトラヒック削減のためのProxyARP・ProxyND
- トラヒックタイプ毎のトラヒック制限
-
中央のコントローラーを置かない
- 自動化はすげえほしいのだけど、過剰なのはいらないんだよ
- コントロールプレーンベースの再収束はコントローラベースのより早いだろ
- うちのソフトウェアチームがフォーカスしているのは非ミッションクリティカルなインフラだからな!
-
EVPN-MPLS vs EVPN-VXLAN
- 多数のLSPエントリがインターフェーステーブルを消費するのは避けたい
- VXLANの収束はMPLSより遅いけど許容範囲
- MPLSのFast Rerouteが<50ms以下なのは魅力的
- VXLANなら再計算とASICの再プログラムが必要
-
Leafのみ構成 vs Leaf-Spine構成
- 前者はメトロ側スイッチ(拠点間Dark Fiber接続)と顧客収容SWを両方Leafとする構成
- 後者はLeafの間にSpine SWを入れる構成
- これを採用。収束がシンプルかつ早い
-
EVPN+Proxy-ARP
- MACテーブルをBGPで全エッジSWに広告する
- ARPリクエストのフラッドを削減→バックグラウンドトラヒックをへらせてgood
-
MAC hold-down
- ポートが落ちたらローカルMAC転送エントリを削除してBGPで広告する
- BGP収束前のトラヒックは/dev/null行き
- Unknownトラヒックのレートリミットを実装した
-
再収束の高速化
- BFDをASICで実行、最大でも4msで検出
#LINX のインタビュー
https://www.youtube.com/watch?v=QDtEK_PPcSM&feature=youtu.be
Richard Petrie
1.マーケット戦略、価格競争力
2.スケーリングのための新しいインフラが必要
-
EVPN採用の理由
- 旧来の技術では2つのSWがトラヒックをスヌーピングしていた
- EVPNはプログラマブル、SW同士が同期できるので予測可能である。
-
EdgecoreとIPIをパートナーに選んだ理由
- Edgecore、IPIの実績
- ビジョンの共有:disaggregation のマーケットポテンシャル
-
チャレンジ
- 設定の自動化プラットフォーム
#UKNOF41 プレゼン
- 3ms failuer detection
- リンクダウンをBFDで検知、迅速な再収束を行う。
- 導入までのフェーズ
- Demonstrator Phase(2016)
- Prototyping Phase(late2016-2017)
- 共同で仕様策定、繰り返し
- Hardening Phase(late2017-early2018)
- bug探し&修正
- Deployment Phase(early2018)
- hardning と平行して実施
- シミュレーションを実環境で実施して最終のバグ修正
- 4-5月に移行作業を実施
- 6月にフルオペレーション開始
- Enhancement Phase(late2018~)
- 自動化をいまも進めている
LINX公式情報
- EVPN over VXLAN, leaf-spine topology
- IP Infusion OcNOS
- Edgecore Networks hardware
#Wavesplitterさんの記事
- 使用SW
- Edgecore AS7712-32X:100GE x32
- Edgecore AS5812-54X: 10GE x48
#Access(IP Infusion)のプレスリリース
- Edgecore SWはBroadcom Tomahawk およびTrident II+