はじめに
az-305勉強中に「InfiniBand」という単語が出てきました。なにそれ知らない状態だったのでここに整理して投稿します。
公式ドキュメントをざっくり読む
RDMA 対応の HB シリーズおよび N シリーズ VM の通信は、低待機時間で高帯域幅の InfiniBand ネットワークを介して行われます。 そのような相互接続を介した RDMA 機能は、分散ノードの HPC および AI ワークロードのスケーラビリティとパフォーマンスを向上させるために重要です。 InfiniBand 対応の HB シリーズおよび N シリーズの VM は、最適で一貫した RDMA のパフォーマンスのための、小直径設計の非ブロッキング ファット ツリーで接続されます。
どうやらRDMA対応通信はInfiniBandネットワークを使うみたいですね。
前提となるVM
InfiniBandドライバーが含まれるVMはHPC VMもしくはRDMA対応VMに適切なドライバを使用して構成するようです。
下記ドキュメントの通りHかNシリーズが前提となっています。
100Gb/secとかそれ以上でるみたいです。
そもそもHPCって?
HPCとは
・ハイパー・パフォーマンス・コンピューティングの略
・従来のPCより性能がはるかに良いもの
AzureでいうHPCは?
・Hがつく仮想マシン(VM)のシリーズ
・RDMA(高スループットネットワークインターフェース)が使える
まとめ
タイトルを「有効化」に焦点をあてたものにしたので
有効化する際のまとめです。
・ Ubuntu-HPC VM ⇒すぐ使える
・ AlmaLinux-HPC VM⇒すぐ使える
・ SR-IOV 対応の HB シリーズVM(Linux)⇒ドライバ必要※
・ SR-IOV 対応の N シリーズの VM (Linux)⇒ドライバ必要※
※
PS:うーん。使うことあるのでしょうか(笑)