背景・目的
AWS Certified Advanced Networking - Specialtyの学習の過程で、プレイスメントグループという概念が登場したのであらためて整理してみたいと思います。
まとめ
NWのパフォーマンスを向上させるには、下記の方法があります。
- プレイスメントグループ
- 拡張ネットワーキング
- Elastic Fabrick Adapter(EFA)
- プレイスメントグループは下記の特徴があります。
特徴 | 説明 |
---|---|
概要 | 相互に依存するEC2インスタンスのグループをプレイスメントグループ内に作成することで、パフォーマンスを向上させることができる。 |
プレイスメント戦略 | ・クラスタ ・パーティション ・スプレッド |
料金 | プレイスメントグループ単体で発生しない |
プレイスメントグループの戦略ごとの特徴は下記のとおりです。
戦略 | 特徴 | 用途 | アベイラビリティゾーン(AZ) | ラック |
---|---|---|---|---|
クラスタ | 同一の低遅延ネットワーク上にインスタンスを配置。ネットワーク遅延最小化と高いスループットを提供。 | 高性能計算(HPC)、大規模データベース、リアルタイムビッグデータ処理。 | 同一AZ内 | 同一ラックまたは近接ラック |
パーティション | インスタンスを複数のパーティションに分割し配置。大規模な分散アプリケーションに適している。 | 大規模な分散システム | 同一AZ内 | 異なるラックに分割 |
スプレッド | インスタンスを物理的に分散配置。単一のハードウェア障害が複数のインスタンスに影響を与えるリスクを低減。 | 各インスタンスの障害分離が重要なアプリケーション | 同一または複数のAZ | 異なるラックに分割 |
概要
Amazon EC2におけるネットワークをもとに整理します。
ネットワークのパフォーマンスを向上させ、レイテンシーを低減するために、プレイスメントグループ内でインスタンスを起動できます。拡張ネットワーキングを使用すると、1 秒あたりのパケット (PPS) のパフォーマンスが大幅に向上します。Elastic Fabric Adapter (EFA) を使用すると、ハイパフォーマンスコンピューティングおよび機械学習アプリケーションを高速化できます。EFA は、サポートされているインスタンスタイプにアタッチできるネットワークデバイスです。
NWのパフォーマンスを向上させるには、下記の方法がある
- プレイスメントグループ
- 拡張ネットワーキング
- Elastic Fabrick Adapter(EFA)
プレイスメントグループ
プレイスメントグループを元に整理します。
ワークロードのニーズを対応するために、相互に依存する EC2 インスタンスのグループをプレイスメントグループ内に作成して、そのプレイスメントに影響を与えることができます。
ワークロードのタイプに応じて、以下のいずれかのプレイスメント戦略によりプレイスメントグループを作成できます。
- [クラスター] – アベイラビリティーゾーン内でインスタンスをまとめます。この戦略により、ワークロードは、ハイパフォーマンスコンピューティング (HPC) アプリケーションで典型的な緊密に組み合わされたノード間通信に必要な低レイテンシーネットワークパフォーマンスを実現できます。
- パーティション – インスタンスを複数の論理パーティションに分散させ、1 つのパーティション内のインスタンスのグループが基盤となるハードウェアを別のパーティション内のインスタンスのグループと共有しないようにします。この戦略は、Hadoop、Cassandra、Kafka などの大規模な分散および複製ワークロードで一般的に使用されます。
- スプレッド 相関性のエラーを減らすために、少数のインスタンスを基盤となるハードウェア全体に厳密に配置します。
- 相互に依存するEC2インスタンスのグループをプレイスメントグループ内に作成することで、パフォーマンスを向上させることができる。
- プレイスメント戦略には、下記のものがある
- クラスタ
- パーティション
- スプレッド
プレイスメントグループは任意で選択します。インスタンスをリプレイスメントグループに作成しない場合、EC2 は、関連する障害を最小限に抑えるために、すべてのインスタンスが基盤となるハードウェア全体に分散されるような方法でインスタンスを配置しようとします。
- デフォルトではEC2は関連する障害を最小限に抑えるように配置する
プレイスメントグループを作成するための料金は発生しません。
- プレイスメントグループに料金は発生しない
プレイスメントグループの戦略
クラスタープレイスメントグループ
クラスタープレイスメントグループは、単一のアベイラビリティーゾーン内のインスタンスを論理的にグループ化したものです。クラスタープレイスメントグループは、同じリージョン内の複数のピア接続 VPC にまたがることができます。同じクラスタープレイスメントグループ内のインスタンスは、TCP/IP トラフィックのフローあたりのスループット上限が高くなり、ネットワークの二分帯域幅の広い同じセグメントに配置されます。
- 単一AZのインスタンスを論理的にグルーピングしたもの
- 同じリージョン内の複数のVPC (Peering)にまたがることができる
- スループット上限が高くなる
低いネットワークレイテンシー、高いネットワークスループット、またはその両方からメリットを受けるアプリケーションの場合は、クラスタープレイスメントグループの使用をお勧めします。また、ネットワークトラフィックの大部分がグループ内のインスタンス間で発生している場合にもお勧めします。プレイスメントグループで、最も低いレイテンシーと最も高いネットワークパフォーマンス (1 秒あたりパケット数) を実現するためには、拡張ネットワーキングをサポートするインスタンスタイプを選択します。詳細については、「拡張ネットワーキング」を参照してください。
インスタンスは、次の方法で起動することをお勧めします。
- プレイスメントグループ内で必要な数のインスタンスを起動するには、1 つの起動リクエストを使用します。
- プレイスメントグループ内のすべてのインスタンスに同じインスタンスタイプを使用します。
後でプレイスメントグループにさらにインスタンスを追加しようとした場合、またはプレイスメントグループ内で複数のインスタンスタイプを起動しようとした場合、容量不足エラーが発生する可能性が高くなります。
プレイスメントグループ内のインスタンスを停止して再起動しても、そのインスタンスは同じプレイスメントグループ内で実行されます。ただし、インスタンスに対して十分な容量がない場合、起動は失敗します。
既にインスタンスを実行中のプレイスメントグループ内のインスタンスを起動するときに容量エラーを受け取った場合は、プレイスメントグループ内のすべてのインスタンスを停止して開始し、もう一度起動を試みてください。インスタンスを起動すると、すべてのリクエストしたインスタンスに応じた容量があるハードウェアにインスタンスが移行される場合があります。
パーティションプレイスメントグループ
パーティションプレイスメントグループは、アプリケーションに関連するハードウェア障害の頻度を軽減するために役立ちます。パーティションプレイスメントグループを使用する場合、Amazon EC2 は各グループをパーティションと呼ばれる論理的なセグメントに分割します。Amazon EC2 では、プレイスメントグループ内の各パーティションにそれぞれ一連のラックがあります。各ラックには独自のネットワークおよび電源があります。プレイスメントグループ内のパーティションどうしが同じラックを共有することはありません。これにより、アプリケーション内でのハードウェア障害による影響を隔離できます。
- アプリケーションに関連するHW障害の頻度を軽減するのに効果的
- 各グループをパーティションと呼ばれる論理的なセグメントに分割する
- プレイスメントグループ内の各パーティションにそれぞれ一連のラックがある
- ラックには独自のNWと電源がある(通常のデータセンターのラックと同じ)
- プレイスメントグループ内のパーティション同士が同じラックを共有しない
- HW障害による影響を隔離する
次のイメージは、単一のアベイラビリティーゾーン内のパーティションプレイスメントグループのシンプルな描写を示しています。ここでは、3 つのパーティション (パーティション 1、パーティション 2、パーティション 3) があるパーティションプレイスメントグループに配置されたインスタンスを示しています。各パーティションは複数のインスタンスで構成されています。各パーティション内のインスタンスは、他のパーティション内のラックを共有しないため、単一のハードウェア障害の影響は関連付けられたパーティションのみに留まります。
- パーティションとラックが同じ?
パーティションプレイスメントグループは、HDFS、HBase、Cassandra などの大規模な分散および複製ワークロードを異なるラック間でデプロイするために使用できます。インスタンスをパーティションプレイスメントグループに起動すると、Amazon EC2 は、指定したパーティション数全体にインスタンスを均等に分散しようとします。インスタンスを特定のパーティションに起動して、インスタンスの配置場所をより細かく制御することもできます。
- 大規模分散ワークロードを異なるラック間でデプロイするために使用できる。
- HadoopやHBaseなど
- インスタンスを起動すると、EC2は指定したパーティション数全体にインスタンスを均等に分散しようとする。
パーティションプレイスメントグループは、同じリージョン内の複数のアベイラビリティーゾーンにパーティションを持つことができます。パーティションプレイスメントグループは、アベイラビリティーゾーンごとに最大 7 つのパーティションを持つことができます。パーティションプレイスメントグループで起動できるインスタンス数の制限は、アカウントの制限のみです。
- 同一リージョン内の複数AZにパーティションを持つことができる。
- AZごとに最大7つのパーティションを持つことができる
- パーティションプレイスメントグループで起動できるインスタンス数の制限はアカウントの制限のみ
また、パーティションプレイスメントグループでは各パーティションが可視化されるため、どのインスタンスがどのパーティションにあるかを確認できます。この情報は、HDFS、HBase、Cassandra などトポロジー対応アプリケーションと共有できます。これらのアプリケーションはこの情報を利用してインテリジェントなデータレプリケーションの決定を行い、データの可用性と耐久性を向上します。
- パーティションプレイスメントグループでは各パーティションが可視化される
- どのインスタンスがどのパーティションにあるかを確認できる
- データの可用性と耐久性を向上する
パーティションプレイスメントグループでインスタンスを開始または起動し、リクエストを実行するための固有のハードウェアが不足している場合、そのリクエストは失敗します。Amazon EC2 では、時間の経過とともに、より明確なハードウェアを利用できるようになるため、後でリクエストを再試行できます。
- 起動時に固有のHWが不足している場合、リクエストは失敗することがある
スプレッドプレイスメントグループ
スプレッドプレイスメントグループは、それぞれ異なるハードウェアに配置されるインスタンスのグループです。
- 異なるHWに配置されるインスタンスのグループ
スプレッドプレイスメントグループは、少数の重要なインスタンスが互いに分離して保持される必要があるアプリケーションに推奨されます。スプレッドレベルのプレイスメントグループでインスタンスを起動すると、インスタンスが同じ機器を共有するときに発生し得る同時障害のリスクが軽減されます。スプレッドレベルのプレイスメントグループは、異なるハードウェアへのアクセスを提供するため、長時間のインスタンスタイプの混合やインスタンスの起動に適しています。
- インスタンスが同じ機器を共有するときに発生しうる同時障害リスクが軽減される
- 異なるHW障害へのアクセスを提供する
- 長時間のインスタンスタイプの混合、インスタンスの起動に適している。
スプレッドプレイスメントグループでインスタンスを開始または起動し、リクエストを実行するための固有のハードウェアが不足している場合、そのリクエストは失敗します。Amazon EC2 では、時間の経過とともに、より明確なハードウェアを利用できるようになるため、後でリクエストを再試行できます。プレイスメントグループは、ラックまたはホスト全体でインスタンスを分散できます。ホストレベルのスプレッドプレイスメントグループは、AWS Outposts を使用する場合にのみ使用できます。
ラックスプレッドレベルのプレイスメントグループ
次の図は、1 つのアベイラビリティーゾーン内の、スプレッドプレイスメントグループに配置された 7 つのインスタンスを示しています。7 つのインスタンスは、7 つの異なるラックに配置され、各ラックは独自のネットワークおよび電源を備えています。
実践
クラスタプレイスメントグループの作成
-
AWSにサインインし、EC2に遷移します。
-
ナビゲーションペインで「プレイスメントグループ」をクリックします。
-
「プレイスメントグループを作成」をクリックします。
-
EC2ダッシュボードで「インスタンスを起動」をクリックします。
パーティションプレイスメントグループの作成
- プレイスメント戦略を「パーティション」、パーティション数は「2」を選択し、「グループを作成」をクリックします。
- EC2インスタンスの作成で、プレイスメントグループを「parition」、ターゲットを「1」として2つのインスタンスを作成します。
- 2台起動されました。
- プレイスメントグループ「partition」、パーティション番号は「1」で作成されました。
スプレッドプレイスメントグループの作成
考察
今回は、プレイスメントグループについて整理してみました。私がよく使うSparkなどではクラスタプレイスメントグループが適していると思いました。
参考