はじめに
本記事はClassmethod Odyssey(DevelopersIO 2024)のリアルイベント(7/20)において Classmethod の のんピ さんが講演された「Amazon FSx for NetApp ONTAPのパフォーマンスチューニング要素をまとめてみた」のレポートです。
公式セッション紹介
このセッションではAmazon FSx for NetApp ONTAPのパフォーマンスを最適化するための主要な要素について解説します。ストレージやネットワーク、ONTAPの内部設定など、さまざまな観点からパフォーマンスチューニングの要素と設定方法を紹介します。
発表資料
概要/おすすめポイント
内容としてはFSxONTAPのパフォーマンスチューニングの話ですが、FSxONTAPに限らずパフォーマンスの課題があるときにどうしていくか?という普遍的な話から入られていたので、パフォーマンス問題が発生したときに立ち止まって資料を確認すると見逃がしとか次の一手が見つかるかもしれません。
もちろん、FSxONTAPでの知見も詰まっており、こんな時はこうしたら?というのが20個以上例示されていたので発表資料公開されたら保存しておきましょう!
セッション内容の紹介
パフォーマンスチューニングなので、次のような流れででした。
- ボトルネックの把握の話
- なぜパフォーマンスチューニングをするのか
- チューニングしないとどうなるか
- チューニングしたら?
- 負荷テストの話
- 最小限のコストで最大限の効果
- コストは費用そのものだけではなく設計コスト・運用コストなども含む
- FSxONTAPのチューニング
以下のポイントそれぞれでチューニング観点を例示
確認はインフラ側(メトリクスとか)から、設定変更はボトルネックから
ワークロード毎の深堀の仕方なども例示あり- メトリクス
- FSxONTAPの設定
- ネットワーク
- クライアント
- チューニング事例の紹介
まとめ
セッション内容の紹介にあるように、実際のチューニングの流れから事例含めてお話されていたので、ONTAPのパフォーマンスで困ったらまずこのセッションを振り返ると良いのでは、と思いました。
発表の後に少し会話しましたが、現時点では?メトリクスなどからドリルダウンしてどのプロセスがリソースを消費しているのか、にはたどり着けないので、qosコマンドで確認する必要があるよ、という話でした。
また、特定のタイミングでロードが高くなるようなタイミングでは、eventbridgeなどでこのタイミングはアラートあげない、みたいなこともよく行われているとのことでした。
ご本人のセッション説明([登壇レポート] Amazon FSx for NetApp ONTAPのパフォーマンスチューニング要素をまとめてみた)が上がってますので、そちらもご確認ください!