はじめに
re:Invent 2024で Datadogによる AWSワークロードの100%を AWS Gravitonに移行するという取り組みのセッションを聴講しました。
大規模かつ短期間でコスト最適化を進めていく上で紹介されている戦略の中には学びや気づきがあったのでいくつかピックアップします。
セッションの動画は以下のリンクから視聴可能です。
セッションの概要
- Datadog CTOから「AWSワークロードの100%をAWS Gravitonに移行せよ」と課題を出される
- AWS Gravitonとは AWSが独自開発したプロセッサであり、コストパフォーマンスが高い
- そのため既存のプロセッサから AWS Gravitonに移行することでコスト削減が見込める
- 移行を主導するチームが存在し、各サービスを持っているチームに移行してもらうよう推進する
※上の図はあくまでもイメージです
削減可能なコストの共有
Gravitonへの移行を主導するチームとは別に、実際に移行作業するのはサービスを持っている各チームであり、多くのエンジニアが関わります。全員がこの取り組みに価値を見出せるようにどれだけの効果が得られるのか明確にすることはとても重要です。
保守的に低く見積もる
削減可能なコストをあえて低く見積もっています。計算上は20%
の削減が可能でも18%
としています。実際に削減できた金額が見積もりを上回っても怒られないからという保守的な考えがあるようです。
コスト回避
既存のサービスだけでなく、これからリリースされる新規のサービスも見積もりに含めています。移行するわけではないためコスト削減にはなりませんが、Gravitonを採用した場合としなかった場合の差分のコストを回避できるため潜在的なコスト削減となります。
DDSQLエディター
本題とはズレてしまいますが、削減可能なコストを見積もる過程で DDSQLエディターを使用しています。この機能はプレビューでリクエストを出すと利用可能なので、実際に試して別記事で紹介したいと思います。
移行状況の可視化
全体の進捗
全体の進捗が確認できるダッシュボードを用意し、Gravitonの採用率(ARM Adoption)や Gravitonへの移行が可能なコアの割合(ARM Registry Readiness)などを可視化しています。また移行手順書やFAQ、コミュニケーションが取れるSlackチャンネルなど必要な情報が集約されています。
コスト削減効果
もう一つコストに焦点を当てたダッシュボードも用意されています。こちらには Gravitonへの移行で削減できたコスト(Estimated monthly savings)や移行すれば削減可能なコスト(Remaining AMD64 Scope to migrate - Mo Saving Est.)が表示されています。
チームの進捗状況
各チームの Graviton(Arm64
)とまだ移行されていないプロセッサ(x86
)を可視化し、チームの進捗状況がリアルタイムで確認できるようになっています。
これらの可視化は Gravitonへの移行を主導するチームが状況を把握することに役立ちますし、実際に移行する各チームにとっても有益なものです。
終わりに
Datadogのように会社全体を巻き込んだ取り組みだからこそできている戦略もあると思いますが(特にダッシュボードの作り込み)、たとえ小さな取り組みだとしても参考にできる部分はありそうです。本記事がみなさんのコスト削減の取り組みのヒントになれば幸いです。