はじめに
初めまして、2024年現在は都内の大学院にて学生をしているhimaです。
普段は大学院で機械学習とかピープルアナリティクスとかデータを活用することをテーマに色々勉強しています。
その傍でデータアナリストとしてインターンをしており、AWSのAutoMLサービスであるAutopilotを触っています。
今回は自分も困ったところで、実際に触ってみないとわからない人も多いんじゃないかと思い、このテーマを執筆しています。
*AWS SageMakerやAutopilotの機能についての説明はしません。以下の記事等を参照ください。
本記事の対象者
- すでにある程度Autopilotについて知っている
- Autopilotを触ってみたいが料金がどれくらいかかるのか不安なため、手をつけられない
- 費用の試算がしたい
Autopilotとは
Autopilotについての解説記事はたくさんqitta上にも載っているため、いくつかよさそうなものをピックアップしておきます。
↓使い方などがまとまっており、非常に助かりました
本題の料金について
私の場合は、インターネットを検索しても公式のサイトやドキュメントに「従量課金制です」と書かれているくらいしかみたことがないまま、触っていました。
ですが、Autopilotのモデルを10MB〜40MBくらいのデータを用いて何回かぶん回していると、一日あたり数十ドルの請求が来ることもあるようです、、
料金のかかり方
以下のように変数を定義すると、
- ジョブ数 : $ N $
- 一つの処理ジョブにかかる時間 : $ x_n $
- インスタンス利用料金 : $ m $
↓こんな感じで表すことができます↓
\sum_{k=1}^N x_n m
要は、「モデルを作成した際に同時に進行する処理ジョブの一つ一つに対して料金がかかる」ということになります。
例えば、Taitanic
というモデルを作成した際に同時に10個
のモデルが作成されます。
それぞれのモデルを処理するジョブに対して、15分
ずつかかったとします。
この処理ジョブに利用されるインスタンスタイプの利用料金が$4 / 時間
だった時の料金は、$10
になります。
$10=10ジョブ*15/60*$4/時間
終わりに
今回ご紹介したのはあくまでも自分が遭遇した問題の答えでしたので、読み手の皆さんそれぞれの環境ではまた異なるかもしれません。
ただ、Autopilotはインスタンスの利用以外に大きく請求に影響のある因子はなかったと思いますので、何のインスタンスをどれくらい使っているのかを意識しておけば、ある程度予測はつくのではないでしょうか?
ここまで読んでいただきありがとうございました。