はじめに
DeepSeekをAWS上で運用する場合、計算リソース(GPUインスタンス)、ストレージ、ネットワーク転送料金などがコストに影響します。本記事では、AWSでDeepSeekを運用する際のコストを試算し、最適な構成について考察します。
1. 必要なAWSリソース
DeepSeekの運用には、以下のAWSリソースが必要になります。
1.1 EC2インスタンス(GPU搭載)
DeepSeekの推論・ファインチューニングには高性能なGPUが必要です。AWSのGPUインスタンスの中で、代表的なものは以下のとおりです。
インスタンスタイプ | GPU | VRAM | vCPU | メモリ | 料金(オンデマンド) |
---|---|---|---|---|---|
g5.2xlarge | 1x A10G | 24GB | 8 | 32GB | $1.212/時間 |
g5.12xlarge | 4x A10G | 96GB | 48 | 192GB | $7.272/時間 |
p4d.24xlarge | 8x A100 | 320GB | 96 | 1152GB | $32.77/時間 |
1.2 ストレージ
モデルファイルの保存とデータ処理のためにEBS(Elastic Block Store)を使用します。
- DeepSeek-7Bのストレージ要件: 50GB 以上推奨
- EBS(gp3, 100GB)料金: 約$8/月
- オプション:S3ストレージ(データバックアップ用): 100GBで$2.3/月
1.3 ネットワーク料金
AWSの外部へデータを送信する際に転送料金が発生します。
- 100GB/月の外部転送: 約$9/月
- VPC内通信(EC2-S3間): 無料
2. 運用コスト試算
2.1 推論用途(インタラクティブな利用)
DeepSeekの推論用途では、 g5.2xlarge
を選択し、1日4時間稼働すると仮定します。
項目 | 料金 |
---|---|
g5.2xlarge (4時間/日, 30日) | $145.44 |
ストレージ (EBS 100GB) | $8.00 |
ネットワーク転送料 (100GB) | $9.00 |
合計 | $162.44/月 |
2.2 ファインチューニング用途(長時間の計算)
ファインチューニングには g5.12xlarge
を利用し、24時間連続で3日間トレーニングを行うと仮定します。
項目 | 料金 |
---|---|
g5.12xlarge (24時間 × 3日) | $523.58 |
ストレージ (EBS 200GB) | $16.00 |
ネットワーク転送料 (200GB) | $18.00 |
合計 | $557.58/回 |
2.3 高性能GPU(p4d.24xlarge)を使用した場合
より高速なトレーニングが必要な場合、 p4d.24xlarge
を利用し、48時間トレーニングした場合のコストを試算します。
項目 | 料金 |
---|---|
p4d.24xlarge (48時間) | $1,572.96 |
ストレージ (EBS 500GB) | $40.00 |
ネットワーク転送料 (500GB) | $45.00 |
合計 | $1,657.96/回 |
3. コスト削減のための方法
3.1 スポットインスタンスの活用
AWSのスポットインスタンスを利用すると、最大70%のコスト削減が可能です。
-
g5.2xlarge
のスポット料金: 約 $0.38/時間(68%割引) -
g5.12xlarge
のスポット料金: 約 $2.35/時間(68%割引)
3.2 セーバープランの活用
1年間または3年間のリザーブドインスタンスを利用すると、最大50%の割引を受けられます。
-
g5.2xlarge
の1年リザーブド料金: 約 $0.73/時間(40%割引) -
g5.12xlarge
の1年リザーブド料金: 約 $4.36/時間(40%割引)
3.3 AWS BatchとAuto Scaling
ファインチューニングを実行する際に、AWS BatchやAuto Scalingを活用すると、必要なときにのみGPUインスタンスを起動でき、コストを削減できます。
4. まとめ
ケース | 使用インスタンス | 稼働時間 | 試算コスト |
---|---|---|---|
推論用途 | g5.2xlarge | 4時間/日×30日 | $162.44/月 |
ファインチューニング | g5.12xlarge | 24時間×3日 | $557.58/回 |
高性能トレーニング | p4d.24xlarge | 48時間 | $1,657.96/回 |
DeepSeekをAWS上で運用する際のコストは、用途やインスタンス選択に大きく依存します。スポットインスタンスやリザーブドインスタンスを活用することで、コスト削減が可能です。用途に応じた最適なリソース選定を行い、効率的にDeepSeekを運用しましょう。