この記事の対象読者
- 来期の予算策定に追われているCTO / VPoE
- 「生成AI導入したいけど幾らかかるの?」と上司に聞かれて困っているPM
- AWS / Azure / GCP の最新料金体系(2026年1月時点)を把握したいインフラエンジニア
この記事のゴール
AWS, Azure, GCP の生成AIサービスを使って社内Wiki(RAG)を構築した場合の**「リアルな月額請求額」を算出します。2026年のキーワードは「インフラ(DB)の方が高い」**という逆転現象です。
1. はじめに:もはや「AIの知能」は無料に近い
2026年現在、AI市場は「インテリジェンスのコモディティ化」が極まりました。汎用的な知能の価格は2023年比で99%下落しています。
RAGシステムのコスト構造は**「推論コスト」から「記憶(Vector DB)コスト」へと完全にシフトしました。本記事では、公式料金表の「0.000...ドル」という微細な数字を、「月額・日本円(税込)」**の現実に引き直してシミュレーションします。
2. 前提条件:モデルケース定義
公平な比較のため、以下の中規模企業の社内Wikiを想定します。
| パラメータ | 設定値 | 備考 |
|---|---|---|
| ユーザー数 | 1,000名 | 中堅企業または大企業の1事業部 |
| 利用頻度 | 10回 / 人・日 | 平均的な業務利用 |
| 月間リクエスト | 200,000回 | 1,000人 × 10回 × 20営業日 |
| データ量 | 10万ドキュメント | 社内規定、マニュアル、議事録など |
| 為替レート | $1 = 140円 | 円高傾向を加味した2026年レート |
構成アーキテクチャ:
- AWS: Bedrock + OpenSearch Serverless
- Azure: Azure OpenAI + AI Search
- GCP: Vertex AI + Vertex AI Search
3. コンポーネント別コスト分析
3.1 LLM(頭脳)のコスト
各社の「最新エコノミー(安くて賢い)」モデルを採用します。
| ベンダー | 採用モデル | 入力単価 / 1M | 出力単価 / 1M | 特徴 |
|---|---|---|---|---|
| AWS | Claude 3.5 Haiku | $0.25 (35円) |
$1.25 (175円) |
安定のレガシー。Wiki用途では3.5が現役。 |
| Azure | GPT-4o mini | $0.15 (21円) |
$0.60 (84円) |
ド定番。GPT-5 Mini ($0.25) より安いため、コスト重視ならこちら。 |
| GCP | Gemini 3 Flash |
$0.05 (7円) |
$0.20 (28円) |
価格破壊。性能はGPT-4o級で価格は1/3。2026年の覇権モデル。 |
インサイト
LLMの推論コストだけで見れば GCP (Gemini 3 Flash) が圧勝 です。AWSとAzureは「旧世代モデル」を使ってようやく価格競争に参加できるレベルです。
3.2 Vector DB(記憶)のコスト
ここが最大の落とし穴です。「置いておくだけでかかる固定費」と「検索するたびにかかる変動費」のバランスに注目してください。
AWS: OpenSearch Serverless
- 課金体系: OCU (Compute Unit) 時間課金。
- 罠: 最低でも 4 OCU ($0.24 × 4 × 24h × 30日) が必要。
- 固定費: 約96,768円/月。
- 特徴: 入場料は高いが、リクエスト数が増えても料金が上がりにくい。
Azure: AI Search (Basic) + Semantic Ranker
- 課金体系: Basic Tier (固定費) + Semantic Ranker (リクエスト課金)。
- 固定費: 約10,320円/月 (Basic)。
- 変動費: Semantic Rankerを使うと $1.00 / 1,000回。
- 特徴: 固定費は安いが、検索するたびにチャリンチャリンと課金される。
GCP: Vertex AI Search (Standard)
- 課金体系: リクエスト課金主体。
- 固定費: ほぼゼロ(ストレージ代のみ)。
- 変動費: $2.00 / 1,000回。
- 特徴: 初期費用は激安だが、リクエスト単価がAzureの倍。
4. ガチ比較シミュレーション結果
シナリオA:中規模「社内Wiki RAG」(月20万回検索)
最も一般的なユースケースでの月額総コスト比較です。
| 費目 | AWS構成 | Azure構成 | GCP構成 |
|---|---|---|---|
| 1. LLM推論 (入出力) | 42,000円 | 25,200円 | 8,400円 |
| 2. DB固定費 | 96,768円 | 10,320円 | 140円 |
| 3. DB検索費 | 0円 | 28,000円 | 56,000円 |
| 合計月額 (税抜) | 138,768円 | 63,520円 | 64,540円 |
| ユーザー1人あたり | 139円 | 64円 | 65円 |
👑 勝者: Microsoft Azure
月額約6.4万円。GPT-4o mini (レガシー) の安さと、AI Search Basicのバランスで僅差の勝利です。
GCPはLLM代が驚異の8,400円で済みましたが、検索クエリ代($2/1k)が高くつき、Azureと並びました。
AWSはOpenSearchの最低料金(約10万円)が重荷となり最下位です。
AWSユーザーへの救済策
もし既存の Amazon Aurora (PostgreSQL) があるなら、pgvector を使って相乗りさせましょう。DBコストをほぼゼロにできるため、AWS構成が月額約4.2万円の最安値に化けます。
シナリオB:大規模「B2C サポートボット」(月300万回検索)
Webサイトで一般公開し、アクセスが殺到する場合です。
| 費目 | AWS構成 | Azure構成 | GCP構成 |
|---|---|---|---|
| 合計月額 | 約72万円 | 約86万円 | 約97万円 |
👑 勝者: AWS
リクエスト数が300万回を超えると、AWSの「高い固定費」が逆にメリットになります。いくら検索しても(OCU内なら)追加料金がかからないためです。
逆に、リクエスト課金型のAzureとGCPは**「死の課金」**となり、コストが青天井に増えていきます。
5. 稟議書にそのまま書ける「ROIの殺し文句」
上司を説得するためのテンプレートを用意しました。ご自由にお使いください。
「本システムの導入コストは、従業員1人あたり月額約65円〜140円(自販機のジュース1本分)です。
これにより、社員が資料探しに費やしている時間を1日平均5分削減できたと仮定すると、時給3,000円換算で月額5,000円分の工数削減効果が生まれます。
投資対効果(ROI)は**3,500%〜7,600%**に達し、導入初月から確実に黒字化するプロジェクトです。」
6. 結論:どれを選ぶべきか?
-
とにかく安く始めたい (PoC)
👉 GCP (Vertex AI)
初期費用がほぼゼロ。Gemini 3 Flashの安さは異常。 -
中規模で安定運用したい (社内標準)
👉 Azure (OpenAI + AI Search)
バランスの王者。既存のMicrosoft 365契約と親和性が高い。 -
大規模・高負荷・エンジニアリソースがある
👉 AWS (Bedrock + Aurora/OpenSearch)
スケールメリットが効く。特にAurora pgvectorを使いこなせるなら最強のコスパ。
※価格は2026年1月時点の想定レートおよび公式Pricingに基づきます。導入時は最新情報をご確認ください。
Tags
GenerativeAI, AWS, Azure, GCP, FinOps