2
2

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?

【2026年度版】もし社内WikiにRAGを導入したら幾らかかるか? クラウド3社ガチ比較表

Last updated at Posted at 2025-12-31

この記事の対象読者

  • 来期の予算策定に追われているCTO / VPoE
  • 「生成AI導入したいけど幾らかかるの?」と上司に聞かれて困っているPM
  • AWS / Azure / GCP の最新料金体系(2026年1月時点)を把握したいインフラエンジニア

この記事のゴール
AWS, Azure, GCP の生成AIサービスを使って社内Wiki(RAG)を構築した場合の**「リアルな月額請求額」を算出します。2026年のキーワードは「インフラ(DB)の方が高い」**という逆転現象です。

1. はじめに:もはや「AIの知能」は無料に近い

2026年現在、AI市場は「インテリジェンスのコモディティ化」が極まりました。汎用的な知能の価格は2023年比で99%下落しています。

RAGシステムのコスト構造は**「推論コスト」から「記憶(Vector DB)コスト」へと完全にシフトしました。本記事では、公式料金表の「0.000...ドル」という微細な数字を、「月額・日本円(税込)」**の現実に引き直してシミュレーションします。

2. 前提条件:モデルケース定義

公平な比較のため、以下の中規模企業の社内Wikiを想定します。

パラメータ 設定値 備考
ユーザー数 1,000名 中堅企業または大企業の1事業部
利用頻度 10回 / 人・日 平均的な業務利用
月間リクエスト 200,000回 1,000人 × 10回 × 20営業日
データ量 10万ドキュメント 社内規定、マニュアル、議事録など
為替レート $1 = 140円 円高傾向を加味した2026年レート

構成アーキテクチャ:

  • AWS: Bedrock + OpenSearch Serverless
  • Azure: Azure OpenAI + AI Search
  • GCP: Vertex AI + Vertex AI Search

3. コンポーネント別コスト分析

3.1 LLM(頭脳)のコスト

各社の「最新エコノミー(安くて賢い)」モデルを採用します。

ベンダー 採用モデル 入力単価 / 1M 出力単価 / 1M 特徴
AWS Claude 3.5 Haiku $0.25
(35円)
$1.25
(175円)
安定のレガシー。Wiki用途では3.5が現役。
Azure GPT-4o mini $0.15
(21円)
$0.60
(84円)
ド定番。GPT-5 Mini ($0.25) より安いため、コスト重視ならこちら。
GCP Gemini 3 Flash $0.05
(7円)
$0.20
(28円)
価格破壊。性能はGPT-4o級で価格は1/3。2026年の覇権モデル。

インサイト
LLMの推論コストだけで見れば GCP (Gemini 3 Flash) が圧勝 です。AWSとAzureは「旧世代モデル」を使ってようやく価格競争に参加できるレベルです。

3.2 Vector DB(記憶)のコスト

ここが最大の落とし穴です。「置いておくだけでかかる固定費」と「検索するたびにかかる変動費」のバランスに注目してください。

AWS: OpenSearch Serverless

  • 課金体系: OCU (Compute Unit) 時間課金。
  • 罠: 最低でも 4 OCU ($0.24 × 4 × 24h × 30日) が必要。
  • 固定費: 約96,768円/月
  • 特徴: 入場料は高いが、リクエスト数が増えても料金が上がりにくい。

Azure: AI Search (Basic) + Semantic Ranker

  • 課金体系: Basic Tier (固定費) + Semantic Ranker (リクエスト課金)。
  • 固定費: 約10,320円/月 (Basic)。
  • 変動費: Semantic Rankerを使うと $1.00 / 1,000回
  • 特徴: 固定費は安いが、検索するたびにチャリンチャリンと課金される。

GCP: Vertex AI Search (Standard)

  • 課金体系: リクエスト課金主体。
  • 固定費: ほぼゼロ(ストレージ代のみ)。
  • 変動費: $2.00 / 1,000回
  • 特徴: 初期費用は激安だが、リクエスト単価がAzureの倍。

4. ガチ比較シミュレーション結果

シナリオA:中規模「社内Wiki RAG」(月20万回検索)

最も一般的なユースケースでの月額総コスト比較です。

費目 AWS構成 Azure構成 GCP構成
1. LLM推論 (入出力) 42,000円 25,200円 8,400円
2. DB固定費 96,768円 10,320円 140円
3. DB検索費 0円 28,000円 56,000円
合計月額 (税抜) 138,768円 63,520円 64,540円
ユーザー1人あたり 139円 64円 65円

👑 勝者: Microsoft Azure
月額約6.4万円。GPT-4o mini (レガシー) の安さと、AI Search Basicのバランスで僅差の勝利です。
GCPはLLM代が驚異の8,400円で済みましたが、検索クエリ代($2/1k)が高くつき、Azureと並びました。
AWSはOpenSearchの最低料金(約10万円)が重荷となり最下位です。

AWSユーザーへの救済策
もし既存の Amazon Aurora (PostgreSQL) があるなら、pgvector を使って相乗りさせましょう。DBコストをほぼゼロにできるため、AWS構成が月額約4.2万円の最安値に化けます。

シナリオB:大規模「B2C サポートボット」(月300万回検索)

Webサイトで一般公開し、アクセスが殺到する場合です。

費目 AWS構成 Azure構成 GCP構成
合計月額 約72万円 約86万円 約97万円

👑 勝者: AWS
リクエスト数が300万回を超えると、AWSの「高い固定費」が逆にメリットになります。いくら検索しても(OCU内なら)追加料金がかからないためです。
逆に、リクエスト課金型のAzureとGCPは**「死の課金」**となり、コストが青天井に増えていきます。

5. 稟議書にそのまま書ける「ROIの殺し文句」

上司を説得するためのテンプレートを用意しました。ご自由にお使いください。

「本システムの導入コストは、従業員1人あたり月額約65円〜140円(自販機のジュース1本分)です。
これにより、社員が資料探しに費やしている時間を1日平均5分削減できたと仮定すると、時給3,000円換算で月額5,000円分の工数削減効果が生まれます。
投資対効果(ROI)は**3,500%〜7,600%**に達し、導入初月から確実に黒字化するプロジェクトです。」

6. 結論:どれを選ぶべきか?

  • とにかく安く始めたい (PoC)
    👉 GCP (Vertex AI)
    初期費用がほぼゼロ。Gemini 3 Flashの安さは異常。
  • 中規模で安定運用したい (社内標準)
    👉 Azure (OpenAI + AI Search)
    バランスの王者。既存のMicrosoft 365契約と親和性が高い。
  • 大規模・高負荷・エンジニアリソースがある
    👉 AWS (Bedrock + Aurora/OpenSearch)
    スケールメリットが効く。特にAurora pgvectorを使いこなせるなら最強のコスパ。

※価格は2026年1月時点の想定レートおよび公式Pricingに基づきます。導入時は最新情報をご確認ください。

Tags
GenerativeAI, AWS, Azure, GCP, FinOps

2
2
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
2
2

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?