Azure OpenAI Serviceを導入・検討する際、「実際どれくらいコストがかかるの?」と不安に思う方も多いのではないでしょうか。
この記事では、Azure OpenAI Serviceの料金体系やコストの考え方、実際の運用例まで、分かりやすく解説します。
※本記事の内容は、2025/4/17時点の仕様です。
従量課金制の基本:トークン課金
Azure OpenAI Serviceの主な課金方式は「トークン課金」です。
(水道や電気料金のように、「使った分だけ支払う」仕組みです)
文章はトークンという単位で分割され、処理されたトークン数に応じて料金が発生します。
トークンとは?
トークンとは、テキストを処理するための最小単位です。
(例)文章:「Azure OpenAI Service」→ トークン:Azure OpenAI Service
※4つのトークンに分割される(GPT-4oの場合)
例では英語を使いましたが、トークンの分割方法は言語によって大きく異なります。
例えば英語の場合は、単語や接頭辞・接尾辞などがトークンになる傾向がありますが、
日本語の場合は、文字ごとに複数のトークンに分割される場合があります。
(例)文章:トークンとは、テキストを処理するための最小単位です。
※22のトークンに分割される(GPT-4oの場合)
また、トークン数はモデルによっても異なる場合があります。
例えば、GPT-4の場合は上記の日本語の文章は25トークンに分割されます。
厳密なトークン数を知りたい場合は、OpenAI社が提供している「Tokenizer」を使用してみてください!
課金のタイミング
では、そのトークンはどのタイミングで課金対象となるのか。
それは入力(プロンプト)と出力(生成結果)のトークン数に対して、課金が発生します。
(例)
社内報告書(3,000文字、約4,000トークン)を要約する場合
・入力:報告書(4,000トークン) + プロンプト(50トークン) = 4,050トークン
・出力:要約(400トークン)
・合計:4,450トークン
・GPT-4o-miniでの料金:4,450 × (2,264円 / 1,000,000トークン) = 約10.1円
文章量の多いインプットデータを全文検索すると、必然的にトークン数が増えるため、トークン数を減らす工夫(データのインデックス化や検索方法の見直しなど)が重要になります。
Azure OpenAI Serviceの料金プラン(モデルのデプロイ)
Azure OpenAI Serviceでモデルをデプロイする際に、デプロイの種類を設定します。
これは、どのような課金システムを採用するか設定するところになります。
デプロイの種類は大きく分けて2つあります。(設定できる方法はモデルによって異なります)
① Standard:使った分だけ請求される。小規模利用や不定期利用に最適(スマホの従量課金プランのイメージ)
② Provisioned Throughput Units (PTU):固定料金。大量利用や定額での利用に最適(固定電話やWi-fi回線の定額制のイメージ)
基本的には、検証段階などは「Standard」を選んでおけば、間違いないと思います。
Azure OpenAI Service 運用コスト
実際の運用では、モデルの利用料以外にも様々なコストが発生します。
例えば、Azure Storageにナレッジデータを格納して利用する場合、ネットワーク転送料やストレージ利用料も必要です。構成や使い方によってコストは大きく変動します。
<社内文書検索システム(RAG)のコスト例>
中規模企業(社員500人)、1万ページの社内文書、月間10,000回の検索クエリを想定
1.Azure OpenAI Service:
- 埋め込み処理: 1万文書 × 平均1,000トークン = 1,000万トークン → 約2,000円/月
- クエリ処理: 10,000クエリ × 平均0.3ドル/クエリ = 約45万円/月
2.Azure AI Search (ベクトルデータベース):
- スタンダードS1ティア: 約1.5〜3.8万円/月
3.Azure Blob Storage (文書保管):
- 1万文書 × 平均5MB = 50GB → 約150円/月
4.Azure AI Document Intelligence (文書処理):
- 初期処理: 1万ページ × 約7.5円/ページ = 約7.5万円(初期コストのみ)
5.コンピューティングリソース:
- App Serviceなどのホスティング: 約1.5〜3万円/月
合計月間費用概算: 約50〜55万円/月
まとめ
Azure OpenAI Serviceは、検証利用程度であれば高額請求の心配は少なく、利用状況もAzure Portalで確認できます。
全社員にCopilotやChatGPTのライセンスを配布するよりも、用途によってはAzure OpenAI Serviceの方がコストを抑えられるケースもあります。
導入検討の際は、実際の利用方法や構成に応じてコストを試算し、最適なプランを選びましょう。
最後に
テンダでは、「こんなプロジェクトに挑戦したい」「こんなチームで働きたい」「理想のチームを創りたい」と願う仲間を求めています。
カジュアル面談も随時受付中です。ぜひ一度お話ししましょう!
