はじめに
こんにちは、京セラコミュニケーションシステムの宮坂です。
私たちの部門ではSnowflakeの導入支援、提案をおこなっております。
SnowflakeのAI関連の課金体系について、AIクレジットという考えが導入されております。
情報をまとめて記事に致しました。
また、実際の料金予測方法について、検証いたしました。
本記事は2026年5月時点の情報を元にまとめております。
料金体系や具体的な料金については、変動の可能性がありますので、最新のソースをご参照ください。
1.基本的な料金の考え方について整理
1.1.料金の考え方
Snowflakeではクレジットという単位で管理されており、
消費したクレジットに、あらかじめ定められたドル換算レートを乗じて算出されます。
主なクレジットは以下の表、イメージ図から発生致します。
| 項目名 | 概要 |
|---|---|
| コンピュートリソース | ウェアハウス、サーバーレスコンピューティング、クラウドサービスを利用した時にかかるクレジット |
| ストレージリソース | テーブル、ステージ等のデータ保存にかかるクレジット |
| データ転送リソース | リージョン間、クラウド間等のデータ転送にかかるクレジット |
詳細は公式ページをご参照ください。
1.2.クレジット単価
Snowflakeではエディションによって、クレジットの単価が変わります。
2026年5月時点では以下がクレジット単価となります。
| エディション | 単価(1クレジット) |
|---|---|
| Standard | $2.00 |
| Enterprise | $3.00 |
| BusinessCritical | $4.00 |
| Virtual Private Snowflake | 要問合せ |
※エディションによって、利用できる機能に差分がありますので、そちらは別途ご確認ください。
2.AI関連の料金について
AI関連の料金について整理します。
2.1.料金体系
AI関連の機能は2026年4月からAIクレジットという単位が導入されており、以下のサービスを利用した場合にAIクレジットという単位で課金されます。
・Cortex AI Functions
・Cortex Agents
・Cortex Code CLI
・Cortex Code UI
・Snowflake Intelligence
「1.1.料金体系の整理」で説明させて頂いた内容と合わせて考えた時に、以下のイメージとなります。

2.1.料金表、考え方
AIクレジットの料金表の詳細は公式ページをご参照ください。
2026年5月時点で、
1クレジット = $1.88~$2.20ドル
となっており、RegionalかGlobalかによる差はありますが、エディションによる違いはありません。
また、1クレジットの考え方ですが、
1クレジット = 100万トークン
となります。
2.2.AIクレジットのトークン
トークンの算出方法ですが、具体的な算出方法は公式のページにありません。
トークンの変換率、ならびに、トークン算出関数(※)が用意されており、そこから推測可能となります。
※Cortex AI Functions用のみ
今回は、以下を見ていきたいと思います。
・Cortex AI Functionsの消費トークン算出と変換率
・Snowflake Intelligence,Cortex Agentsの変換率
トークンの変換率(Cortex AI Functions)
利用する生成AIのモデルによって、消費するトークンが変わります。
ここでは具体的なイメージを持っていただくため、AI_COMPLETE関数の消費トークンをご紹介します。
※利用するサービス、関数ごとに料金体系が変わります。
消費トークンの単価については、公式ページをご参照ください。
文字列を以下の変換比率から算出します。
値が小さいモデルは消費トークンが少ない(コストが安い)モデルになります。
| Cortex Feature | Input (Credits per one million Tokens) | Output (Credits per one million Tokens) |
|---|---|---|
| AI_COMPLETE – claude-opus-4-5 | 2.75 | 13.75 |
| AI_COMPLETE – claude-sonnet-4-6 | 1.65 | 8.25 |
| AI_COMPLETE – gemini-2-5-flash | 0.15 | 1.25 |
| AI_COMPLETE – gemini-2-5-flash-lite | 0.05 | 0.20 |
| AI_COMPLETE – gemini-3.1-pro | 1.10 | 6.60 |
| AI_COMPLETE – gemini-3.1-pro-long-context | 2.20 | 9.90 |
| AI_COMPLETE – llama3.1-8b | 0.11 | 0.11 |
Input (Credits per one million Tokens) : AI関数へのデータ入力時のトークン変換率
Output (Credits per one million Tokens) : AI関数からデータ出力時のトークン変換率
トークン算出関数(AI_COUNT_TOKENS)
AI_COUNT_TOKENS関数にて、トークンの目安を参照する事ができます。
※前提として、消費トークン数は入力した文字列から算出されるため、文字列の長さや内容に依存します。
例
関数名
AI_COUNT_TOKENS
サンプル
SELECT
AI_COUNT_TOKENS('AI_COMPLETE', 'llama3.1-8b', 'AI_COUNT_TOKENSの機能を一言で解説してください。') AS input_token_count
履歴参照
SNOWFLAKE.ACCOUNT_USAGE.METERING_HISTORY VIEWから参照します。
※反映まで3時間ほどかかります。
SELECT
CONVERT_TIMEZONE('America/Los_Angeles', 'Asia/Tokyo', START_TIME) AS START_TIME_JST,
SERVICE_TYPE,
CREDITS_USED_COMPUTE
FROM SNOWFLAKE.ACCOUNT_USAGE.METERING_HISTORY
WHERE SERVICE_TYPE = 'AI_SERVICES'
ORDER BY START_TIME DESC;
※ACCOUNT_USAGEスキーマのVIEWはデータ反映に45分~3時間ほどかかります。
トークンの変換率(Snowflake Intelligence,Cortex Agents)
Snowflake Intelligence,Cortex Agentsの変換比率は以下になります。
AIFunctionsと比べると、オーケストレーションが走るためか、同じモデルでもトークンが増えています。
また、内部でCortex Analyst, Cortex Search等のAI機能を呼び出すため、想定より利用トークンが増える可能性があるので、ご留意して利用ください。
| Model | Input | Output | Cache Write | Cache Read |
|---|---|---|---|---|
| claude-opus-4-5 | 3.25 | 16.26 | 4.07 | 0.33 |
| claude-sonnet-4-6 | 1.95 | 9.76 | 2.44 | 0.20 |
| gemini-2-5-flash⁴ | 0.18 | 1.48 | - | 0.02 |
| gemini-3.1-pro⁴ | 1.30 | 7.81 | - | 0.13 |
Cache Write,Cache Readについては、サポートにも問い合わせた所、記載の通り、内部処理でキャッシュ利用時発生するコストとの事です。
Cache Write:大きなプロンプトプレフィックスが初めてキャッシュに書き込まれる際のトークンコストです
Cache Read:キャッシュされたコンテキストを再利用する後続リクエストに適用されるトークンコストです
2.3.AI関数の消費トークンを検証する。(Cortex AI Functions)
AI関数を発行した時の消費トークン目安と、実際にAI関数(AI_COMPLETE関数)を発行した時に消費するトークンを検証致します。
【検証手順】
①AI_COUNT_TOKENS関数を利用して、消費トークン(目安)を算出します。
②AI_COMPLETE関数を利用します。
③SNOWFLAKE.ACCOUNT_USAGE.METERING_HISTORYビューを参照して、消費トークンを算出します。
SQLを発行し【検証手順】①、②を検証します。
WITH source_data AS (
-- ここに要約したい長文を記述します
SELECT 'Snowflake Cortexはなにができるか教えてもらえますか。日本語で箇条書きにして解り易い形にしてください。' AS long_text
)
SELECT
-- ①AI_COUNT_TOKENS関数を利用して、消費トークン(目安)を算出します。
AI_COUNT_TOKENS('AI_COMPLETE', 'llama3.1-8b', long_text) AS input_token_count,
-- ②AI_COMPLETE関数を利用します。
-- 要約を実行(モデル名とプロンプトを指定)
AI_COMPLETE(
'llama3.1-8b',
long_text
) AS summary
FROM source_data;
結果
| INPUT_TOKEN_COUNT | SUMMARY |
|---|---|
| 44 | "Snowflake Cortexは、データ分析ツールです。以下の機能があります。\n\n* データ統合: Snowflake Cortexは、さまざまなデータソースからデータを統合し、分析に使用できるようにします。\n* データ変換: Snowflake Cortexは、データを変換し、分析に適した形式にします。\n* データ分析: Snowflake Cortexは、データを分析し、洞察を得ることができます。\n* データ視覚化: Snowflake Cortexは、データを視覚化し、分析結果を可視化します。\n* 機械学習: Snowflake Cortexは、機械学習アルゴリズムを使用して、データを分析し、予測を行うことができます。\n* データストレージ: Snowflake Cortexは、データを保存し、管理することができます。\n* セキュリティ: Snowflake Cortexは、データを保護し、セキュリティを確保することができます。\n* スケーラビリティ: Snowflake Cortexは、データ量が増加しても、スケーラビリティを保ち、分析を実行できます。" |
58文字の文字列に対して、44トークンの消費見込みとなっています。
llama3.1-8b=0.11の変換率となりますが、それほど大きな消費とならない印象です。
SNOWFLAKE.ACCOUNT_USAGE.METERING_HISTORYを参照し、【検証手順】③を検証します。
SQL
SELECT
CONVERT_TIMEZONE('America/Los_Angeles', 'Asia/Tokyo', START_TIME) AS START_TIME_JST,
SERVICE_TYPE,
CREDITS_USED_COMPUTE
FROM SNOWFLAKE.ACCOUNT_USAGE.METERING_HISTORY
WHERE SERVICE_TYPE = 'AI_SERVICES'
ORDER BY START_TIME DESC;
| START_TIME_JST | SERVICE_TYPE | CREDITS_USED_COMPUTE |
|---|---|---|
| 2026-05-12 17:00:00.000 | AI_SERVICES | 0.000001211 |
| 2026-05-12 16:00:00.000 | AI_SERVICES | 0.000034282 |
| 2026-05-12 15:00:00.000 | AI_SERVICES | 0.000001220 |
0.000034282 * 1000000 = 約34トークン
となり、AI_COUNT_TOKENSよりは少々減っていますが、
SQL実行前後で利用量が増えており、有効な確認手段と考えております。
3.まとめ
Snowflakeで新たに導入された、AIクレジットの考え方をまとめました。
結果として、SQL1本ではそれほど大きなコストが発生するわけではないので、安心して使う事ができそうです。
しかし、クラウドのコストは1本1本が積み重なると大きなコストになります。
AI Functions、Cortex Agent,Snowfklake Inteligenceそれぞれの具体的な利用トークンを算出した上で、コスト試算が必要となりますので、その一助になればと思います。
