OpenAIのLLMのAPI料金めやす
GPTのAPIで「何文字でいくらくらいだっけ?」と思ったときの自分用のメモです。
数円くらい、数十円くらい、ないし数百円くらい、みたいな桁の感覚だけまあまああってればいいかなー、というものです。
OpenAIのモデル使用料金は最新のものを確認することをお勧めします。
公式ページは、OpenAI Pricingです。
また、ドル払いなので、為替相場の変動を受けます。
ざっくりした前提
本日(2024年1月11日)1ドルが145.40 円でした。
1ドル=150円、1文字1トークンで換算してみます。
今は円安だし、普通の日本語の文章だったら、1文字1トークンよりもトークンは少なくなるので、これよりは少し安いはずです。
GPT-3.5 Turbo
GPT-3.5 Turbo models are capable and cost-effective.
(意訳:コスパがいいよ)
公式より
Model | Input | Output |
---|---|---|
gpt-3.5-turbo-1106 | $0.0010 / 1K tokens | $0.0020 / 1K tokens |
gpt-3.5-turbo-instruct | $0.0015 / 1K tokens | $0.0020 / 1K tokens |
自分用の表(1000文字何円くらい?)
Model | 入力1000文字 | 出力1000文字 |
---|---|---|
gpt-3.5-turbo-1106 | 0.15円 | 0.30円 |
gpt-3.5-turbo-instruct | 0.225円 | 0.30円 |
GPT-4 Turbo
With 128k context, fresher knowledge and the broadest set of capabilities, GPT-4 Turbo is more powerful than GPT-4 and offered at a lower price.
(意訳:いちばんパワフルだし、GPT-4よりは安いよ)
公式より
Model | Input | Output |
---|---|---|
gpt-4-1106-preview | $0.01 / 1K tokens | $0.03 / 1K tokens |
gpt-4-1106-vision-preview | $0.01 / 1K tokens | $0.03 / 1K tokens |
自分用の表(1000文字何円くらい?)
Model | 入力1000文字 | 出力1000文字 |
---|---|---|
gpt-4-1106-preview | 1.50円 | 4.50円 |
gpt-4-1106-vision-preview | 1.50円 | 4.50円 |
GPT-4
With broad general knowledge and domain expertise, GPT-4 can follow complex instructions in natural language and solve difficult problems with accuracy.
(意訳:難しいことできるよ!)
公式より
Model | Input | Output |
---|---|---|
gpt-4 | $0.03 / 1K tokens | $0.06 / 1K tokens |
gpt-4-32k | $0.06 / 1K tokens | $0.12 / 1K tokens |
自分用の表(1000文字何円くらい?)
Model | 入力1000文字 | 出力1000文字 |
---|---|---|
gpt-4 | 4.50円 | 9.00円 |
gpt-4-32k | 9.00円 | 18.00円 |
所感
GPT3.5-Turboはいつの間にかお安くなっていました。
GPT3.5は、そもそも、今のところ、コンテクストが16K context(16000文字くらい)しか入りません。フルに使っても1回でまあまあ、3円、4円くらい。
GPT-4はGPT-3.5の……ほんとにざっくりいえば10倍ちょいくらいで、同じものを処理させると30円、40円……くらいかな。
PDFの要約とか、なんか賢いことをやろうとしてガンガン回していると100円、200円かかってきます。
そして、GPT-4のはコンテクストがでけぇので、やろうと思えばたくさん入ります。128k context(128000文字くらい=文庫本より多いくらい!)入るとか言ってるし。全部入力だとすると576円、ぜんぶ出力だと倍の1200円前後です。まあ、入力のほうが多いってことが多いと思いますが、576~1000円。1回で! お昼ご飯が、買えちゃう!
いざやってみて、出力結果が良くなかったとしても、この料金は容赦なくかかります。
なお、RAGのためのembeddingはちょー安い。
補足
あれ? ChatGPTって無料で使えなかったっけ?
ややこしいところですが、WebサービスのChatGPTと、OpenAIのAPIがあります。
今回の話は、GPTモデルのAPI料金についてです。APIは、「何かプロダクト作って、組み込むほうはこちら」って感じです。
ChatGPTには、有料版と無料版があり、有料版のChatGPT Plusは固定20ドルです。
いっぽう、APIのほうは従量課金です。
(ほか、GPTモデルを使用するルートとしては、Azure OpenAI Serviceなどがあります。)
ドル払いなんだっけ?
OpenAIへの支払いは、ドル払いです。
今は円安ですので高くついていると思います。うに、いくら、GPT、時価。
ちゃんと数えるとぜんぜん1文字1トークンではないよ!
トークンはLLMで処理するときの文章の分割単位です。LLMによってトークンわけの基準が違います。
OpenAIのGPT-3.5かGPT-4のtokenizerはこれです。
執筆途中の本記事を突っ込むと、Charactersが3337で、Tokensが1,724でし。なんてこった、全然1文字1トークンではない!
いやぁ……、すごく幅があるんですよね。
例えば、英語だと、
I am cat.
で4トークン。
日本語だと、
私は猫。
で、文字数自体は少ないのに、6トークン。
英語よりも、日本語のほうが不利だといわれています。
漢字の部分は、トークンの消費が激しいです。この記事はやや砕けた口調で、あまりトークンを消費しない英語部分もあるので少なく出ましたが、いつものテンションだと1文字1トークンくらいという感触です。
通常の日本語文章では、1000文字は1000トークンいかないという感覚ですが、ざっくりと1000トークン=1000文字で計算しました。
真剣に数えたいときは、tokenizerを使ってちゃんと調べてね。おわり。