はじめに
今まで、ChatGPT の中でしか使えなかった新しい画像生成機能が、API経由でも利用できるようになったので、さっそく試してみました。
GPT Image API とモデルの情報
以下が、その API軽油での画像生成という話に関する、公式のヘルプセンターのページです。
●GPT Image API | OpenAI Help Center
https://help.openai.com/en/articles/11128753-gpt-image-api
新API「GPT Image API」について書かれた上記の公式ページを見ると、冒頭の部分ではプロンプトと生成された画像の例が掲載されており、この画像生成でできることをざっと知ることができます。
過去のモデルとの違い
先ほどのヘルプセンターのページの中で、下のほうを見ていくと、以下のように過去のモデルとの違い・使い分けについても書かれていました。
「GPT Image」については、「生成と編集ができ、高品質な画像の生成・背景透過などが可能」といった説明が書いてあります。
モデルの情報
モデルのページ( https://platform.openai.com/docs/models/gpt-image-1 )を見てみると、価格の情報が以下のようなフォーマットで掲載されていました。
API利用時の制約
この GPT Image API を利用するにあたって、ちょっと前に以下の記事に書いた「API Organization Verification」が必要になりそうでした。
●OpenAI の o3 の API の利用条件【公式情報より】: Tier が 1〜3 の場合は「API Organization Verification」が必要 - Qiita
https://qiita.com/youtoy/items/7e7807d7af704154eb67
例えば自分の場合は、公式のプレイグラウンドで画像生成の API を試す画面を開いた時に、以下の Verification(認証)を促す画面が出ました。
この認証の話は、記事の最後のところで少し触れようと思います。
なお、この記事は上記の認証を済ませた後に進めた手順になります。
公式情報を見つつ API を試す
この後の部分は、以下の公式の情報を見つつ API を試していきます。
以下は英語の公式ページですが、もし日本語の情報を見たい場合は npakaさんの記事など、日本語で書かれた記事を見てみると良いかもしれません。
●Image generation - OpenAI API
https://platform.openai.com/docs/guides/image-generation?image-generation-model=gpt-image-1
API の使い方
Generate Images の部分を見てみると、画像生成のためのコードサンプルや生成される画像が掲載されています。
掲載されているコードは以下の通りです。
今回利用するモデル名は「gpt-image-1」になるようです。
import OpenAI from "openai";
import fs from "fs";
const openai = new OpenAI();
const prompt = `
A children's book drawing of a veterinarian using a stethoscope to
listen to the heartbeat of a baby otter.
`;
const result = await openai.images.generate({
model: "gpt-image-1",
prompt,
});
// Save the image to a file
const image_base64 = result.data[0].b64_json;
const image_bytes = Buffer.from(image_base64, "base64");
fs.writeFileSync("otter.png", image_bytes);
さらにページの下を見ていくと、他のサンプルも掲載されています。
その中には、「png・webp での背景透過」を実現するコードサンプル(Transparency という項目の部分)もありました。
そこに掲載されているコードサンプルは、以下のとおりです。
import OpenAI from "openai";
import fs from "fs";
const openai = new OpenAI();
const result = await openai.images.generate({
model: "gpt-image-1",
prompt: "Draw a 2D pixel art style sprite sheet of a tabby gray cat",
size: "1024x1024",
background: "transparent",
quality: "high",
});
// Save the image to a file
const image_base64 = result.data[0].b64_json;
const image_bytes = Buffer.from(image_base64, "base64");
fs.writeFileSync("sprite.png", image_bytes);
上記の中で、以下の部分で背景透過を指定しています。
その前後は、画像のサイズ・画像品質を指定するオプションのようです。
size: "1024x1024",
background: "transparent",
quality: "high",
API を試してみる: 公式サンプル通り
それでは「GPT Image API(gpt-image-1)」を実際に試していきます。
過去に使っていたライブラリのアップデート
今回、ちょっと前に API を試した時(o3・o4-mini を試した時)の環境を再利用することにました。
npm outdated
でライブラリのバージョンを確認したところ、最新版が出ていたので npm update
で公式の TypeScript・JavaScript ライブラリをアップデートしました。
APIキーの準備
あと OpenAI の APIキーを、環境変数「OPENAI_API_KEY」として使えるようにしておきます。
公式サンプル通りのお試し
まずは、上記の公式サンプル 2つをそのまま試してみました。
その結果、1つ目のお試しで以下の左側の画像が、2つ目のお試しで右側の画像を得ることができました。
API を試してみる: その2
プロンプトを変更した内容で試してみます。
シンプルな画像生成
最初に試した 2つのうち、1つ目にあたる画像生成です。
基本的にプロンプトを書きかえただけという内容ですが、以下のコードを使いました。
import OpenAI from "openai";
import fs from "fs";
const openai = new OpenAI();
const prompt = `
炎のドラゴンと氷のドラゴンが、闇の世界の城で
戦っている様子のファンタジー世界のピクセルアート
`;
const result = await openai.images.generate({
model: "gpt-image-1",
prompt,
});
const image_base64 = result.data[0].b64_json;
const image_bytes = Buffer.from(image_base64, "base64");
fs.writeFileSync("ピクセルアート.png", image_bytes);
上記を 2回実行してみて、それぞれ得られた画像は以下のとおりです。
https://x.com/youtoy/status/1915368392468599247
似てはいますが、異なる内容のものを得られました。
背景透過のスプライト
最初に試した 2つのうち、2つ目にあたる画像生成です。
また今度も、基本的にプロンプトを書きかえただけという内容ですが、以下のコードを使いました。
import OpenAI from "openai";
import fs from "fs";
const openai = new OpenAI();
const prompt = `
2Dのピクセルアートのスプライトシートを作って。
絵柄は剣と盾を持って、ローブを身にまとった勇者。
`;
const result = await openai.images.generate({
model: "gpt-image-1",
prompt: prompt,
size: "1024x1024",
background: "transparent",
quality: "high",
});
const image_base64 = result.data[0].b64_json;
const image_bytes = Buffer.from(image_base64, "base64");
fs.writeFileSync("スプライト画像.png", image_bytes);
そして、得られた結果は以下のとおりです。
「剣と盾を持って、ローブを身にまとった」という内容を満たしたものが出てきました。
(そもそも、このプロンプトでの見た目の指定だと、勇者っぽさの有無は判断できない感じかと思うので、そこは気にしないことにしました)
最初のサンプル通りのコードで試した時と比べると、スプライトシート内の画像の数にかなりの違いが出ました。
このあたりは指定をしていなかったので、きちんと指定してやればコントロールができそうな部分かとは思われます。
API の利用履歴を確認してみる
以下の API利用履歴が見られるページで、今回のお試し後の状態を見てみました(記事内で書いた内容以外でも、API を少し使っています)。
その結果、以下のように「gpt-image-1-2025-04-23」の利用履歴が確認できました。
おわりに
今回、OpenAI の新API「GPT Image API(モデル: gpt-image-1)」を使って、画像生成を試しました。
今の内容だと API ならではという要素がないので、API経由での利用という部分を活用した内容も試せればと思います。
「API Organization Verification」について
今回使った「GPT Image API(gpt-image-1)」を利用する場合、前に記事に書いていた「API Organization Verification」が必要になりそうでした。
それを進めた話を少しだけ書いておきます。
API Organization Verification を進めた話
支払い方法の設定
API Organization Verification に関するボタンを押すと、最初は支払い方法に関するデフォルト支払い設定を行うよう促されました。
既に、過去の API課金などに使った支払い方法はアカウントに登録されていたのですが、デフォルトの支払い方法の設定がされておらず、これを行うように促されたようです。
これは、登録済みだった支払い情報を、デフォルトの支払い方法として設定するだけで終わりました。
本人確認
次は本人確認で、以下のように外部サービスを使った手順を進めるよう促されます。
以下のサービスを使う形でした。
この後は、免許証・パスポート・マイナンバーカードなど、指定された本人確認書類のうちの 1つを使った確認と、カメラを使った確認(顔をうつして、指定された方向に顔を動かすという方法のもの)を進めました。
自分は、運転免許証を使った確認を選んで進めました。
本人確認完了
その後、以下のように認証完了となりました。