Pollinations.AI API 詳細情報（2025/11/11)

Last updated at 2025-11-10Posted at 2025-11-09

# Pollinations.AI API詳細情報(2025/11/11)

📊 概要

Pollinations.AIは21種類の独立したAIモデルを提供する包括的なマルチモーダルAPIプラットフォームです。

画像生成: 3モデル
テキスト生成: 17モデル
音声生成: 1モデル（13種類の音声バリエーション）
動画生成: 公式APIでは現在非対応（実験的機能として過去に存在）

🔧 モデル選択方法

画像生成API

GET https://image.pollinations.ai/prompt/{prompt}?model={モデル名}

例:

# Fluxモデル（デフォルト）
https://image.pollinations.ai/prompt/beautiful%20sunset

# Kontextモデル（画像編集）
https://image.pollinations.ai/prompt/bake_a_cake?model=kontext&image=https://example.com/logo.png

# Turboモデル（高速生成）
https://image.pollinations.ai/prompt/quick%20sketch?model=turbo

パラメータ:

model: flux（デフォルト）/ kontext / turbo
width: 幅（デフォルト1024）
height: 高さ（デフォルト1024）
seed: 再現性のためのシード値
nologo: ロゴ非表示（登録ユーザー）
enhance: プロンプト自動強化

テキスト生成API

GET方式（シンプル）

GET https://text.pollinations.ai/{prompt}?model={モデル名}

例:

# OpenAI GPT-5 Nano（デフォルト）
https://text.pollinations.ai/Hello%20AI

# DeepSeek V3.1
https://text.pollinations.ai/Explain%20quantum%20physics?model=deepseek

# Gemini 2.5 Flash
https://text.pollinations.ai/Summarize%20this?model=gemini

# Mistral Small 3.2
https://text.pollinations.ai/Write%20code?model=mistral

パラメータ:

model: openai / deepseek / gemini / mistral など
seed: シード値
temperature: ランダム性（0.0-3.0）
system: システムプロンプト
json: JSON形式出力（true/false）
stream: ストリーミング出力（true/false）

POST方式（高度な機能）

POST https://text.pollinations.ai/openai
Content-Type: application/json

{
  "model": "モデル名",
  "messages": [
    {"role": "system", "content": "システムプロンプト"},
    {"role": "user", "content": "ユーザーメッセージ"}
  ],
  "temperature": 0.7,
  "stream": false
}

対応モデル: openai, deepseek, gemini, mistral, openai-large, openai-reasoning など全17モデル

音声生成API（TTS）

GET https://text.pollinations.ai/{text}?model=openai-audio&voice={音声名}

例:

# Nova音声で読み上げ
https://text.pollinations.ai/Hello%20world?model=openai-audio&voice=nova

# Echo音声
https://text.pollinations.ai/Welcome?model=openai-audio&voice=echo

利用可能な音声: alloy, echo, fable, onyx, nova, shimmer, coral, verse, ballad, ash, sage, amuch, dan

音声認識（STT）

POST方式でbase64エンコードされた音声データを送信:

{
  "model": "openai-audio",
  "messages": [
    {
      "role": "user",
      "content": [
        {"type": "text", "text": "Transcribe this:"},
        {
          "type": "input_audio",
          "input_audio": {
            "data": "base64_audio_string",
            "format": "wav"
          }
        }
      ]
    }
  ]
}

🖼️ 画像生成モデル（3種類）

1. Flux ⭐ デフォルト

アーキテクチャ: 12億パラメータ
性能:
- Midjourney v6.0、DALL·E 3を上回る画像品質
- プロンプト忠実度97.3%
- 人体解剖学（特に手と顔）の高精度レンダリング
- 画像内テキストの明瞭な生成
ベンチマーク:
- ELOスコアでMidjourneyを上回る
- 2.86秒/画像（最適化時）
- コスト効率: 992-5,243画像/$
選択方法: model=flux（省略可、デフォルト）
用途: 高品質な商業利用、マーケティング素材

2. Kontext

特徴: 画像から画像への生成/編集専用
機能: 既存画像の変換、スタイル転送
選択方法: model=kontext&image={画像URL}
用途: 画像編集、ロゴ変換、既存素材の再利用

3. Turbo

特徴: 高速生成に特化
性能: Fluxより高速だが品質はやや劣る
選択方法: model=turbo
用途: 大量生成、プロトタイピング

📝 テキスト生成モデル（17種類）

メインモデル

1. deepseek (DeepSeek V3.1) 🔥

エイリアス: deepseek-v3, deepseek-reasoning, deepseek-r1-0528
アーキテクチャ: 671B MoEモデル（37Bアクティブパラメータ）
性能:
- 数学: AIME 2024で79.8%（OpenAI o1の79.2%を上回る）
- コーディング: SWE-bench Verified 66.0%（R1-0528版）
- MATH-500: 97.3%
- 医療診断タスクでGPT-4oと同等以上
コスト: GPT-4oの約1/6.5
特徴: 推論能力特化、ツール対応、128Kコンテキスト
選択方法: model=deepseek
用途: 複雑な推論タスク、数学・コーディング支援

2. gemini (Gemini 2.5 Flash Lite)

エイリアス: gemini-2.5-flash-lite
特徴: 高速レスポンス、ビジョン対応
性能: マルチモーダル理解に優れる
選択方法: model=gemini
用途: リアルタイムチャット、画像分析

3. gemini-search

エイリアス: searchgpt, geminisearch
特徴: Google検索統合、リアルタイム情報取得
選択方法: model=gemini-search または model=searchgpt
用途: 最新情報検索、ファクトチェック

4. mistral (Mistral Small 3.2 24B)

エイリアス: mistral-small-3.2-24b-instruct-2506
性能: 効率的な24Bモデル
特徴: ツール対応、高速推論
選択方法: model=mistral
用途: 一般的なタスク、API統合

5. openai (GPT-5 Nano) ⭐

エイリアス: gpt-5-mini
性能:
- SWE-bench Verified: 74.9%
- Aider Polyglot: 88%
- AIME 2025: 94.6%（toolsなし）
- MMMU: 84.2%
コスト: GPT-4oの50%削減
価格: $0.15/$1.50 per 1M tokens
特徴: ビジョン対応、256Kコンテキスト、最大入力7000文字
選択方法: model=openai（デフォルト）
用途: 汎用タスク、コスト効率重視

6. openai-audio (GPT-4o Mini Audio) 🎙️

エイリアス: gpt-4o-mini-audio-preview
音声: alloy, echo, fable, onyx, nova, shimmer, coral, verse, ballad, ash, sage, amuch, dan（13種類）
機能:
- テキスト読み上げ（TTS）
- 音声認識（STT）
- ビジョン対応
選択方法: model=openai-audio&voice={音声名}
用途: 音声アシスタント、アクセシビリティ

7. openai-fast (GPT-4.1 Nano)

エイリアス: gpt-5-nano
特徴: 最高速度、エッジ最適化
性能: GPT-5 Miniの約半分の性能で半分のコスト
コスト: $0.15/$1.50 per 1M tokens
最大入力: 5000文字
選択方法: model=openai-fast
用途: リアルタイムアプリ、大量処理

8. openai-large (GPT-4.1)

エイリアス: gpt-5-chat
性能: GPT-5と同等クラス
特徴: 10K最大入力文字、ビジョン対応
選択方法: model=openai-large
用途: 複雑なタスク、エンタープライズ利用

9. openai-reasoning (o4 Mini) 🧠

エイリアス: o4-mini
特徴:
- 推論特化型
- reasoning_effortパラメータ対応（low〜high）
- システムメッセージ非対応
性能: 深い思考プロセス、高精度推論
選択方法: model=openai-reasoning
用途: 複雑な論理タスク、多段階推論

10. qwen-coder (Qwen 2.5 Coder 32B)

エイリアス: qwen2.5-coder-32b-instruct
特徴: コーディング特化型
選択方法: model=qwen-coder
用途: プログラミング支援、コード生成
Tier: Flower（上位tier必要）

11. roblox-rp (Llama 3.1 8B)

エイリアス: llama-roblox, llama-fast-roblox
特徴: 軽量高速モデル
選択方法: model=roblox-rp
用途: カジュアルチャット、ロールプレイ

コミュニティモデル（6種類）

12. bidara (NASA開発)

正式名: Biomimetic Designer and Research Assistant
特徴: 生体模倣設計、ビジョン対応
選択方法: model=bidara
用途: 研究支援、科学的デザイン

13. chickytutor

特徴: 言語学習特化型（chickytutor.com）
選択方法: model=chickytutor
用途: 語学教育、チューター支援

14. evil ⚠️

特徴: 無検閲モデル、ビジョン対応
注意: 制限なし応答
選択方法: model=evil
用途: 創作活動（責任ある使用が必要）

15. midijourney

特徴: 音楽生成関連
選択方法: model=midijourney
用途: MIDI作曲支援

16. rtist

特徴: アート創作支援
選択方法: model=rtist
用途: クリエイティブライティング

17. unity ⚠️

正式名: Unity Unrestricted Agent
特徴: 無検閲、ビジョン対応
選択方法: model=unity
用途: ゲーム開発支援（制限なし対話）

🎙️ 音声生成

openai-audio（13種類の音声）

モデル: GPT-4o Mini Audio Preview
対応音声:
- 標準: alloy, echo, fable, onyx, nova, shimmer
- 拡張: coral, verse, ballad, ash, sage, amuch, dan
機能:
- TTS（テキスト→音声）: GET/POSTで利用可能
- STT（音声→テキスト）: POSTのみ、base64エンコード
- ビジョン対応
形式: MP3出力、WAV/MP3入力
最大入力: 5000文字
選択方法:
- TTS: model=openai-audio&voice={音声名}
- STT: POST with "model": "openai-audio"
用途: ボイスアシスタント、ポッドキャスト、教育コンテンツ

🎬 動画生成について

現状（2025年11月時点）

公式APIでは動画生成エンドポイントは提供されていません。

過去の実験的機能

以下のモデルが実験的に存在していましたが、現在の公式APIドキュメントには記載なし:

Stable Diffusion Animation
- 機能: 複数画像をスライドショー形式のアニメーションに変換
- 最大15フレーム/プロンプト
- 出力サイズ: 512×512固定
Photo3DWillit (Photo3D)
- 機能: 2D画像を3D動画に変換
- 没入感のある3D視覚体験
その他の動画関連モデル（Replicate等で言及）:
- Tune-A-Video: テキストから動画への1ショットチューニング
- AMT: 動画スムージング
- RIFE Video Interpolation: フレーム補間
- Stable Diffusion Dance: 音楽同期ビジュアル生成
- Lucid Sonic Dreams: GAN生成ビジュアルと音楽の同期

現在の動画生成の代替手段

画像シーケンス生成: Fluxで複数画像を生成し、外部ツールで動画化
コミュニティプロジェクト: Pollinations APIを使った動画生成アプリが複数存在
サードパーティ統合: Replicate等のプラットフォームで過去のモデルが利用可能

将来の展望

GitHubリポジトリによると、以下が開発中または計画中:

Music Video Generation: AI生成ビジュアルと音楽の統合
3D Environments: 完全没入型3D環境生成
Dreamachine: リアルタイムAIビジュアル体験

注意: 動画生成機能を使用したい場合は、Pollinations.AIのGitHub/Discord/YouTubeで最新情報を確認することを推奨します。

📈 性能比較サマリー

トップパフォーマー

コーディング

openai (GPT-5): 74.9% (SWE-bench)
deepseek: 66.0%
openai-large: 上位クラス

数学/推論

openai (GPT-5): 94.6% (AIME 2025)
deepseek: 97.3% (MATH-500)
openai-reasoning (o4): 高精度推論

画像生成

flux: 業界最高水準、Midjourney超え
kontext: 画像編集特化
turbo: 速度重視

コスト効率

openai-fast: $0.15/$1.50/1M tokens
deepseek: 高性能で低コスト
openai: バランス型

💡 推奨用途別モデル選択

開発者向け

汎用API: openai - バランス型
複雑な推論: deepseek, openai-reasoning
高速処理: openai-fast, mistral
コーディング: openai, qwen-coder

クリエイター向け

高品質画像: flux
高速画像: turbo
画像編集: kontext
音声コンテンツ: openai-audio（13音声）
テキスト創作: openai, rtist

企業向け

エンタープライズ: openai-large, deepseek
検索統合: gemini-search
医療/専門分野: deepseek
コスト最適化: openai-fast, mistral

研究・教育向け

科学研究: bidara (NASA)
語学教育: chickytutor
一般教育: openai, gemini
数学: deepseek, openai-reasoning

🔑 重要な技術的特徴

共通機能

ツール対応: ほぼ全モデルがFunction Calling対応
ビジョン: 主要モデルが画像入力対応
ストリーミング: SSE形式のリアルタイム応答
コンテキスト: 最大128K-256Kトークン

特殊機能

推論制御: reasoning_effortパラメータ（GPT-5, DeepSeek系）
音声処理: 双方向音声変換（openai-audio）
検索統合: リアルタイムWeb検索（gemini-search）
画像編集: 既存画像変換（kontext）

📊 詳細ベンチマーク

数学能力

AIME 2025: openai (94.6%) > deepseek R1 (87.5%)
MATH-500: deepseek (97.3%) > openai (96.4%)

コーディング能力

SWE-bench: openai (74.9%) > deepseek (66.0%)
Aider Polyglot: openai (88%)

画像品質

プロンプト忠実度: flux > Midjourney v6 > DALL·E 3
人体解剖: flux（業界最高）
テキスト生成: flux（明瞭な文字）

コスト効率

画像: 992-5,243画像/$ (flux)
テキスト: $0.15/1M入力 (最安: openai-fast)
deepseek: GPT-4oの約15%のコスト

🔐 認証とレート制限

認証方法

1. Referrer認証（フロントエンド推奨）

Webアプリケーションから直接APIを呼び出す場合に最適です。

方法A: 自動送信（推奨）

// ブラウザが自動的にRefererヘッダーを送信
fetch('https://image.pollinations.ai/prompt/beautiful%20sunset')

方法B: 明示的指定

# URLパラメータとして追加
https://text.pollinations.ai/Hello?referrer=myapp.com

登録方法:

auth.pollinations.ai にアクセス
"Referrers"セクションでドメインを登録（例: myapp.com, username.github.io）
登録後、そのドメインからのリクエストは自動的に認証される

2. Token認証（バックエンド推奨） 🔑

サーバーサイド、スクリプト、CLIツールに最適です。

トークンの取得:

auth.pollinations.ai にアクセス
"Token"セクションで"(Re)generate Token"をクリック
生成されたトークンを安全な場所にコピー

⚠️ セキュリティ注意事項:

トークンを公開しないこと
GitHubリポジトリにコミットしないこと
.envファイルで管理すること

使用方法（3つの方法）:

方法A: URLパラメータ（GET/POST両方）

# 画像生成
curl "https://image.pollinations.ai/prompt/sunset?token=YOUR_TOKEN"

# テキスト生成（GET）
curl "https://text.pollinations.ai/Hello?token=YOUR_TOKEN"

# テキスト生成（POST）
curl "https://text.pollinations.ai/openai?token=YOUR_TOKEN" \
  -H "Content-Type: application/json" \
  -d '{"model":"openai","messages":[{"role":"user","content":"Hello"}]}'

方法B: Authorization Header（推奨）

# Bearer認証（最も標準的）
curl "https://text.pollinations.ai/openai" \
  -H "Authorization: Bearer YOUR_TOKEN" \
  -H "Content-Type: application/json" \
  -d '{"model":"openai","messages":[{"role":"user","content":"Hello"}]}'

# 画像生成
curl "https://image.pollinations.ai/prompt/sunset" \
  -H "Authorization: Bearer YOUR_TOKEN"

方法C: Request Body（POSTのみ）

curl "https://text.pollinations.ai/openai" \
  -H "Content-Type: application/json" \
  -d '{
    "token": "YOUR_TOKEN",
    "model": "openai",
    "messages": [{"role":"user","content":"Hello"}]
  }'

各言語での実装例:

Python:

import requests

# URLパラメータ方式
response = requests.get(
    "https://text.pollinations.ai/Hello",
    params={"token": "YOUR_TOKEN"}
)

# Authorization Header方式（推奨）
headers = {
    "Authorization": "Bearer YOUR_TOKEN",
    "Content-Type": "application/json"
}
payload = {
    "model": "openai",
    "messages": [{"role": "user", "content": "Hello"}]
}
response = requests.post(
    "https://text.pollinations.ai/openai",
    headers=headers,
    json=payload
)

JavaScript/Node.js:

// Authorization Header方式
const response = await fetch('https://text.pollinations.ai/openai', {
  method: 'POST',
  headers: {
    'Authorization': 'Bearer YOUR_TOKEN',
    'Content-Type': 'application/json'
  },
  body: JSON.stringify({
    model: 'openai',
    messages: [{role: 'user', content: 'Hello'}]
  })
});

// URLパラメータ方式（GET）
const imageUrl = 'https://image.pollinations.ai/prompt/sunset?token=YOUR_TOKEN';

環境変数を使用した安全な管理:

# .env ファイル
POLLINATIONS_TOKEN=your_actual_token_here

# Pythonでの使用
import os
from dotenv import load_dotenv

load_dotenv()
token = os.getenv('POLLINATIONS_TOKEN')

headers = {
    "Authorization": f"Bearer {token}"
}

Tierとレート制限

Tier	レート制限（画像）	レート制限（テキスト）	モデルパック
anonymous	15秒	3秒	Limited
Seed	5秒	より高速	Standard
Flower	3秒	さらに高速	Advanced
Nectar	なし	なし	Advanced

登録: auth.pollinations.ai

⚠️ 注意事項

無検閲モデル

evil, unityは制限のない応答を生成します。倫理的・法的責任を理解した上で使用してください。

コミュニティモデル

コミュニティモデルは公式モデルより検証が少ない場合があります。本番環境での使用前に十分なテストを推奨します。

2025年3月31日以降の変更

画像生成: Pollinations.AIロゴが表示される場合あり（nologo=trueで無効化、登録ユーザーのみ）
テキスト生成: pollinations.aiへのリンクが含まれる場合あり

動画生成

現時点で公式APIでは非対応。将来的に実装予定の可能性あり。

🎯 結論

Pollinations.AIは、単一APIで21種類の最先端AIモデルにアクセスできる包括的なプラットフォームです。

主な強み

✅ 多様性: 画像・テキスト・音声を統合
✅ 性能: 各分野でトップクラスのモデルを提供
✅ コスト: 競合より大幅に低価格
✅ 柔軟性: URLパラメータで簡単にモデル選択
✅ オープン性: コミュニティモデルも統合
✅ シンプル: API Key不要、匿名利用可能

推奨戦略

プロトタイピング: turbo（画像）、openai-fast（テキスト）
本番環境: flux（画像）、openai/deepseek（テキスト）
専門タスク: 用途特化モデル（qwen-coder等）
コスト最適化: openai-fast系でテスト、必要に応じてアップグレード

クイックスタート

# 画像生成（Flux）
curl "https://image.pollinations.ai/prompt/beautiful%20sunset"

# テキスト生成（GPT-5 Nano）
curl "https://text.pollinations.ai/Hello%20AI"

# 音声生成（Nova音声）
curl "https://text.pollinations.ai/Welcome?model=openai-audio&voice=nova" > audio.mp3

# モデル一覧取得
curl "https://image.pollinations.ai/models"
curl "https://text.pollinations.ai/models"

📚 参考リンク

公式サイト: https://pollinations.ai
APIドキュメント: https://github.com/pollinations/pollinations/blob/master/APIDOCS.md
認証設定: https://auth.pollinations.ai
GitHub: https://github.com/pollinations/pollinations
Discord: コミュニティサポート
React Hooks: https://react-hooks.pollinations.ai

最終更新: 2025年11月9日
情報源: Pollinations.AI 公式APIドキュメント、各種ベンチマーク結果、GitHub

You get articles that match your needs
You can efficiently read back useful information
You can use dark theme

What you can do with signing up