0
0

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?

Pollinations.AI API 詳細情報(2025/11/11)

Last updated at Posted at 2025-11-09

# Pollinations.AI API詳細情報(2025/11/11)

📊 概要

Pollinations.AIは21種類の独立したAIモデルを提供する包括的なマルチモーダルAPIプラットフォームです。

  • 画像生成: 3モデル
  • テキスト生成: 17モデル
  • 音声生成: 1モデル(13種類の音声バリエーション)
  • 動画生成: 公式APIでは現在非対応(実験的機能として過去に存在)

🔧 モデル選択方法

画像生成API

GET https://image.pollinations.ai/prompt/{prompt}?model={モデル名}

例:

# Fluxモデル(デフォルト)
https://image.pollinations.ai/prompt/beautiful%20sunset

# Kontextモデル(画像編集)
https://image.pollinations.ai/prompt/bake_a_cake?model=kontext&image=https://example.com/logo.png

# Turboモデル(高速生成)
https://image.pollinations.ai/prompt/quick%20sketch?model=turbo

パラメータ:

  • model: flux(デフォルト)/ kontext / turbo
  • width: 幅(デフォルト1024)
  • height: 高さ(デフォルト1024)
  • seed: 再現性のためのシード値
  • nologo: ロゴ非表示(登録ユーザー)
  • enhance: プロンプト自動強化

テキスト生成API

GET方式(シンプル)

GET https://text.pollinations.ai/{prompt}?model={モデル名}

例:

# OpenAI GPT-5 Nano(デフォルト)
https://text.pollinations.ai/Hello%20AI

# DeepSeek V3.1
https://text.pollinations.ai/Explain%20quantum%20physics?model=deepseek

# Gemini 2.5 Flash
https://text.pollinations.ai/Summarize%20this?model=gemini

# Mistral Small 3.2
https://text.pollinations.ai/Write%20code?model=mistral

パラメータ:

  • model: openai / deepseek / gemini / mistral など
  • seed: シード値
  • temperature: ランダム性(0.0-3.0)
  • system: システムプロンプト
  • json: JSON形式出力(true/false)
  • stream: ストリーミング出力(true/false)

POST方式(高度な機能)

POST https://text.pollinations.ai/openai
Content-Type: application/json

{
  "model": "モデル名",
  "messages": [
    {"role": "system", "content": "システムプロンプト"},
    {"role": "user", "content": "ユーザーメッセージ"}
  ],
  "temperature": 0.7,
  "stream": false
}

対応モデル: openai, deepseek, gemini, mistral, openai-large, openai-reasoning など全17モデル


音声生成API(TTS)

GET https://text.pollinations.ai/{text}?model=openai-audio&voice={音声名}

例:

# Nova音声で読み上げ
https://text.pollinations.ai/Hello%20world?model=openai-audio&voice=nova

# Echo音声
https://text.pollinations.ai/Welcome?model=openai-audio&voice=echo

利用可能な音声: alloy, echo, fable, onyx, nova, shimmer, coral, verse, ballad, ash, sage, amuch, dan


音声認識(STT)

POST方式でbase64エンコードされた音声データを送信:

{
  "model": "openai-audio",
  "messages": [
    {
      "role": "user",
      "content": [
        {"type": "text", "text": "Transcribe this:"},
        {
          "type": "input_audio",
          "input_audio": {
            "data": "base64_audio_string",
            "format": "wav"
          }
        }
      ]
    }
  ]
}

🖼️ 画像生成モデル(3種類)

1. Flux ⭐ デフォルト

  • アーキテクチャ: 12億パラメータ
  • 性能:
    • Midjourney v6.0、DALL·E 3を上回る画像品質
    • プロンプト忠実度97.3%
    • 人体解剖学(特に手と顔)の高精度レンダリング
    • 画像内テキストの明瞭な生成
  • ベンチマーク:
    • ELOスコアでMidjourneyを上回る
    • 2.86秒/画像(最適化時)
    • コスト効率: 992-5,243画像/$
  • 選択方法: model=flux(省略可、デフォルト)
  • 用途: 高品質な商業利用、マーケティング素材

2. Kontext

  • 特徴: 画像から画像への生成/編集専用
  • 機能: 既存画像の変換、スタイル転送
  • 選択方法: model=kontext&image={画像URL}
  • 用途: 画像編集、ロゴ変換、既存素材の再利用

3. Turbo

  • 特徴: 高速生成に特化
  • 性能: Fluxより高速だが品質はやや劣る
  • 選択方法: model=turbo
  • 用途: 大量生成、プロトタイピング

📝 テキスト生成モデル(17種類)

メインモデル

1. deepseek (DeepSeek V3.1) 🔥

  • エイリアス: deepseek-v3, deepseek-reasoning, deepseek-r1-0528
  • アーキテクチャ: 671B MoEモデル(37Bアクティブパラメータ)
  • 性能:
    • 数学: AIME 2024で79.8%(OpenAI o1の79.2%を上回る)
    • コーディング: SWE-bench Verified 66.0%(R1-0528版)
    • MATH-500: 97.3%
    • 医療診断タスクでGPT-4oと同等以上
  • コスト: GPT-4oの約1/6.5
  • 特徴: 推論能力特化、ツール対応、128Kコンテキスト
  • 選択方法: model=deepseek
  • 用途: 複雑な推論タスク、数学・コーディング支援

2. gemini (Gemini 2.5 Flash Lite)

  • エイリアス: gemini-2.5-flash-lite
  • 特徴: 高速レスポンス、ビジョン対応
  • 性能: マルチモーダル理解に優れる
  • 選択方法: model=gemini
  • 用途: リアルタイムチャット、画像分析

3. gemini-search

  • エイリアス: searchgpt, geminisearch
  • 特徴: Google検索統合、リアルタイム情報取得
  • 選択方法: model=gemini-search または model=searchgpt
  • 用途: 最新情報検索、ファクトチェック

4. mistral (Mistral Small 3.2 24B)

  • エイリアス: mistral-small-3.2-24b-instruct-2506
  • 性能: 効率的な24Bモデル
  • 特徴: ツール対応、高速推論
  • 選択方法: model=mistral
  • 用途: 一般的なタスク、API統合

5. openai (GPT-5 Nano) ⭐

  • エイリアス: gpt-5-mini
  • 性能:
    • SWE-bench Verified: 74.9%
    • Aider Polyglot: 88%
    • AIME 2025: 94.6%(toolsなし)
    • MMMU: 84.2%
  • コスト: GPT-4oの50%削減
  • 価格: $0.15/$1.50 per 1M tokens
  • 特徴: ビジョン対応、256Kコンテキスト、最大入力7000文字
  • 選択方法: model=openai(デフォルト)
  • 用途: 汎用タスク、コスト効率重視

6. openai-audio (GPT-4o Mini Audio) 🎙️

  • エイリアス: gpt-4o-mini-audio-preview
  • 音声: alloy, echo, fable, onyx, nova, shimmer, coral, verse, ballad, ash, sage, amuch, dan(13種類)
  • 機能:
    • テキスト読み上げ(TTS)
    • 音声認識(STT)
    • ビジョン対応
  • 選択方法: model=openai-audio&voice={音声名}
  • 用途: 音声アシスタント、アクセシビリティ

7. openai-fast (GPT-4.1 Nano)

  • エイリアス: gpt-5-nano
  • 特徴: 最高速度、エッジ最適化
  • 性能: GPT-5 Miniの約半分の性能で半分のコスト
  • コスト: $0.15/$1.50 per 1M tokens
  • 最大入力: 5000文字
  • 選択方法: model=openai-fast
  • 用途: リアルタイムアプリ、大量処理

8. openai-large (GPT-4.1)

  • エイリアス: gpt-5-chat
  • 性能: GPT-5と同等クラス
  • 特徴: 10K最大入力文字、ビジョン対応
  • 選択方法: model=openai-large
  • 用途: 複雑なタスク、エンタープライズ利用

9. openai-reasoning (o4 Mini) 🧠

  • エイリアス: o4-mini
  • 特徴:
    • 推論特化型
    • reasoning_effortパラメータ対応(low〜high)
    • システムメッセージ非対応
  • 性能: 深い思考プロセス、高精度推論
  • 選択方法: model=openai-reasoning
  • 用途: 複雑な論理タスク、多段階推論

10. qwen-coder (Qwen 2.5 Coder 32B)

  • エイリアス: qwen2.5-coder-32b-instruct
  • 特徴: コーディング特化型
  • 選択方法: model=qwen-coder
  • 用途: プログラミング支援、コード生成
  • Tier: Flower(上位tier必要)

11. roblox-rp (Llama 3.1 8B)

  • エイリアス: llama-roblox, llama-fast-roblox
  • 特徴: 軽量高速モデル
  • 選択方法: model=roblox-rp
  • 用途: カジュアルチャット、ロールプレイ

コミュニティモデル(6種類)

12. bidara (NASA開発)

  • 正式名: Biomimetic Designer and Research Assistant
  • 特徴: 生体模倣設計、ビジョン対応
  • 選択方法: model=bidara
  • 用途: 研究支援、科学的デザイン

13. chickytutor

  • 特徴: 言語学習特化型(chickytutor.com)
  • 選択方法: model=chickytutor
  • 用途: 語学教育、チューター支援

14. evil ⚠️

  • 特徴: 無検閲モデル、ビジョン対応
  • 注意: 制限なし応答
  • 選択方法: model=evil
  • 用途: 創作活動(責任ある使用が必要)

15. midijourney

  • 特徴: 音楽生成関連
  • 選択方法: model=midijourney
  • 用途: MIDI作曲支援

16. rtist

  • 特徴: アート創作支援
  • 選択方法: model=rtist
  • 用途: クリエイティブライティング

17. unity ⚠️

  • 正式名: Unity Unrestricted Agent
  • 特徴: 無検閲、ビジョン対応
  • 選択方法: model=unity
  • 用途: ゲーム開発支援(制限なし対話)

🎙️ 音声生成

openai-audio(13種類の音声)

  • モデル: GPT-4o Mini Audio Preview
  • 対応音声:
    • 標準: alloy, echo, fable, onyx, nova, shimmer
    • 拡張: coral, verse, ballad, ash, sage, amuch, dan
  • 機能:
    • TTS(テキスト→音声): GET/POSTで利用可能
    • STT(音声→テキスト): POSTのみ、base64エンコード
    • ビジョン対応
  • 形式: MP3出力、WAV/MP3入力
  • 最大入力: 5000文字
  • 選択方法:
    • TTS: model=openai-audio&voice={音声名}
    • STT: POST with "model": "openai-audio"
  • 用途: ボイスアシスタント、ポッドキャスト、教育コンテンツ

🎬 動画生成について

現状(2025年11月時点)

公式APIでは動画生成エンドポイントは提供されていません。

過去の実験的機能

以下のモデルが実験的に存在していましたが、現在の公式APIドキュメントには記載なし:

  1. Stable Diffusion Animation

    • 機能: 複数画像をスライドショー形式のアニメーションに変換
    • 最大15フレーム/プロンプト
    • 出力サイズ: 512×512固定
  2. Photo3DWillit (Photo3D)

    • 機能: 2D画像を3D動画に変換
    • 没入感のある3D視覚体験
  3. その他の動画関連モデル(Replicate等で言及):

    • Tune-A-Video: テキストから動画への1ショットチューニング
    • AMT: 動画スムージング
    • RIFE Video Interpolation: フレーム補間
    • Stable Diffusion Dance: 音楽同期ビジュアル生成
    • Lucid Sonic Dreams: GAN生成ビジュアルと音楽の同期

現在の動画生成の代替手段

  1. 画像シーケンス生成: Fluxで複数画像を生成し、外部ツールで動画化
  2. コミュニティプロジェクト: Pollinations APIを使った動画生成アプリが複数存在
  3. サードパーティ統合: Replicate等のプラットフォームで過去のモデルが利用可能

将来の展望

GitHubリポジトリによると、以下が開発中または計画中:

  • Music Video Generation: AI生成ビジュアルと音楽の統合
  • 3D Environments: 完全没入型3D環境生成
  • Dreamachine: リアルタイムAIビジュアル体験

注意: 動画生成機能を使用したい場合は、Pollinations.AIのGitHub/Discord/YouTubeで最新情報を確認することを推奨します。


📈 性能比較サマリー

トップパフォーマー

コーディング

  1. openai (GPT-5): 74.9% (SWE-bench)
  2. deepseek: 66.0%
  3. openai-large: 上位クラス

数学/推論

  1. openai (GPT-5): 94.6% (AIME 2025)
  2. deepseek: 97.3% (MATH-500)
  3. openai-reasoning (o4): 高精度推論

画像生成

  1. flux: 業界最高水準、Midjourney超え
  2. kontext: 画像編集特化
  3. turbo: 速度重視

コスト効率

  1. openai-fast: $0.15/$1.50/1M tokens
  2. deepseek: 高性能で低コスト
  3. openai: バランス型

💡 推奨用途別モデル選択

開発者向け

  • 汎用API: openai - バランス型
  • 複雑な推論: deepseek, openai-reasoning
  • 高速処理: openai-fast, mistral
  • コーディング: openai, qwen-coder

クリエイター向け

  • 高品質画像: flux
  • 高速画像: turbo
  • 画像編集: kontext
  • 音声コンテンツ: openai-audio(13音声)
  • テキスト創作: openai, rtist

企業向け

  • エンタープライズ: openai-large, deepseek
  • 検索統合: gemini-search
  • 医療/専門分野: deepseek
  • コスト最適化: openai-fast, mistral

研究・教育向け

  • 科学研究: bidara (NASA)
  • 語学教育: chickytutor
  • 一般教育: openai, gemini
  • 数学: deepseek, openai-reasoning

🔑 重要な技術的特徴

共通機能

  • ツール対応: ほぼ全モデルがFunction Calling対応
  • ビジョン: 主要モデルが画像入力対応
  • ストリーミング: SSE形式のリアルタイム応答
  • コンテキスト: 最大128K-256Kトークン

特殊機能

  • 推論制御: reasoning_effortパラメータ(GPT-5, DeepSeek系)
  • 音声処理: 双方向音声変換(openai-audio)
  • 検索統合: リアルタイムWeb検索(gemini-search)
  • 画像編集: 既存画像変換(kontext)

📊 詳細ベンチマーク

数学能力

  • AIME 2025: openai (94.6%) > deepseek R1 (87.5%)
  • MATH-500: deepseek (97.3%) > openai (96.4%)

コーディング能力

  • SWE-bench: openai (74.9%) > deepseek (66.0%)
  • Aider Polyglot: openai (88%)

画像品質

  • プロンプト忠実度: flux > Midjourney v6 > DALL·E 3
  • 人体解剖: flux(業界最高)
  • テキスト生成: flux(明瞭な文字)

コスト効率

  • 画像: 992-5,243画像/$ (flux)
  • テキスト: $0.15/1M入力 (最安: openai-fast)
  • deepseek: GPT-4oの約15%のコスト

🔐 認証とレート制限

認証方法

1. Referrer認証(フロントエンド推奨)

Webアプリケーションから直接APIを呼び出す場合に最適です。

方法A: 自動送信(推奨)

// ブラウザが自動的にRefererヘッダーを送信
fetch('https://image.pollinations.ai/prompt/beautiful%20sunset')

方法B: 明示的指定

# URLパラメータとして追加
https://text.pollinations.ai/Hello?referrer=myapp.com

登録方法:

  1. auth.pollinations.ai にアクセス
  2. "Referrers"セクションでドメインを登録(例: myapp.com, username.github.io)
  3. 登録後、そのドメインからのリクエストは自動的に認証される

2. Token認証(バックエンド推奨) 🔑

サーバーサイド、スクリプト、CLIツールに最適です。

トークンの取得:

  1. auth.pollinations.ai にアクセス
  2. "Token"セクションで"(Re)generate Token"をクリック
  3. 生成されたトークンを安全な場所にコピー

⚠️ セキュリティ注意事項:

  • トークンを公開しないこと
  • GitHubリポジトリにコミットしないこと
  • .envファイルで管理すること

使用方法(3つの方法):

方法A: URLパラメータ(GET/POST両方)
# 画像生成
curl "https://image.pollinations.ai/prompt/sunset?token=YOUR_TOKEN"

# テキスト生成(GET)
curl "https://text.pollinations.ai/Hello?token=YOUR_TOKEN"

# テキスト生成(POST)
curl "https://text.pollinations.ai/openai?token=YOUR_TOKEN" \
  -H "Content-Type: application/json" \
  -d '{"model":"openai","messages":[{"role":"user","content":"Hello"}]}'
方法B: Authorization Header(推奨)
# Bearer認証(最も標準的)
curl "https://text.pollinations.ai/openai" \
  -H "Authorization: Bearer YOUR_TOKEN" \
  -H "Content-Type: application/json" \
  -d '{"model":"openai","messages":[{"role":"user","content":"Hello"}]}'

# 画像生成
curl "https://image.pollinations.ai/prompt/sunset" \
  -H "Authorization: Bearer YOUR_TOKEN"
方法C: Request Body(POSTのみ)
curl "https://text.pollinations.ai/openai" \
  -H "Content-Type: application/json" \
  -d '{
    "token": "YOUR_TOKEN",
    "model": "openai",
    "messages": [{"role":"user","content":"Hello"}]
  }'

各言語での実装例:

Python:

import requests

# URLパラメータ方式
response = requests.get(
    "https://text.pollinations.ai/Hello",
    params={"token": "YOUR_TOKEN"}
)

# Authorization Header方式(推奨)
headers = {
    "Authorization": "Bearer YOUR_TOKEN",
    "Content-Type": "application/json"
}
payload = {
    "model": "openai",
    "messages": [{"role": "user", "content": "Hello"}]
}
response = requests.post(
    "https://text.pollinations.ai/openai",
    headers=headers,
    json=payload
)

JavaScript/Node.js:

// Authorization Header方式
const response = await fetch('https://text.pollinations.ai/openai', {
  method: 'POST',
  headers: {
    'Authorization': 'Bearer YOUR_TOKEN',
    'Content-Type': 'application/json'
  },
  body: JSON.stringify({
    model: 'openai',
    messages: [{role: 'user', content: 'Hello'}]
  })
});

// URLパラメータ方式(GET)
const imageUrl = 'https://image.pollinations.ai/prompt/sunset?token=YOUR_TOKEN';

環境変数を使用した安全な管理:

# .env ファイル
POLLINATIONS_TOKEN=your_actual_token_here

# Pythonでの使用
import os
from dotenv import load_dotenv

load_dotenv()
token = os.getenv('POLLINATIONS_TOKEN')

headers = {
    "Authorization": f"Bearer {token}"
}

Tierとレート制限

Tier レート制限(画像) レート制限(テキスト) モデルパック
anonymous 15秒 3秒 Limited
Seed 5秒 より高速 Standard
Flower 3秒 さらに高速 Advanced
Nectar なし なし Advanced

登録: auth.pollinations.ai


⚠️ 注意事項

無検閲モデル

evil, unityは制限のない応答を生成します。倫理的・法的責任を理解した上で使用してください。

コミュニティモデル

コミュニティモデルは公式モデルより検証が少ない場合があります。本番環境での使用前に十分なテストを推奨します。

2025年3月31日以降の変更

  • 画像生成: Pollinations.AIロゴが表示される場合あり(nologo=trueで無効化、登録ユーザーのみ)
  • テキスト生成: pollinations.aiへのリンクが含まれる場合あり

動画生成

現時点で公式APIでは非対応。将来的に実装予定の可能性あり。


🎯 結論

Pollinations.AIは、単一APIで21種類の最先端AIモデルにアクセスできる包括的なプラットフォームです。

主な強み

多様性: 画像・テキスト・音声を統合
性能: 各分野でトップクラスのモデルを提供
コスト: 競合より大幅に低価格
柔軟性: URLパラメータで簡単にモデル選択
オープン性: コミュニティモデルも統合
シンプル: API Key不要、匿名利用可能

推奨戦略

  1. プロトタイピング: turbo(画像)、openai-fast(テキスト)
  2. 本番環境: flux(画像)、openai/deepseek(テキスト)
  3. 専門タスク: 用途特化モデル(qwen-coder等)
  4. コスト最適化: openai-fast系でテスト、必要に応じてアップグレード

クイックスタート

# 画像生成(Flux)
curl "https://image.pollinations.ai/prompt/beautiful%20sunset"

# テキスト生成(GPT-5 Nano)
curl "https://text.pollinations.ai/Hello%20AI"

# 音声生成(Nova音声)
curl "https://text.pollinations.ai/Welcome?model=openai-audio&voice=nova" > audio.mp3

# モデル一覧取得
curl "https://image.pollinations.ai/models"
curl "https://text.pollinations.ai/models"

📚 参考リンク


最終更新: 2025年11月9日
情報源: Pollinations.AI 公式APIドキュメント、各種ベンチマーク結果、GitHub

0
0
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
0
0

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?