Cloud Vision APIの セーフサーチは、
画像掲示板のエログロ画像判定などに使われます
実際に使っているプロダクトも多いのではないでしょうか?
リリースノートを見ればわかるんですが、もう1年以上更新されてません
それもそのはず、使う理由がとっても薄くなりました
もうgeminiのほうが優秀で安いからです
1万件の画像をチェックする際の料金比較
Cloud Vision SafeSearch画像チェック
1000件あたり$1.5なので
1万件は$15です
gemini 3 flash previewで画像チェック
Gemini 3 Flash Preview は
入力(text / image / video): $0.50 / 1M tokens
出力(thinking含む): $3.00 / 1M tokens
Batch API: 入力 $0.25 / 1M、出力 $1.50 / 1M(ほぼ半額)
となっています
画像のトークン計算については
media_resolutionパラメータで変わる
https://docs.cloud.google.com/vertex-ai/generative-ai/docs/start/get-started-with-gemini-3?hl=ja
具体的にどの解像度ならどの値を推奨というのは書いてないんですが
HIGHなら高解像度に分析できるということが書かれている
おそらくセーフサーチ代替ならLOWでも行けるのではと思ってますがHIGHで計算します
LOW: 280 tokens
MEDIUM: 560 tokens
HIGH(実質デフォルト相当): 1120 tokens
ULTRA_HIGH: 2240 tokens
プロンプトも必要なので
入力 tokens/件 = 1120 + 120 = 1240
出力 = 20(情報量は少なくていいので、かなり小さくできるはず)
あたりで過程すると
入力: 12.4M tokens= $6.20
出力: 0.2M tokens= $0.60
合計: $6.80 / 1万件
HIGH設定でも半額以下
さらにジョブキューでBATCHにすればさらにさらに半額が見込める
gemini 3 flashでなら、コンテキストを渡してのエログロ判定ができる
さらにcloud vision APIと違ってgemini 3 flashならコンテキストが渡せる
たとえばゲームの画像掲示板であれば、ゲームのスクショの水着キャラをエロ判定してほしくないのだが、cloud vision APIだと、そういったコンテキストに関係なく点数を出してくるので、そのあたりの融通が効かない
一方、gemini 3 flashなら
このゲームタイトルの画像掲示板として相応しい画像かどうかを判定してください
というようにプロンプトが渡せる
このプロンプトで、ためしにウマ娘の水着キャラの画像を、gemini 3 flashに画像判定させてみた
ご提示いただいた画像は、ゲーム『ウマ娘 プリティーダービー』のキャラクターであるコパノリッキーのイラストです。
結論から申し上げますと、この画像は**「不適切ではない(健全な範囲の画像)」**と判断されます。
判断の理由は以下の通りです。
公式のデザイン: このイラストは、ゲーム内のSSRサポートカード「[『涼』をめぐる少女たちの恋心]コパノリッキー」に使用されている公式のイラスト(またはそれを元にしたもの)です。
露出の度合い: 水着(チャイナドレス風スイムウェア)を着用していますが、過度な性的強調や露出はなく、作品のコンセプト(健康的で明るい夏休みの風景)に沿ったものです。
ポーズと表情: 水遊びを楽しんでいる明るく快活なポーズであり、性的な意図を感じさせるものではありません。
一般的な画像掲示板やSNSにおいても、全年齢対象のコンテンツとして問題なく投稿・閲覧できるレベルのものです。
このように、たとえ水着であってもゲームキャラであればOK判断をしてくれる
精度、コスト的にもGemini 3 flashが優位です
これくらいの単純なプロンプトならThinking Level も minimalで問題ないかと思います
Cloud Vision API代替で使う場合はstructured outputをおすすめします
