Google Cloud Vision API を使う準備をする

  • 16
    いいね
  • 0
    コメント
この記事は最終更新日から1年以上が経過しています。

Cloud Vision API(β)とは

https://cloud.google.com/vision/?hl=ja

Cloud Vision API とは、Googleが提供している画像解析APIです。
画像情報つけてリクエストをすると、その画像に関する情報をJSON形式で返してくれます。

ドキュメントはこちらです(今のところ英語のみ)
https://cloud.google.com/vision/docs/?hl=ja

できること

  • LABEL_DETECTION : 物体検知
    画像に含まれる物体を検知し、乗り物から動物まで多数のカテゴリの中から分類できます。

  • SAFE_SEARCH_DETECTION : 有害コンテンツ検知
    画像に含まれるアダルト コンテンツや暴力コンテンツのような有害コンテンツを検知します。

  • LOGO_DETECTION : ロゴ検知
    画像に含まれるポピュラーな商品や企業のロゴを検知します。

  • LANDMARK_DETECTION : ランドマーク検知
    画像に含まれるポピュラーな自然構造物や人工構造物を検知します。

  • TEXT_DETECTION : OCR
    画像に含まれるテキストを認識して抽出します。幅広い言語に対応し、言語の自動判定も可能です。

  • FACE_DETECTION : 顔検知
    画像に映る複数の人物の顔を検知し、感情の状態や帽子類の着用といった顔の主な属性も識別します。
    ただし、個人の認識には対応していません。

  • IMAGE_PROPERTIES

Cloud Vision API をプロジェクトで有効にする

課金について

Cloud Vision API は課金されるプロダクトです。
現在β版ですが、リミットを超えると課金が発生します。
そのため利用するには有効な請求先アカウントを Cloud Vision API を利用するプロジェクトに関連付けておくことが利用条件となっています。

課金の単位はリクエスト数ではなく、ユニット数になります。
例えば、LABEL_DETECTION と LANDMARK_DETECTION を同じ画像について一つのリクエストに含めた場合、LABEL_DETECTION で1ユニット、LANDMARK_DETECTION で1ユニットとカウントされます。
# 画像データの大きさでないところは太っ腹ですね :smiley:

課金が発生するLimitや詳細な金額については下記をご確認ください。
https://cloud.google.com/vision/docs/pricing?hl=ja#prices
※現在のところは、1000ユニット/月までは無料です。

API をプロジェクトで有効にする

APIをプロジェクトで有効にする方法は以下のとおりです。

  1. Cloud Vision API を利用したいプロジェクトを作成し、請求先アカウントを関連付けておきます。 詳細はコチラをご確認ください。
  2. Cloud Vision API を利用したいプロジェクトを開きます。
    https://console.developers.google.com/
  3. 左上の部分をクリックすると表示されるメニューから「API Manager」をクリックします。
    左側のメニュー

  4. Cloud Vision API を検索します。見つかったら、API名をクリックして詳細を開きます。
    APIの検索

  5. Cloud Vision API を有効にします。

    APIを有効にする

【豆知識】 APIの割り当て

API Manager では「割り当て」のところで、そのAPIの上限をユーザーが自由に下げることが出来ます。
APIの割り当て
例えば課金させたくない場合に、課金される数以上にはならないように上限を下げて設定してしまうことも可能です。
割り当ての変更
逆に、デフォルトで設定されているものよりも上限をあげたい場合は、Googleへの申請が必要なので「割り当ての増加を申し込む」を行ってください。

API認証キーを作成する

プロジェクトに紐づくAPI認証キーを作成します。

注意:
API認証キーは Cloud Vision API だけのものではなく、そのプロジェクトで有効なAPIについて全て利用できるものです。
取り扱いには十分注意しましょう。

  1. API Manager の「認証情報」をクリックします。
    認証情報

  2. 「認証情報を作成」をクリックして、「APIキー」をクリック
    APIキー

  3. 「ブラウザキー」をクリック
    ブラウザキー

  4. 「ブラウザAPIキーの作成」というダイアログが表示されるので、名前を指定して、「作成」をクリックしてください。
    名前は管理者が区別しやすい名前で構いません。
    本来はリファラーを設定すべきですが、今回はテスト用なので割愛します。
    テストが終わったら削除するようにしてください。
    ブラウザAPIキーの作成

これでAPIキーが作成されました。

Google Chrome ブラウザで API をテストできるようにする

公式ドキュメントの "Getting Started"では、cURLコマンドとBase64コマンドを利用しますが、今回は初心者向けということでお手軽にリクエストできるようにしたいと思います。
以下のChromeアプリやChrome Extentionを入れておきましょう。

Postman

https://chrome.google.com/webstore/detail/postman/fhbjgbiflinjbdggehcddcbncdddomop
Postman は お手軽にHTTPリクエストを行えるChromeアプリです。
OAuth 2.0 にも対応しています。
本来は、Google が公式で用意してくれており、API Manager からもリンクされている Google APIs Explorer でできるのですが、リクエストを保存しておけるのと、レスポンスヘッダーが見えるので利用しています。
Postmanのセキュリティについては下記に詳しく記載されているので確認してみてください。
https://www.getpostman.com/docs/security

copy-base64

https://chrome.google.com/webstore/detail/copy-base64/obeffifkdkfbpodhaoelcjdljgiapjnl
Cloud Vision API では画像をBase64にエンコードした文字列を利用してリクエストを行います。
このChrome拡張機能は画像を右クリックするとBase64エンコードした文字列をクリップボードにコピーしてくれます。