Google Cloud Vision APIで画像内の文字を認識してみる

Google Cloud Vision APIで画像内の文字の認識を目指します

1. Google Cloud Vision APIを使用可能にします

-Google Cloud Vision API を有効にする を参照し、Google Cloud PlatformコンソールでCloud Vision APIを使用するプロジェクトを用意し、Cloud Vision APIを有効化します

2. Google Cloud Vision APIの認証

スクリーンショット 2018-04-10 22.39.00.png

  • 「APIとサービス」画面で「認証情報」を選択します
  • 「認証情報」の画面で「サービスアカウントキー」を作成します

スクリーンショット 2018-04-10 22.39.42.png

  • 「サービスアカウントキーの作成」画面で、サービスアカウントを選択もしくは新規作成し、「JSON」形式でキーファイルを生成し、ダウンロードします。プロジェクト名-xxxxx.jsonファイルがダウンロードされます

スクリーンショット 2018-04-10 22.40.16.png

3. サンプルアプリを用意します

4. 実行環境を準備します

  • 下記のコマンドで環境変数として前々項でダウンロードしたjsonファイルを指定して認証情報を設定します
export GOOGLE_APPLICATION_CREDENTIALS=XXXXX-XXXXXXXXXXXX.json
  • ターミナルを開き、上記のファイルをダウンロード/解凍したフォルダへ移動し、
pip install -r requirements.txt

で必要な道具をインストールします

  • 下記のコマンドを実行し、対象画像ファイルに含まれる文字列を取り出します
python python-docs-samples-master/vision/cloud-client/detect/detect.py text 対象画像ファイル名

Texts:

どれみ
ふぁそら
しど
:

参考情報

  1. Google Cloud Vision API ドキュメント
Sign up for free and join this conversation.
Sign Up
If you already have a Qiita account log in.