0
1

More than 3 years have passed since last update.

AIで画像からテキストを引いてみた

Last updated at Posted at 2019-12-11

やってみた

PCにあるたくさんの画像を分類したくなったので、画像解析AIをちょっと試してみました。
自分の画像を世界に晒すのはなんなので、本記事内での検証は写真AC様の画像をお借りして実施しました。

画像解析AI

すぐにトライできそうなのはこの辺りです。

名称 会社名 概要
Google Cloud Vision Google ローカル画像を英語で解析可能 準備が比較的簡単
Amazon Rekognition Amazon 英語で解析可能 ローカル画像もOK
A3RT Image Search API リクルート リモート画像URLをパラメータに設定すれば日本語で解析可能
Computer Vision マイクロソフト リモートでもローカル画像でも英語であれば解析可能
Einstein Vision Salesforce 英語で解析可能 Herokuで動かせるサンプルアプリあり 

Google Cloud Vision を試してみる

画像を分類したい、つまり画像からキーワードを抽出したい。本当は日本語で抽出したかったのですがいいけど、まずは英語で試すことにしました。

APIを使用するための準備

  1. Googleアカウント作成を作成してください。
  2. 無料トライアル登録してください。
  3. プロジェクトを作成してください。
  4. プロジェクト上でAPIキーを有効化、APIキーを取得、メモしておいてください。

APIの使い方

エンドポイント… https://vision.googleapis.com/v1/images:annotate
メソッド: GET

パラメータ 内容
key 事前準備で受け取ったAPIキー xxxxxxxxxxxx

手っ取り早くGUIで確認してみる

Try the APIでどんなテキストが引けるか試してみます

野天風呂

野天風呂

屋根付き露天風呂

スクリーンショット 2019-11-15 17.33.47.png

和室1

スクリーンショット 2019-11-15 17.36.35.png

和室2

スクリーンショット 2019-11-15 17.37.31.png

イタリアン

スクリーンショット 2019-11-15 17.39.53.png

お寿司

スクリーンショット 2019-11-15 17.38.53.png

結果まとめ

実績のあるGoogleだけに、思っていた以上に適切に判断されていました。「野天風呂」で「Hot Spring」がありました。「屋根付き露天風呂」の「House」辺りは屋根から判断されているのだと思います。
和室については流石に「Japanese-style room」とはなりませんでしたが「Room」はありましたので分類することはできそうです。
イタリアンについては「Food」は当然として「Chinese Food」「Thai Food」「Spaghetti」辺りが抽出できましたので、食事という判断はできますね。お寿司については「Sushi」が抽出されましたので完璧です。
このレベルであれば、Google Cloud Vision 処理後、翻訳をかければ自動的に振りわけられそうです。
同じ画像を使って、他のAPIについても今後試してみたいと思います。

0
1
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
0
1