やってみた
PCにあるたくさんの画像を分類したくなったので、画像解析AIをちょっと試してみました。
自分の画像を世界に晒すのはなんなので、本記事内での検証は写真AC様の画像をお借りして実施しました。
画像解析AI
すぐにトライできそうなのはこの辺りです。
名称 | 会社名 | 概要 |
---|---|---|
Google Cloud Vision | ローカル画像を英語で解析可能 準備が比較的簡単 | |
Amazon Rekognition | Amazon | 英語で解析可能 ローカル画像もOK |
A3RT Image Search API | リクルート | リモート画像URLをパラメータに設定すれば日本語で解析可能 |
Computer Vision | マイクロソフト | リモートでもローカル画像でも英語であれば解析可能 |
Einstein Vision | Salesforce | 英語で解析可能 Herokuで動かせるサンプルアプリあり |
Google Cloud Vision を試してみる
画像を分類したい、つまり画像からキーワードを抽出したい。本当は日本語で抽出したかったのですがいいけど、まずは英語で試すことにしました。
APIを使用するための準備
APIの使い方
エンドポイント… https://vision.googleapis.com/v1/images:annotate
メソッド: GET
パラメータ | 内容 | 例 |
---|---|---|
key | 事前準備で受け取ったAPIキー | xxxxxxxxxxxx |
手っ取り早くGUIで確認してみる
Try the APIでどんなテキストが引けるか試してみます
野天風呂
屋根付き露天風呂
和室1
和室2
イタリアン
お寿司
結果まとめ
実績のあるGoogleだけに、思っていた以上に適切に判断されていました。「野天風呂」で「Hot Spring」がありました。「屋根付き露天風呂」の「House」辺りは屋根から判断されているのだと思います。
和室については流石に「Japanese-style room」とはなりませんでしたが「Room」はありましたので分類することはできそうです。
イタリアンについては「Food」は当然として「Chinese Food」「Thai Food」「Spaghetti」辺りが抽出できましたので、食事という判断はできますね。お寿司については「Sushi」が抽出されましたので完璧です。
このレベルであれば、Google Cloud Vision 処理後、翻訳をかければ自動的に振りわけられそうです。
同じ画像を使って、他のAPIについても今後試してみたいと思います。