画像認識技術の調査&Microsoft Lobe使ってみた
こんにちは iXIT株式会社 エンジニアの武見です。
switch版桃太郎電鉄がやりたいのですが肝心のswitch本体がありません。
もし買ったらゲームそっちのけで色々な場所に虫メガネを当ててみたいです。
##はじめに
最近(というかもう結構前からですが)話題になっている画像認識サービスの調査&まとめを行いました。
また、最近リリースされたMicrosoft Lobeがとても使いやすそうだったので試してみました。
##画像認識とは(おさらい)
読んで字のごとく、画像/動画の中になにが映っているのかを認識する技術です。
人間であれば猫の画像を見たとき、「猫」が画像内に写っていることを認識できますが、コンピュータに画像を渡してもただのピクセルデータでしかありません。
これを、一連の手順(前処理→学習→認識)を実施することにより、画像に「猫」が映っているとコンピュータに認識させる技術です。
##各企業サービスをざっくりいうと
上記おさらいにて、一連の手順(前処理→学習→認識)と一言で片づけてしまいましたが、これらは複雑な計算&実装が必要となりイチから作ろうとすると途方もない労力がかかってしまいます。
そこで、各企業から機械学習の専門的技術が無くとも、APIに画像や動画を渡すだけで画像分析や動画分析が簡単に行えるサービスが多数提供されています。
ここでは代表的なプラットフォームについて調査しました。
##Amazon Rekognition
https://aws.amazon.com/jp/rekognition
###課金体系
学習済みの画像認識エンジンが無償トライアルの間(AWS の無料利用枠の間)利用できます。
その後は画像量に応じてそれぞれ課金形態が変化します。
###実装について
現在使用できるプロダクトには4種類があるようです、それぞれさらに細分化されさらに詳細なAPI機能を提供しています。
・Amazon Rekognition Image
・Amazon Rekognition Custom Labels
・Amazon Rekognition Video Stored Video
・Amazon Rekognition Video Streaming Video
https://docs.aws.amazon.com/rekognition/latest/dg/API_Reference.html
##google Cloud Vision API
https://cloud.google.com/vision?hl=ja
(サイト内で画像をアップすることで簡単な動作確認ができます)
###課金体系
1,000 ユニット(1ユニット、画像1枚)内は無料。
その後は画像量に応じてそれぞれ課金形態が変化します。
###実装について
現在使用できるプロダクトには4種類があるようです。
・Vision API
・Vision Product Search
・AutoML Vision
・AutoML Vision Edg
https://cloud.google.com/vision?hl=ja#pricing
##Microsoft Computer Vision API
https://azure.microsoft.com/ja-jp/services/cognitive-services/computer-vision/
###課金体系
無料インスタンスでは、月5,000トランザクションまでは無料。
S1インスタンスでは、トランザクションごとに課金形態が変化します。
###実装について
使用できるプロダクトは1のようです、それぞれさらに細分化されさらに詳細なAPI機能を提供しています。
・Computer Vision API
https://westcentralus.dev.cognitive.microsoft.com/docs/services/computer-vision-v3-1-ga/operations/5d986960601faab4bf452005
###Microsoft その他
Microsoftには他にも同様のサービスがあるようですが割愛します。
Azure Face(顔認証に特化)
https://azure.microsoft.com/ja-jp/services/cognitive-services/face/
Microsoft Custom Vision API(独自の画像識別を構築することに特化)
https://docs.microsoft.com/ja-jp/azure/cognitive-services/custom-vision-service/
##その他のサービス
IBM Watson
https://www.ibm.com/jp-ja/watson
Salesforce Einstein Vision
https://www.salesforce.com/jp/products/einstein/features/
docomo ドコモ画像認識プラットフォーム
https://www.nttdocomo.co.jp/biz/service/dirp/
他にも色々なプラットフォームから画像認識サービスが提供されています。
##Microsoft Lobe使ってみた
各プラットフォームの画像認識サービスについて大雑把に調査してみましたが、最後にMicrosoft Lobeという画像認識サービスの体験をしてみました。
理由は簡単で、とても手軽そうだからです。
~間に合わなかったので今週土日に加筆します _| ̄|○ お許しください~