#はじめに
前回、機械学習で作られた画像認識サービスのGoolge Cloud VisionとMicrosoft Computer Visionの認識結果を比較してみました。
http://qiita.com/tomohiku/items/2969db0c13582c5bc4b3
続いて、AIやデータ分析関連では最近どこの企業にいっても検討していると聞くようになったIBM Watsonファミリーの画像認識を試してみました。
どうやらIBM Watsonというブランドで提供されている画像認識は、AlchemyAPI社から買収した機能のようです。そのため、AlchemyAPI社で提供されているデモサイトで前回と同じ画像を試しました。
#使ったサービス
・IBM傘下のAlchemyAPI社 Alchemy Vision
ログインなど無しで簡単に試せるデモサイトがあったため、そちらを利用
http://vision.alchemy.ai/
いい感じ!GoogleやMicrosoftでは無かった Retriver(犬の種類)まで出てきている。
あれっ?Animal?
●3つ目●
ん?
・・・?
#考察
おそらく学習データが動物(犬以外は?)に特化しているのではないかと予想されます。
そのため、学習を正しく行えば犬種などもほぼ正確に出せるということを示しており、
企業内で利用する場合は、その内容に合致した学習データを使ってモデルを作る必要があるということですね。
とはいえ、企業内で画像認識用に学習データを作ることは荷が大きすぎますし、
サービス提供側からそれは提供しないとサービスとして成り立たないように感じます。
という観点だと汎用的な写真に幅広く対応している Google や Microsoft のサービスの方が
利用できるシナリオが多いように感じました。
#おわりに
Microsoftが今年の2月ごろに出した犬種判別アプリは、Watsonに対抗して出したんじゃないかと今回の結果を見て思いました。Watsonが商談で使っていたのに対応するためかな。あくまで勝手な予想ですが。
・Fetch! A Microsoft Garage Project
https://itunes.apple.com/jp/app/fetch!-microsoft-garage-project/id1050367912
前回も同じことを書きましたが、この技術すごいことはすごいのですが、
現状は利用用途が限られそうに感じます。
例えば、MicrosoftやFacebookが行っていた視覚障害者へ
「今、前に何がみえているか」を音声で伝えるサービスなどが最適なソリューションですね。
今後、利用が爆発的に増えるのは、
犬種のような、やや専門的な知識を幅広く教えてくれるようになった時だと思われます。
以前にMicrosoftがFuture Visionという名前で出していたビデオで、
知らない植物をモバイル端末で写したら、その植物の名前を教えてくれるというシーンがありました。
・MicrosoftがFuture Vision 2013年版
https://www.youtube.com/watch?v=ozLaklIFWUI
これを見た時、すごく興奮しました。
いままでテキストにできる物しか検索できなかったのに、
映像で検索できるって、かなり効率よく調べられるんじゃないか
知識を得る機会が爆発的に増えるんじゃないかって思いました。
外で知らない花の名前を教えてくれたり、
知らない道具や機械を見た時にそれが何に使うものか、どうやって使うのか教えてくれたら、
すごく世界が広がるだろうなと思います。
これからの画像認識は、バージョンアップごとに
「犬種に対応しました」とか「文房具に対応しました」
といった具合になっていくんじゃないかなぁ。
楽しみです。