人工知能に対する興味が日に日に増してきていて、触ってみたい欲求が高まっていたので、簡単に画像判別ができるサービスを使ってみました。
1.使ってみたサービス
Labellio(京セラ)
Custom Vision Servise(Microsoft)
この2つのサービスを使ってみました。というより結果が気に食わず2つ使ってみたというのが事実です。
結果から申し上げるとMicrosoftのCustom Vision Serviseの方が精度が良いと感じました。
2.やったこと
人物の判別をしました。乃木坂46が好きなので乃木坂メンバーの判別ができるモデルを作成しました。
Labellio
まず、学習をしてもらうために教師データを用意する必要があるのですがLabellioは教師データを用意していなくても「Bing」か「Flickr」で検索して勝手に持ってきてくれます。他にもZIPファイルやTSVファイルも使えます。
今回はBingから勝手に検索して持ってきてもらいました。Labellioにtagになる今回の場合人名を入力し、教師データの数を入力して、あとは勝手に学習してもらって終わるのを待つだけです。

終わるとこんな感じに表示されます。結果があまり良くなかったので以下のように複数のモデルを作って試しました。
① label 2人 教師データ各5枚
② label 7人 教師データ各50枚
③ label 3人 教師データ各100枚
当たるものもある一方で外すときは盛大に外すといった印象です。

例えばこれなんかは、齋藤飛鳥さんの写真をあげたにもかかわらず、Scoreがまさかの0.00でした。迷って間違えたという感じではありません。もちろん当たるときは当たります。
(検証に使った画像もあげようか迷ったのですが権利の関係があったのでやめておきました。)
Custom Vision
Custom Visionでは教師データをLabellioのように勝手に検索して持ってきてくれないので、めんどくさかったのでlabel2人でそれぞれ5枚の教師データをアップロードして学習してもらいました。割といい感じに正解を出しました。12枚の写真を使って検証した結果10枚正解でした。
最後にLabellioとCustom Visionで与えた教師データは異なるのですがlabel数2人、教師データ数各5枚で学習させたモデルを利用して同じ12枚の写真を使ってどちらの正解数が多いか検証しました。
Labellio(正解率67%)
正解 : 8 不正解 : 4
Custom Vision(正解率 : 83%)
正解 : 10 不正解 : 2
検証したデータの数が少ないのでよくないのですがCustom Visionの方が正解が多くなりました。全く同じものをやったわけではないので一概には言えませんがLabellioは「正解もあるけど不正解もある」といった印象で、Custom Visionは「不正解は時々あるけど正解が多い」といった印象でした。
人物の判別って、肩までしか写っていないもの、全身写っているもの、横から撮ったもの、正面から撮ったもの、笑ったもの、真顔のもの、メガネの有無、衣装の違いなど同じ人物でも違いがかなりあると思うのですがそれでもこれぐらいの数字がですのですごいなと思いました。