もうすでに忘れている人もいるかも知れませんが、ちょっと前まで話題になっていたあのドラマに出ていたのが佐藤健なのか亀梨和也なのか区別がつかないことからスタートしたこの企画。
ここやここやここやここなどで試してきた第5段です。
つい先日、MicrosoftのAzureにも、簡単に画像分類ができるサービスがあるということで、早速試してみました。
それが、「Microsoft Azure Custom Vision」です。
現在はプレビュー版ということで、お安く(はっきり言えば、タダ)試すことが出来ます。
準備
Mictosoftアカウントを持っていれば、すぐに開始できます。
「はじめる」→「SIGN IN」でログインします。
プロジェクトの作成
まず最初にプロジェクトを作成します。
「NEW PROJECT」を選択するとプロジェクトの情報を設定する画面が出てきますので、名前など入力していきます。
今回は画像分類ですので「Classification」を選択します。
また、佐藤健と亀梨和也の2クラス分類ですので「MultiClass」を選択します。
画像の種類によって最適なDomainを選択できるのですが、今回は一般用の「General」を選択します。
「Create Project」ボタンを押せば、プロジェクトが出来上がります。
学習データの登録
次に学習データを登録していきます。
いつものように、佐藤健、亀梨和也、それぞれ90枚の学習データと10枚の評価データがありますので、学習データ(亀梨和也の90枚)を登録していきます。
「Add Images」ボタンを押し、ファイルを指定します。
ここでタグが指定できますので、「KazuyaKamenashi」を入力し、「Upload 90 files」ボタンを押します。
無事すべての画像が登録できたようですので、同様に佐藤健の90枚も登録していきます。
これですべての学習データが登録できました。
学習の実行
上部にある「Train」ボタンを押し、学習を開始します。
クラス数や画像数により、学習時間は変わるようですが、今回は数分で終了しました。
ちなみに、ネットワークモデルはSqeezeNet(AlexNetの小さい版)という噂です。
学習が終了すると、その結果が表示されます。
下の方には、それぞれのクラスの正解率が表示されます。
なんか嫌な予感がします ^^;
評価の実行
ではうまく分類できるか試してみます。
上部にある「Quick Test」ボタンを押します。
残念ながらまとめてテストが出来ないので、1枚づつファイルを指定していきます。
まずは亀梨和也から。
いい感じに分類できています。この調子で残り9枚も確認していきます。
確認した結果は、あとから「Predictions」で見直すことが出来ます。
しきい値を変更して、うまく見分けられたのかも確認できます。
その後、佐藤健の方も確認していきます。
こちらもいい感じです。
テスト画像の分類結果は以下のようになりました。
- 評価用画像(亀梨和也)
- 60%正解
- 評価用画像(佐藤健)
- 100%正解
なんとなく「佐藤健発見器」になっている予感がします(苦笑)
結果
この調子で、肝心のドラマ中の画像でも確認してみます。
こちらは15枚あります。
で、正解率は...73.33%でした。
(「佐藤健発見機」だからズルいって?!)
FileName | TakeruSato | KazuyaKamenashi |
---|---|---|
image01.jpg | 0.988 | 0.011 |
image02.jpg | 0.999 | 0.000 |
image03.jpg | 0.579 | 0.420 |
image04.jpg | 0.999 | 0.000 |
image05.jpg | 0.999 | 0.000 |
image06.jpg | 0.998 | 0.001 |
image07.jpg | 0.122 | 0.877 |
image08.jpg | 0.079 | 0.920 |
image09.jpg | 0.905 | 0.094 |
image10.jpg | 0.156 | 0.843 |
image11.jpg | 0.059 | 0.940 |
image12.jpg | 0.999 | 0.000 |
image13.jpg | 0.462 | 0.537 |
image14.jpg | 0.997 | 0.002 |
image15.jpg | 0.876 | 0.123 |
Microsoft先生、意外とやるじゃん!(失礼?!)
おまけ
Google AutoML VisionとMicrosoft Azure Custom Visionと比較すると、Custom Visionのほうが簡単といった感じがしますので、とりあえずお試しで使いたい場合はこちらがよいのではないでしょうか。
細かい設定などはAutoML Visionができるので、もうちょっと精度などにこだわりたい場合はそっちかなという気がします。