画像認識の技術は、自動車関連の分野としては道路標識や信号の色の識別、ナンバープレートの番号の読み取りなど様々な場面で使われており、身近なものとなっています
YouTubeで検索 してみるといくつかの動画が公開されていて、認識の様子を見ることができます
今回は、そういった画像認識の技術に触れてみようということで、Microsoftが提供しているFace APIを使ってみました
Face API - 顔認識 | Microsoft Azure
https://azure.microsoft.com/ja-jp/services/cognitive-services/face/
このAPIは画像に映っている人物の顔を認識して、年齢、性別、表情、髭の有無などの特徴を出すもの(Face Detection)です。他にも2つの顔が同一人物の物である確率を検証すること(Face Recongnition)ができます
準備
無料で使える範囲でFace APIを使ってみましょう。まずはAPIを使う準備をします
※ここで説明している画面は 2017年12月 のものです。将来的に変更になっているかもしれません
-
Face APIのページ にアクセスして[Face API を試す]をクリックします
※この記事では westcentralus.api.cognitive.microsoft.com/face/v1.0 をエンドポイントとしてAPIを実行しています。アカウントやキーの取得時期などによって変更となっている可能性がありますので、異なるエンドポイントとなっていた場合はそれに読み替えてください
以上で準備は完了です。無料で使える期間はAPIキーを取得してから1か月間で、APIの利用回数は1分あたり20回に制限されています
Face API (Face Detection)を使ってみる
Face AIPはC#やJava、Rubyなどのプログラミング言語から使用できますが、手っ取り早くcURLを使ってRESTFULから実行してみます。Linuxやmacのターミナルから以下のコマンドを実行してください
$ curl -v -X POST "https://westcentralus.api.cognitive.microsoft.com/face/v1.0/detect?returnFaceId=true&returnFaceLandmarks=false&returnFaceAttributes=age,gender,headPose,smile,facialHair,glasses,emotion,hair,makeup,occlusion,accessories,blur,exposure,noise" \
-H "Content-Type: application/json" \
-H "Ocp-Apim-Subscription-Key: {subscription key}" \
--data-ascii '{"url":"https://upload.wikimedia.org/wikipedia/commons/c/c3/RH_Louise_Lillian_Gish.jpg"}'
オプションは Quickstarts のと同じです。
{subscription key}
の部分は各自取得したキーを入れてください
ターミナルからcurlを実行すると、以下のような結果が返ってきます
* upload completely sent off: 88 out of 88 bytes
< HTTP/1.1 200 OK
< Cache-Control: no-cache
< Pragma: no-cache
< Content-Length: 978
< Content-Type: application/json; charset=utf-8
< Expires: -1
< X-AspNet-Version: 4.0.30319
< X-Powered-By: ASP.NET
< apim-request-id: 57d2a10b-57a6-49ca-bbcb-f76c4ccdd528
< Strict-Transport-Security: max-age=31536000; includeSubDomains; preload
< x-content-type-options: nosniff
< Date: Sun, 17 Dec 2017 01:23:32 GMT
<
* Connection #0 to host westcentralus.api.cognitive.microsoft.com left intact
[{"faceId":"6c123c30-0705-4b96-8da2-713c1313ca00","faceRectangle":{"top":131,"left":177,"width":162,"height":162},"faceAttributes":{"smile":0.0,"headPose":{"pitch":0.0,"roll":0.1,"yaw":-32.9},"gender":"female","age":22.9,"facialHair":{"moustache":0.0,"beard":0.0,"sideburns":0.0},"glasses":"NoGlasses","emotion":{"anger":0.0,"contempt":0.0,"disgust":0.0,"fear":0.0,"happiness":0.0,"neutral":0.986,"sadness":0.009,"surprise":0.005},"blur":{"blurLevel":"low","value":0.06},"exposure":{"exposureLevel":"goodExposure","value":0.67},"noise":{"noiseLevel":"low","value":0.0},"makeup":{"eyeMakeup":true,"lipMakeup":true},"accessories":[],"occlusion":{"foreheadOccluded":false,"eyeOccluded":false,"mouthOccluded":false},"hair":{"bald":0.0,"invisible":false,"hairColor":[{"color":"brown","confidence":1.0},{"color":"black","confidence":0.87},{"color":"other","confidence":0.51},{"color":"blond","confidence":0.08},{"color":"red","confidence":0.08},{"color":"gray","confidence":0.02}]}}}]
このJSONを読み解くとこのような情報が入ってました
JSON項目 | 値 | 説明 |
---|---|---|
faceId | 6c123c30-0705-4b96-8da2-713c1313ca00 | 後述する Face Recongnition など認識結果を別のAPIで使用するためのID。解析してから24時間有効 |
faceRectangle | { "top":131, "left":177, "width":162, "height":162 } |
検出した顔の座標 |
faceAttributes | { "smile":0.0, "headPose":{"pitch":0.0,"roll":0.1,"yaw":-32.9 } |
笑顔のスコア、顔の傾き |
gender | female | 性別 |
age | 22.9 | 年齢 |
facialHair | { "moustache":0.0, "beard":0.0, "sideburns":0.0 } |
顔の髪(口ひげ、あごひげ、ほおひげ) |
glasses | NoGlasses | 眼鏡をかけているか |
emotion | { "anger":0.0, "contempt":0.0, "disgust":0.0, "fear":0.0, "happiness":0.0, "neutral":0.986, "sadness":0.009, "surprise":0.005 } |
感情(怒り、恥ずかしい、うんざり、恐怖、幸せ、無表情、悲しみ、驚き) |
blur | { "blurLevel":"low", "value":0.06 } |
霞み具合 |
exposure | { "exposureLevel":"goodExposure", "value":0.67 } |
露出度 |
noise | { "noiseLevel":"low", "value":0.0 } |
ノイズレベル |
makeup | { "eyeMakeup":true, "lipMakeup":true } |
化粧をしているか(アイメイク、唇) |
accessories | [] | アクセサリを付けているか |
occlusion | { "foreheadOccluded":false, "eyeOccluded":false, "mouthOccluded":false } |
顔を塞いでいるか(額、目、口) |
hair | { "bald":0.0, "invisible":false, "hairColor":[ {"color":"brown","confidence":1.0}, {"color":"black","confidence":0.87}, {"color":"other","confidence":0.51}, {"color":"blond","confidence":0.08}, {"color":"red","confidence":0.08}, {"color":"gray","confidence":0.02}] } |
髪の毛(ハゲ度合、見えないか?、髪の色・茶/黒/他/金/赤/灰の各信頼度) |
同一人物である可能性を検証する
次に、2つの画像を使って同一人物であるか検証してみます。自分の画像を出すのは見苦しいし、赤の他人の画像を使うのも肖像権うんぬんがあるので、ここでは PAKUTASO 様の素材を使わせていただきました
まず、基準となる画像を登録します
登録する顔がどんな人なのかを紐づけするために、Group と Person を作成します
ここでは、Groupを「MyFriend」、Persionを「John」としました
1.Group を作成する
$ curl -v -X PUT "https://westcentralus.api.cognitive.microsoft.com/face/v1.0/persongroups/my_friend" \
-H "Content-Type: application/json" \
-H "Ocp-Apim-Subscription-Key: {subscription key}" \
--data-ascii '{"name":"MyFriend","userData":"virtual friends that for lonely man"}'
ここでは my_friend という名前でgroupIdを作成しています。別の groupId を作るには URL 末尾の "my_friend" を変更してください。ただし、groupIdはアルファベット小文字か数字、'-'、'_'、で64文字以内としてください
> PUT /face/v1.0/persongroups/my_friend HTTP/1.1
> Host: westcentralus.api.cognitive.microsoft.com
> User-Agent: curl/7.56.1
> Accept: */*
> Content-Type: application/json
> Ocp-Apim-Subscription-Key: 9c02e4795a654184b71da8b4fdb3f9c5
> Content-Length: 68
>
* upload completely sent off: 68 out of 68 bytes
< HTTP/1.1 200 OK
< Cache-Control: no-cache
< Pragma: no-cache
< Content-Length: 0
< Expires: -1
< X-AspNet-Version: 4.0.30319
< X-Powered-By: ASP.NET
< apim-request-id: a1b92c05-61dc-484d-b8be-564d970952b4
< Strict-Transport-Security: max-age=31536000; includeSubDomains; preload
< x-content-type-options: nosniff
< Date: Thu, 21 Dec 2017 06:39:57 GMT
<
* Connection #0 to host westcentralus.api.cognitive.microsoft.com left intact
2.Person を作成する
$ curl -v -X POST "https://westcentralus.api.cognitive.microsoft.com/face/v1.0/persongroups/my_friend/persons" \
-H "Content-Type: application/json" \
-H "Ocp-Apim-Subscription-Key: {subscription key}" \
--data-ascii '{"name":"John","userData":"a friend met from Google search"}'
nameとuserData(Optional)は任意に決めてください
> POST /face/v1.0/persongroups/my_friend/persons HTTP/1.1
> Host: westcentralus.api.cognitive.microsoft.com
> User-Agent: curl/7.56.1
> Accept: */*
> Content-Type: application/json
> Ocp-Apim-Subscription-Key: 9c02e4795a654184b71da8b4fdb3f9c5
> Content-Length: 60
>
* upload completely sent off: 60 out of 60 bytes
< HTTP/1.1 200 OK
< Cache-Control: no-cache
< Pragma: no-cache
< Content-Length: 51
< Content-Type: application/json; charset=utf-8
< Expires: -1
< X-AspNet-Version: 4.0.30319
< X-Powered-By: ASP.NET
< apim-request-id: 2358fef1-d4c1-48fe-8b12-6370cc848fff
< Strict-Transport-Security: max-age=31536000; includeSubDomains; preload
< x-content-type-options: nosniff
< Date: Thu, 21 Dec 2017 06:44:17 GMT
<
* Connection #0 to host westcentralus.api.cognitive.microsoft.com left intact
{"personId":"e1367efa-f024-4817-83c8-3f8b13cd0979"}
personId がレスポンスに返ってくるのでメモしておきます
3.Person に顔を追加する
例に挙げている基準となる顔の画像を指定します
RESTfulの書式は次の通りです。groupIdとpersonIdは適宜読み替えてください
https://westcentralus.api.cognitive.microsoft.com/face/v1.0/persongroups/{groupId}/persons/{personId}/persistedFaces
$ curl -v -X POST "https://westcentralus.api.cognitive.microsoft.com/face/v1.0/persongroups/my_friend/persons/e1367efa-f024-4817-83c8-3f8b13cd0979/persistedFaces" \
-H "Content-Type: application/json" \
-H "Ocp-Apim-Subscription-Key: {subscription key}" \
--data-ascii '{"url":"https://camo.qiitausercontent.com/a9b67ed8072799063452a1291cd49787c4d4b86c/68747470733a2f2f71696974612d696d6167652d73746f72652e73332e616d617a6f6e6177732e636f6d2f302f36313430342f32373038646537622d373464662d393161382d653936632d6232613437356437666635352e6a706567"}'
> POST /face/v1.0/persongroups/my_friend/persons/e1367efa-f024-4817-83c8-3f8b13cd0979/persistedFaces HTTP/1.1
> Host: westcentralus.api.cognitive.microsoft.com
> User-Agent: curl/7.56.1
> Accept: */*
> Content-Type: application/json
> Ocp-Apim-Subscription-Key: 9c02e4795a654184b71da8b4fdb3f9c5
> Content-Length: 269
>
* upload completely sent off: 269 out of 269 bytes
< HTTP/1.1 200 OK
< Cache-Control: no-cache
< Pragma: no-cache
< Content-Length: 58
< Content-Type: application/json; charset=utf-8
< Expires: -1
< X-AspNet-Version: 4.0.30319
< X-Powered-By: ASP.NET
< apim-request-id: 9b0b7cd0-69c6-40f0-97e1-4e806de70063
< Strict-Transport-Security: max-age=31536000; includeSubDomains; preload
< x-content-type-options: nosniff
< Date: Thu, 21 Dec 2017 06:49:42 GMT
<
* Connection #0 to host westcentralus.api.cognitive.microsoft.com left intact
{"persistedFaceId":"7d70b5b4-0037-4961-a13d-b74a147124a6"}
比較してみます
1.比較画像1をFace Detectionにかけます
$ curl -v -X POST "https://westcentralus.api.cognitive.microsoft.com/face/v1.0/detect?returnFaceId=true&returnFaceLandmarks=false&returnFaceAttributes=age,gender" \
-H "Content-Type: application/json" \
-H "Ocp-Apim-Subscription-Key: {subscription key}" \
--data-ascii '{"url":"https://camo.qiitausercontent.com/f8b6bfedb951332ff070f18cc54b8ef344beb19a/68747470733a2f2f71696974612d696d6167652d73746f72652e73332e616d617a6f6e6177732e636f6d2f302f36313430342f31333239326538382d396661332d323435332d326366352d6366326237643964353166382e6a706567"}'
> POST /face/v1.0/detect?returnFaceId=true&returnFaceLandmarks=false&returnFaceAttributes=age,gender HTTP/1.1
> Host: westcentralus.api.cognitive.microsoft.com
> User-Agent: curl/7.56.1
> Accept: */*
> Content-Type: application/json
> Ocp-Apim-Subscription-Key: 9c02e4795a654184b71da8b4fdb3f9c5
> Content-Length: 269
>
* upload completely sent off: 269 out of 269 bytes
< HTTP/1.1 200 OK
< Cache-Control: no-cache
< Pragma: no-cache
< Content-Length: 161
< Content-Type: application/json; charset=utf-8
< Expires: -1
< X-AspNet-Version: 4.0.30319
< X-Powered-By: ASP.NET
< apim-request-id: bc03dfad-709a-4efd-8dcc-42260cf13d1a
< Strict-Transport-Security: max-age=31536000; includeSubDomains; preload
< x-content-type-options: nosniff
< Date: Thu, 21 Dec 2017 07:08:41 GMT
<
* Connection #0 to host westcentralus.api.cognitive.microsoft.com left intact
[{"faceId":"575ac45e-abb0-44d7-9cd2-99830fbc232d","faceRectangle":{"top":242,"left":996,"width":175,"height":175},"faceAttributes":{"gender":"male","age":37.2}}]
faceIdをメモします
2.groupIdとpersonId、Face DetectionしたfaceIdを指定してverifyします
$ curl -v -X POST "https://westcentralus.api.cognitive.microsoft.com/face/v1.0/verify" \
-H "Content-Type: application/json" \
-H "Ocp-Apim-Subscription-Key: {subscription key}" \
--data-ascii '{"faceId":"575ac45e-abb0-44d7-9cd2-99830fbc232d","personId":"e1367efa-f024-4817-83c8-3f8b13cd0979","personGroupId":"my_friend"}'
> POST /face/v1.0/verify HTTP/1.1
> Host: westcentralus.api.cognitive.microsoft.com
> User-Agent: curl/7.56.1
> Accept: */*
> Content-Type: application/json
> Ocp-Apim-Subscription-Key: 9c02e4795a654184b71da8b4fdb3f9c5
> Content-Length: 127
>
* upload completely sent off: 127 out of 127 bytes
< HTTP/1.1 200 OK
< Cache-Control: no-cache
< Pragma: no-cache
< Content-Length: 41
< Content-Type: application/json; charset=utf-8
< Expires: -1
< X-AspNet-Version: 4.0.30319
< X-Powered-By: ASP.NET
< apim-request-id: d13c7f31-0ef7-4cbe-9f36-51ac384fcaec
< Strict-Transport-Security: max-age=31536000; includeSubDomains; preload
< x-content-type-options: nosniff
< Date: Thu, 21 Dec 2017 07:11:50 GMT
<
* Connection #0 to host westcentralus.api.cognitive.microsoft.com left intact
{"isIdentical":true,"confidence":0.61687}
isIdentical が true であれば同一人物と判定されています。confidence は0.0 ~ 1.0の間で高い程確実性があります
ちなみに、比較画像2でverifyしたところfalseになってました。髪型も変わっているので判別は難しかったのかもしれません
> POST /face/v1.0/verify HTTP/1.1
> Host: westcentralus.api.cognitive.microsoft.com
> User-Agent: curl/7.56.1
> Accept: */*
> Content-Type: application/json
> Ocp-Apim-Subscription-Key: 9c02e4795a654184b71da8b4fdb3f9c5
> Content-Length: 127
>
* upload completely sent off: 127 out of 127 bytes
< HTTP/1.1 200 OK
< Cache-Control: no-cache
< Pragma: no-cache
< Content-Length: 42
< Content-Type: application/json; charset=utf-8
< Expires: -1
< X-AspNet-Version: 4.0.30319
< X-Powered-By: ASP.NET
< apim-request-id: 996bb8b7-ee39-464c-b9ed-ac8ae4271b7a
< Strict-Transport-Security: max-age=31536000; includeSubDomains; preload
< x-content-type-options: nosniff
< Date: Thu, 21 Dec 2017 07:18:43 GMT
<
* Connection #0 to host westcentralus.api.cognitive.microsoft.com left intact
{"isIdentical":false,"confidence":0.45508}
もっと詳しく
Face APIの使い方は Overview に書かれています
認識する画像にURLを指定してましたが、 ドキュメント を見ると、Request Bodyの所に To detect in a URL (or binary data) specified image.
と書かれていたので、ローカルファイルをアップロードして解析にかけることも出来そうです。
さいごに
画像認識といえば、学習データを登録して、誤検知があればそれを取り除いていって、という地道で泥臭い作業が必要で、まともに使えるまでにはかなり手間がかかるような物というイメージでした。私は一時期、スパムメールのフィルターに関する仕事をやっていたことがあり、機械学習の大変さもある程度感じてました。Face APIのように簡単に画像認識が使えるのは、すごい時代になったと思います
今回は、簡単な紹介ということでライトな記事になりましたが、これをコマンド化して防犯カメラに仕掛けるのも面白いかと思いました。家族以外が映っていたらすぐにわかるようになるので防犯面にも役立ちます
人感センサーが反応したらカメラが画像をキャプチャして、画像認識をかける仕組みなら簡単に作れそうです。ただ、無料枠ではトランザクション数が限られてしまうので、どこまで運用に耐えられるのかは考えなければならないです