Google Cloud Vision APIで顔の各パーツの検出ができるようになっていました。
もしかしたら僕が勘違いしていただけで最初から出来ていたのかもしれませんが、せっかくなのでその精度検証的なことをしてみます。
デスマ中で目が死んでいるこの画像を使って検証を行ってみたいと思います。
今回はPHPで簡単なスクリプトを用意しました。
//APIキー
$api_key = "各自設定してください";
//リファラー
$referer = "各自設定してください";
//画像へのパス
$image_path = "各自設定してください";
//リクエスト用のJSON生成
$json = json_encode(array(
"requests" => array(
array(
"image" => array(
"content" => base64_encode(file_get_contents($image_path)),
) ,
"features" => array(
array(
"type" => "FACE_DETECTION",
"maxResults" => 5,
),
),
),
),
));
//APIアクセス
$curl = curl_init();
curl_setopt($curl, CURLOPT_URL, "https://vision.googleapis.com/v1/images:annotate?key=" . $api_key);
curl_setopt($curl, CURLOPT_HEADER, true);
curl_setopt($curl, CURLOPT_CUSTOMREQUEST, "POST");
curl_setopt($curl, CURLOPT_HTTPHEADER, array("Content-Type: application/json"));
curl_setopt($curl, CURLOPT_SSL_VERIFYPEER, false);
curl_setopt($curl, CURLOPT_RETURNTRANSFER, true);
if(isset($referer) && !empty($referer)) curl_setopt($curl, CURLOPT_REFERER, $referer);
curl_setopt($curl, CURLOPT_TIMEOUT, 15);
curl_setopt($curl, CURLOPT_POSTFIELDS, $json);
$res1 = curl_exec($curl);
$res2 = curl_getinfo($curl);
curl_close($curl);
//データ取得
$json = substr($res1, $res2["header_size"]);// 取得したJSON
$header = substr($res1, 0, $res2["header_size"]);// レスポンスヘッダー
//データ確認
$arr = json_decode($json,true);
この辺りの基本的な使い方はQiitaにもいっぱい転がってるんで調べてみてください。
で、そのままその画像の上にマッピングしてみましょう。
<!DOCTYPE html>
<html lang="en">
<head>
<meta charset="UTF-8">
<title>Document</title>
<style>
.point {
width: 6px;
height: 6px;
display: block;
position: absolute;
background-color: red;
border-radius: 3px;
}
</style>
</head>
<body>
<div style="background-image:url(画像パスを入れてください); width:356px; height: 380px; position: absolute;">
<a href=""></a>
<?php
foreach ($arr[responses][0][faceAnnotations][0][landmarks] as $key => $value) {
$x = $value[position][y]-3;
$y = $value[position][x]-3;
echo <<<EOF
<a href="" class="point" style="top:{$x}px; left: {$y}px;"></a>
EOF;
}
?>
</div>
</body>
</html>
で、その結果がこちら。
ちょっと顎の部分が少しだけずれているのかなと思いますが、他はほぼ完璧です。
なお、取れる値の種類は公式ドキュメントを見てみてください。
顎はCHIN_〜です。
ついでに顔検出APIとしてはdetectFace();なんてものもあります。
せっかくなんでdetectFace();でも検出してみました。
検出する部位の名前も一緒に出しちゃったので少しわかりにくいですが、こっちの方が検出ポイントは多いです。
精度についてはしっかり比較しないとわかりませんが、輪郭についてはdetectFace();、内部のパーツについてはどっこいどっこいって感じでしょうか。
ただ、detectFace();の場合は無償版は回数制限が割と厳しく、サービスで利用するとしたら有償版を契約する必要があります。
金額は公式サイトで伏せているので、ここでは明示しませんが「Mac pro買えるよ」とだけ言っておきますね。
まあ、そんなわけでGoogle Cloud Visionで顔検出した結果としては十分に使用に耐えうるかなって感じです。
いろいろと遊べそうですね!!
※ちなみに、Cloud Vision APIは感情系の解析もいろいろしてくれるわけですが、
{
"responses": [
{
"faceAnnotations": [
{
"joyLikelihood": "VERY_UNLIKELY",
"sorrowLikelihood": "VERY_UNLIKELY",
"angerLikelihood": "VERY_UNLIKELY",
"surpriseLikelihood": "VERY_UNLIKELY",
"underExposedLikelihood": "VERY_UNLIKELY",
"blurredLikelihood": "VERY_UNLIKELY",
"headwearLikelihood": "VERY_UNLIKELY"
}
]
}
]
}
デスマって怖いですね、ってオチ。