Python
Azure
スクレイピング
機械学習
Python3

AIが選んだ本当に似ている有名人トップ10 ~結果編~


はじめに

futago_boys.png

みなさんは「soKKuri?」というウェブサービスをご存知でしょうか?

似てると思う有名人2名の画像を投稿すると、似てる似てないをみんなが○×で投票し、投票結果から「そっくり率」を測定できるというサービスです。

日常の他愛のない会話の中で、「○○と○○って似てるよね~」というやり取りは良くあると思っていて、それを上手いスキームでWEBサービス化したこのサイトは非常に画期的だと思っています。

サイト内のそっくり率のランキングで上位の有名人ペアを見ると、確かに「似てるな~」と思うことも多いのですが、中には「全然違うじゃん!」というものもあったりします。改めて考えてみると、似てる似てないの感覚って人それぞれかなりバラツキがあるような気がしていて、だからこそ意見が割れて面白いのだと思います。

とはいいつつも、定量的な基準でランク付けをしたくなってしまうのが私という人間なのです。

今回はMicrosoft AzureのFace APIというサービスを使うことによって、顔のそっくり度を定量的に測定しランク付け、贔屓無しのガチンコそっくりさん選手権を開催したいと思います。


前提


  • 「soKKuri?」のランキングより、そっくり票が1000票以上の上位150組の有名人ペアを対象として抽出。

  • 知名度が低い有名人が含まれる場合は一部集計対象から除外した。


手法

Python→soKKuri?



Google 画像検索



Face API(Microsoft Azure)

まずはウェブスクレイピングで、「soKKuri?」からそっくり率の高い有名人のペアをリストとして取得します。

取得した有名人の名前を元に、iCrawlerというライブラリでGoogle画像検索をかけ、画像を複数枚保存します。

保存した画像の中から、比較に適したアップの顔写真を手動で選別し、画像2枚ずつをFaceAPIに投げて、そっくり度(Microsoftの定義で言うと、「2つの顔が同一人物のものである可能性の度合いを示す信頼度スコア」)を取得します。

このあたりの処理やコードについては、後日別途上げたいと思います。


結果

結果発表おおおおお!!!!!

(アレクサ、ダウンタウン浜田の声で読み上げて)

それでは10位から順番に一組ずつ発表したいと思います。


10位

久保田かずのぶ(とろサーモン)と有田哲平

スコア:0.51805

まずはお笑い芸人の二人がランクイン。とろサーモン久保田さんは特徴的な黒縁メガネをかけているため、一見似ているとは思いませんでしたが、パーツをよく見ると意外と似てるんです。


9位

大谷亮平と竹野内豊

スコア:0.51813

続いては俳優の二人がランクイン。これは文句なしのクリソツです。連ドラの途中でこっそり入れ替わってても気づかないレベルです。

大谷亮平さんは逃げ恥への出演で有名になりましたね。


8位

三瓶と八角親方

スコア:0.53474

お笑いと角界。全く異なる業界がまさかの接点でリンクしました。

最初は坊主同士だからじゃ…とおもてましたが、Face APIは眉の上と唇の下で顔領域を認識するようなので、髪型は関係ないっぽいです。確かパーツも似てます。


7位

ゆいP(おかずクラブ)とマキシマムザ亮君

スコア:0.5358

ついに男女の壁を超えてしまいました。Face APIは男女で比較すると、低めのスコアが出ることが多かったのですが、この二人は別格だったようです。顔以外にも大声で叫ぶとことか、似てますね。


6位

布施博と朝倉伸二

スコア:0.57064

知る人ぞ知るベテラン俳優二人がランクイン。朝倉伸二さんはNHKの朝の連ドラや大河をはじめとし、日本のドラマに多数出演されています。この方を布施博さんだと思って大河を見てるおじいちゃんおばあちゃんも多いんじゃないでしょうか。


5位

安藤優子と山尾志桜里(国会議員)

スコア:0.5718

まさにキャリアウーマンといった女性二人がランクイン。写真を見ていただきたいのですが、本当にびっくりするほど似てるんです。山尾議員にはそっくり賞として金一封を贈呈したいところですが、賄賂だとか言われて週刊誌に追い回されでもしたら可愛そうですので、やめておきます。


4位

近藤春菜と須田和(市議会議員)

スコア:0.5722

近藤春菜さんに似てるのは、ステラおばさんでもなく、角野卓造さんでもなく、須田和議員なんです。

自身の選挙ポスターにも、『ハリセンボンじゃねーよ』と書いているらしく、自ら寄せに行ってる疑惑はありますが、間違いなく似ております。


3位

おばたのお兄さんと横山だいすけ

スコア:0.57583

おばたのお兄さんとうたのお兄さん、お兄さんコンビがまさかの高順位でランクイン。普段小栗旬に寄せている分、あまり似ている印象はないと思うのですが、宣材写真などを見てみると、非常にそっくりであることが分かります。


2位

小林可夢偉と桐生祥秀

スコア:0.58005

トップアスリート2人がそっくり界でも見事銀メダルを獲得しました。二人は髪型が全然違うので、似ているという印象はまったく持っていなかったのですが、顔だけみてみると、実は似ているんです。


1位

バカリズムと井ノ原快彦

スコア:0.61565

ついに出ました!夢のスコア0.6超え!

文句なしのぶっちぎり優勝です!おめでとうございます:grin:

この結果はV6ファンからお叱りを受けそうですが、笑った時の表情が、もう、同じなんです。数学的に表現するなら合同といってしまって問題無いでしょう。二人とも非常に頭脳明晰でとても面白く、今後もテレビ業界で活躍してほしいですね。


おわりに

いかがでしたでしょうか。少しでも面白いと思ったり、「最近の技術でこんなことができるんだー」と思った方は、「いいね」ボタンを押して頂けると幸いです:bow_tone2:

Face APIはウェブ上からも簡単なGUIで顔画像の比較を行うことができるのですが、スコアが0.5以上の場合に同一人物と判定するようですので、ここにランクインした方たちは全員AIを欺いてるわけです。ただ同一人物の画像を比較した場合は、0.8とかのスコアが普通に出ますので、0.5~0.6ぐらいにとどまっているということは、ある意味正確に判定できていると言えると思いました。