privacy
personaldata
BrainPadDay 19

データとプライバシーとディープラーニング

今日はプログラミングの話は一切出てきませんが、たまにはこんな話題もいいかなと。

はじめに

デジタル技術の発展に伴い、データサイエンスや人工知能(AI)などの情報技術を産業・社会の様々な領域に活用しようとする動きが活発化している中で、さまざまなシーンで収集されたデータを活用することによって、これまでにないパーソナライズされた製品・サービスを創造し、新たな社会構造を築く可能性があります。一方で、パーソナルデータにはプライバシーの侵害・情報漏洩の懸念があり、データの利活用が進んでいないのも実情です。

自分のデータは大事に取り扱ってほしい?国際比較!

みなさんはFacebookやTwitterなど使っていますか?SNSによっては、実名で登録していたりニックネームを使っていたり、様々ですよね。パーソナルデータに関する国際比較アンケートの結果によると、日本人は特にSNSで実名が公開されることに抵抗を感じているようです。

  

n3102050.png 

さらに、パーソナルデータと他の情報を紐づけて、新しいデータを生み出したり様々なサービスに活用することができます。いつの間にか、自分が検索していたキーワードが広告として現れたり、ポップアップでお知らせが出たり、カレンダーに登録されていたり、便利といえば便利なんだけど、ちょっとビックリすることたまにありますよね。世界中の人たちも、そういうのはあまり許容できないみたいですね。

  n3102070.png

Deep Multi-Task Learningでプライバシーを守る

ところで、友達と過ごした楽しい思い出の写真や、公共の場所で撮影した写真をSNSにアップして(悪気はないけれど)他人の写真を勝手に公開してしまうことってありますよね。それで気まずい思いをしたことがある人も少なくないと思います。そこで、配慮が必要な画像からプライバシー保護の対象を抽出し、適切な処理をしてくれる方法について書かれた論文を紹介します。

iPravicyという新しいアプローチは、SNSなどに公開された画像のプライバシー設定を自動化するために開発されました。4つのプロセスを経て、画像の中のプライバシーを保護します。

①人間や車など形あるものと背景を分ける
DCNN(Deep Convolutional Neural Network)とCRF(conditional random fields)モデルを使って、人間とそれ以外のものと背景を識別します。

image1.png

②プライバシー保護の対象のものとそうでないものを分ける
ビジュアルツリー構造を使って、プライバシー保護のクラスを分類します。

③プライバシーに配慮が必要な物体を迅速かつ的確に検出
見た目が似ているプライバシー配慮対象物をちゃんと区別するため、識別力を高めるDeep Multi-Task Learningを使います。

④保護が必要な物体のプライバシー設定を識別
image2.png
(a)元画像;(b)人間を抽出;(c)人間の部分だけを切り取り;(d)顔認識;(e)プライバシー保護が必要な対象をぼかす;(f)背景を戻す

詳しい説明は省略しましたが、このようなアプローチは今後サービスに実装され、SNSがもっと使いやすくなるかもしれませんね。しかし、パーソナルデータは画像に限らないため、色々なデータを組み合わせることによって個人が特定される可能性はたくさんあります。プライバシー保護は法律や規制だけでなく、このような技術的観点からの解決するニーズは今後さらに高まってくるでしょう。

ちょっとマジメなお話でした。

参考文献

・総務省, 情報通信白書平成25年版.
・Yu, Jun, et al. "iPrivacy: image privacy protection by identifying sensitive objects via deep multi-task learning." IEEE Transactions on Information Forensics and Security 12.5 (2017): 1005-1016.