背景・目的
Techplayの「映像データ解析によるDX協業実例と画像解析AIの未来」というイベントで秘密計算というワードを聞き、興味を持ったので簡単に調べてみました。
まとめ
- データを暗号化したまま計算できる技術。
- 準同型暗号方式と、秘密分散方式の2つの方式がある。
概要
NRIさんのページと、EAGLYSさんのページに解説がありましたので、こちらを元に整理します。ありがとうございます。
秘密計算とは
- データを暗号化したまま計算できる技術の総称とのこと。
- 秘匿計算とも呼ばれる。
- データ分析でプライバシー保護を強化する技術の一つ。
- 暗号化したままデータ分析可能なため、組織間のデータ共有などアナリティクスの高度化につながると考えられている。
背景
-
データを取り扱うプレイヤーが増えてきており、安全に分析する技術が注目されている。
-
今後のデータセキュリティ・データ保護の市場規模
- 国内の情報ガバナンス / コンプライアンス市場は2019〜2024年までに年平均2.5%で成長し、市場規模が440億円(2019年)から498億円(2024年)にまで拡大する(2020/11/11 IDC発表)
- 世界のデータ保護市場は628億2000万米ドル(2018年)から年平均15.55%で成長し、2026年には1985億9000万米ドルにまで達する。(Data Resources, Inc「Global Data Protection Market」> Summary)
-
市場拡大の背景
- プライバシー保護に対する危機意識
- 大規模な情報漏えい事件
- 法規制強化
- リモートワーク普及に伴う、データ保護の必要性
- クラウドコンピューティングの採用によるデータ管理への懸念
- データ利活用にともなう、セキュリティ対策
- 機密情報の管理体制の強化
- 顧客情報等のプライバシー保護の対策
- プライバシー保護に対する危機意識
方式
準同型暗号方式と、秘密分散方式の2つがある。
準同型暗号方式
- 複雑な暗号関数を作る。
- 代表的な技術として、「Gentryの制限付き準同型暗号方式」がある。
- 倍数と偶数ノイズを利用することで暗号化する。
- 暗号化と復号
- 暗号化には秘密鍵pとランダムな偶数のノイズを加えて、データmを暗号化する。
- 秘密鍵を持つものは、秘密鍵pの倍数と2で割った余りをみるだけでデータの内容を判定可能。
- 暗号化の強度
- pの倍数、偶数のランダムノイズを非常に大きな値にすることでデータの解読が難しくなる。
- 課題
- 暗号化したデータが巨大になり、計算や通信に必要なコストが元データの何倍にも多くなる。
秘密分散方式
- データをシェアと呼ばれる暗号化された情報に分割する。
- シェアを複数のサーバに分散して配置する。
- n次多項式がn+1個のデータ点があれば特定できることを利用して情報を分割する。
- 一定数以上のシェアが集まらない限り情報の処理や復元できないように分割する。
- シェアのまま計算する。
- 比較的計算時間は短く済む。
- 課題
- シェアを分割配布するために複数のサーバが必要でシステム全体として複雑になる。設計や管理コストが増える。
研究と今後の活用
- 複雑なモデリングを扱う機械学習や深層学習の領域では、実用化に向けた研究が盛んに行われているとのこと。
- 秘密計算の技術は、データ分析を高度化することに加えて、情報銀行やブロックチェーン上での情報の授受など、プライバシー保護のための次世代の基礎技術として広く活用が想定されているそうです。
- 医学研究への応用を見据えた検証
- 生体認証の仕組みや異種混合学習などの分析技術とのかけ合わせ
考察
今回は、秘密計算の概要について学びました。
データは増え続ける中で、個人情報の保護などプライバシー保護を強化される流れは止まらないと考えます。また、データに触れる利用者も増え続け、漏洩などのリスクは大きくなる一方です。
そんな中で暗号化されたまま計算や分析ができるという技術は、今後必須の技術になる可能性があると感じました。
今回は概要のため、深く知ることが出来ていません。今後は動向の確認や、実装など理解していきたいと思います。
参考