Databricks Clean Rooms for privacy-safe collaboration is in Public Preview | Databricks Blogの翻訳です。
本書は著者が手動で翻訳したものであり内容の正確性を保証するものではありません。正確な内容に関しては原文を参照ください。
機微なデータを保護しつつ、データ+AIでクラウド・業界横断でシームレスな作業を
イノベーションのための外部データと外部AIの指数関数的な成長が加速することで、すべての業界の企業はプライバシー保護された方法で自身のパートナーとコラボレーションする効果的な手段を模索しています。いくつかの企業では、限定的なコラボレーションのソリューションを用いており、多くの場合において自身のデータがどのように利用されれるのかがわからなくなるような、一部に共有する自分たちの機微データに対するコントロールを諦めなくてはなりません。これは、潜在的なデータ誤用やデータプライバシー侵害に対する多大なるリスクを引き起こします。
企業はデータに対するAIを実施し、コラボレーションするためにプライバシー保護されつつも、オープンで柔軟な方法を必要としており、Databricks Clean Roomsはこれらの重要な要件に応えるものとなっています。今年のData + AIサミットで発表したように、AWSとAzureでClean Roomsはパブリックプレビューとなっています(こちらからプレビューへのアクセスをリクエストしてください)。Clean RoomsではDelta Sharingを活用しており、プライバシーに妥協したり、機微データを共有することなしに、すべてのクラウド上の顧客やパートナーと容易にコラボレーションできるようになります。クリーンルームの参加者は自身の既存データを安全に共有、結合することができ、MLに対するネイティブサポートを提供するPythonのような任意の言語を用いて複雑なワークロードを実行することができます。クリーンルームでコラボレーションする際、あなたのデータは移動せず、データがどこでどのように使われるのかに関して常に管理下に置くことができます。
Databricks Clean Roomsは、データドリブンの洞察によるイノベーションを加速する助けとなる方法を探している企業のために開発されています。例えば、Mastarcardの事例を知り、彼らのコラボレーター、データ、ユースケースに基づいてどのprivacy-enhancing technologies (PETs)を使うのかを動的に決定することで、どのように機微データを保護したのかを学ぶために、最近のData + AIサミットのセッション“Collaboration with Databricks Clean Rooms and PETs”をご覧ください。
すべての言語、すべてのワークロード
Databricks Clean Roomsはすべての分析、AIワークロードのために設計されています。テーブルデータに対するSQLクエリーのみに機能が限定されているような既存の他のソリューションと異なり、Databricks Clean Roomsでは、Pythonで計算処理を実行することができます。柔軟性を持つことで、シンプルなjoinやML/AIユースケースのための複雑な計算処理も実現する助けとなります。Databricksノートブックのフルパワーを活用することで、複雑な計算処理やML/AIワークロードにおいてSQLやPythonを実行することができます。また、コラボレーター側も自分たちのIPが確実に保護されるように、センシティブなアルゴリズムや処理ロジックを隠蔽したままにするために、プライベートなライブラリを使うことができます。最後になりますが、より多くの言語もサポート予定であり、ScalaやJavaはまもなくサポートされます。
すべてのクラウド、複製無し
Databricks Clean Roomsは、リージョン、クラウド、プラットフォーム横断でのコラボレーションのために開発されています。例えば、一方がAWS、もう一方がAzureのように異なるクラウドからのコラボレーターは、Databricks Clean Roomsで一緒にコラボレーションすることができます。このClean Roomsによる、セキュアでオープン、柔軟性のあるコラボレーションは、Delta Sharingによって実現されています。非テーブル型のデータや非構造化データ、AIモデルを含むあなたの全てのデータやAIでコラボレーションすることができ、その際には背後のデータのプライバシーを保護し続けます。
レイクハウスフェデレーションにおける新たなDelta Sharingからの共有を用いたデータプラットフォーム横断のコラボレーションもまもなく提供されます(こちらからプレビューへのアクセスをリクエストしてください)。
すべての規模、すべての信頼レベル
我々は、企業では大規模にクリーンルームを活用したいという重要な要件があることを理解しています。Databricks Clean Roomsでは、この要件に応えるために堅牢なコラボレーション、オペレーショナルな機能を提供しています。
まもなく、API、SQLコマンド、ビルトインのDatabricksワークフローのオーケストレーションがサポートされるので、あなたの全てのユースケースにおいて、容易にクリーンルームを自動化、管理することができるようになります。複数のコラボレーターは、異なる承認モードを用いて、異なる信頼レベルでDatabricks Clean Roomで一緒に作業を行うことができます。また、DatabricksノートブックやUnity Catalogでお使いのClean Roomsのアウトプットに容易にアクセスすることができ、以降のワークフローにおけるシームレスな連携を可能にします。
Databricks Clean Roomsの動作原理
Clean Roomsはパワフルなツールではありますが、簡単にセットアップして使い始めることができます。
最初に、お好みのクラウドプロバイダーとリージョンを選択してクリーンルームを作成します。あなたやあなたのコラボレーターが現在どのクラウドやリージョンを使っているのかに関係なく、任意のクラウドやリージョンでクリーンルームを作成することができます。これによって、Databricksによってホスティングされるプライバシー保護され、分離された環境が作成されます。クリーンルームが作成されると、あなたとあなたのコラボレーターは、非構造化データ、テーブル、ボリューム、AIモデルを含む自身のデータを、Delta Sharingを用いてクリーンルームに持ち込むことができます。クリーンルームの誰であっても参加者は、それぞれの相手のデータを参照したり直接アクセスすることはできません。
最後に、分析を実行するために、コードに対して相互に同意したノートブックを作成し、クリーンルームに共有することができます。そして、あなたのコラボレーターはサーバレスコンピュートを用いて処理が行われるこれらのノートブックタスクを実行することができます。Databricks Clean Roomsによって、すべてのコラボレーターはノートブックをクリーンルームに共有し、承認し、クリーンルーム内で実行することができます。この柔軟性によって、プライバシーが保護された手段で任意のワークロードを実行することができます。
Clean Roomsの一般的なユースケース
様々な業界で数多くのクリーンルームのユースケースが生まれています。一般的なもののいくつかを見ていきましょう。
広告 & メディア
クリーンルームによって、ユーザーのプライバシーを妥協することなしに、広告会社とパブリッシャーがキャンペーのパフォーマンスを分析することができます。このアプローチによって、パブリッシャーのデータプライバシーを保護しつつも、広告会社はプラットフォーム横断で全体的なキャンペーンの効果に対するビューを手にすることができます。あるユースケースは、生の背後のデータを共有することなしに、別のコラボレーターのデータセットから類似のプロファイルを特定するMLモデルを使うモデリングのようなものです。これは、ニッチな顧客へのリーチ、コンバージョンを増やすためにターゲットとなる顧客プロファイルの補強、ターゲットの見直し、既存のターゲットプロファイルの改善を含む様々なシナリオにおいてパワフルなテクニックとなり得ます。
この業界においては、戦略的パートナーであるLiveRampが、顧客モデリングや分析のためにアイデンティティを活用したデータインフラストラクチャのためにDatabricks Clean Roomsを顧客に提供しています。
「LiveRampとDatabricks Clean Roomsは、プライバシーを完全に保護しつつもマーケターが素晴らしい顧客体験を生み出すために必要なツールを提供しています。Databricksのお客様は、顧客のモデリングや分析のために、すぐれたパーソナライゼーション、強力なコラボレーション、すぐれた精度のためにLiveRampのアイデンティティを活用したデータインフラストラクチャを組み合わせることができます。すべてのマーケティングチームにとっては夢のような組み合わせです。」— Mike Moreau, VP Operations, LiveRamp
小売 & 消費財(CPG)
小売業者や製造業者は、トレンドを特定し、値付け戦略を最適化するためにクリーンルームを活用することができます。このコラボレーティブな分析は、よりターゲッティングされた広告を実現し、キャンペーン最適化のために価値のある洞察を提供することで、小売業者のメディアネットワークの効果を強化します。他の一般的なユースケースは、需要予測や在庫管理のために売り上げデータを活用するというものです。
製造
グローバルな製造業では、予兆保全によるオペレーションの効率の改善のように、クリーンルームでバリューチェーン全体でのデータの洞察を解放するために、パートナーとコラボレーションすることができます。彼らは、設置されたセンサーからのデータ、データパイプラインからの生データにアクセスし、故障やメンテナンスウィンドウの予測の助けとなるように、過去のデータでトレーニングされたMLモデルを活用することもできます。
ヘルスケア & ライフサイエンス
また、患者データに対するコラボレーティブな研究において、ヘルスケアやライフサイエンスにおいてもクリーンルームは重要となります。異なる機関の研究者は、患者のプライバシーを完全に保護しつつも、新たな治療法を考案したり、患者の病状を改善するために結合されたデータセットを分析することができます。
金融サービス
金融サービスにおけるKnow Your Customer (KYC)コンプライアンスでは、クリーンルームがゲームチェンジャーとなっています。金融機関は、迅速な顧客のオンボード、潜在的なマネーロンダリングの行動の特定、全体的なリスク管理の改善のために、機微な顧客情報を公開することなしに、セキュアにKYCデータを共有、分析することができます。また、不正検知や防御においては、キーとなる洞察を導き出すために、金融機関とサードパーティの分析プロバイダー(フィンテック企業、不正検知ファームなど)のコラボレーションを支援します。別のユースケースには、パーソナライズされた金融製品やサービスのために、顧客の行動や嗜好の理解の助けとなるように、金融機関とサードパーティの分析プロバイダーがコラボレーションする顧客洞察とパーソナライゼーションの生成となります。
Databricks Clean Roomsを使い始める
Databricks Clean Roomsによって、ご自身のデータとAIの取り組みにおける価値創出の助けとなる、プライバシー保護されたコラボレーションを実現します。パブリックプレビューがリリースされる前に使用されたいのであれば、Databricks Clean Roomsのinterest formを提出してください。
また、動作原理やデータ・ドリブンのイノベーションの加速にどのような助けになるのかを学ぶには、Clean Roomsに関する2024 Data + AI Summitのセッションを視聴することもできます:
- Collaboration with Databricks Clean Rooms and PETsはMastercardによる顧客セッションです。Clean RoomsとMastercardは、モダンなデータ問題を解決するために複数パーティでのコラボレーションを促進しました。rんどユーザーの体験に影響を与えることなしに、コラボレーター、データ、ユースケースに基づいてどのprivacy-enhancing technologies (PETs)を自動的で適用する必要があるのかを特定するために、Mastarcardが使ったノートブックにダイブしましょう。
- Getting Started with Databricks Clean Roomsでは、共有データの分析の開始方法、プラットフォーム横断でのデータの操作、ML/AIモデルのトレーニング、プライバシーポリシーの強制、プロプライエタリライブラリの組み込み、非構造化データの分析、クリーンルームにおけるアクションの監査など、Databricks Clean Roomsによる高度なユースケースを説明します。
- Secure Data and AI Collaboration with Databricks Clean Roomsでは、データクリーンルームの導入を進めるマクロなトレンドや一般的なユースケースをカバーします。このセッションにおいても、デモとしてMastercardのユースケースをカバーします。