この記事は インフォマティカ Advent Calendar 2023 Day 4 の記事として書かれています。
はじめに
皆様データマスキングしてますか?
データをマスクするとは、データの一部もしくは全部を見えなくすることで機密情報等を他人に判別・認識させなくするような処理となります。
よくありがちなマスキングといえば、アスタリスク等の文字で埋め尽くす置き換え等が想像されやすいですよね。ただ、そのような単純なマスキングを行ってしまうとデータ本来が持つ意味合いが分からなくなり、またデータ間の関連性が消えてしまったりして、そのデータを利用した分析やテストの役に立たなくなってしまう場合があります。
Informaticaの高度なデータマスキング
Informatcaのクラウドサービス Intelligent Data Management Cloud がデフォルトで持つデータマスキング機能を利用すれば、本来のデータが持つ特徴を損なわずに、またデータ間の関係性を保持したまま、マスキングデータを作成する事が出来ます。
データ特性毎にマスキング方法を選ぶことで、例えばクレジットカード番号や電話番号、生年月日などの意味合いを持たせたままマスクされたデータを生成します。以下に簡単な例を示します。
効果的なマスキングの例
マスキング方法 | マスキング前 | 効果的では無いマスキング結果 | 効果的なマスキング結果 | 説明 |
---|---|---|---|---|
クレジットカード番号 | 5573-5886-7397-8193 | 1234-5678-9012-3456 | 5573-5832-0756-8917 | クレジットカード会社情報(冒頭4桁)を保持 |
E-Mailアドレス | EM@infabank.com | aaabbbccc | 7X@oowgOBR8.5LV | 疑似的なメールアドレスを生成 |
電話番号 | 03-6403-7600 | 00-0000-0000 | 03-9357-4374 | 同一地域の疑似電話番号を生成 |
URL | http://xxx.infa.com/em | http://xxxx.yyyy | http://tCY.ab.dOt/mI | URL形式を保持 |
生年月日などの日付 | 1995-02-28 | 9999-99-99 | 1995-03-15 | 前後数ヶ月の範囲のランダム日付を生成し年齢情報を保持 |
マスキングの種類
以下のマスキング方法が用意されています。
マスキングの実装方法
データ統合機能のマッピングにて「マスキングトランスフォーメーション」を配置し、設定する事で利用可能です。
以下のデータマスキングトランスフォーメーションをマッピングに配置して利用します。
尚、過去の記事でこの機能を利用した実装例を紹介しておりますので、参考にして頂ければと思います。
マスキング機能詳細は以下のマニュアルを参照ください。
おわりに
本記事はほぼマニュアルの情報のみ、基本的な情報のみの紹介となりますが、ぜひ皆様に知って頂きたいので記事にしてみました。便利ですのでどしどしご利用ください!