製薬業界での業務に携わり始めてから意識し始めたデータインテグリティをテーマに、Power BIでのデータ共有で思ったことを書いています。
データインテグリティとは
全てのデータがライフサイクルを通じて一貫性を保ち、完全かつ正確であることを意味します。FDA(アメリカ食品医薬品局)やMHRA(イギリスの医薬品・医療製品規制庁)などの規制当局から基準となるガイダンスが発表されており、特に製薬業界において遵守が求められている概念です。
データの完全性、一貫性、正確性を担保することで、患者の安全性を担保することを目的としています。
ALCOAの原則とは
データインテグリティを語るときには必ず出てくるキーワードですが、データインテグリティを遵守するためには「ALCOA原則」(もしくはCCEAを追加した「ALCOA+原則」)を満たしている必要があります。どのような観点で何を気を付けるべきなのか、具体的に説明されているのでわかりやすいです。詳しくは下記サイトをご覧ください。
これらは基本的にはPower BIに取込むデータではなく、一次データを生成する段階において遵守すべき原則であるかと思いますが、Power BIでデータを扱う際にも気をつけるべきことがあるのではないかと思いました。
アクセス管理
会社にてPower BIを使用する際にはデータ共有が頻繁に行われていますが、ALCOA原則のもと、データの正確性を担保するためはアクセス管理について十分に検討する必要がありそうです。共有するデータに対して適切なアクセス権が付与されていないと、意図しているいないに関わらず、データが改竄される可能性は高くなります。
ではどのようにアクセス管理をするのがよさそうでしょうか?
・このデータの機密性はどの程度ですか?
・このデータにアクセスする必要がある人は誰ですか?
・どのレベルのアクセス権が必要ですか?
Power BIに限らない話ですが、アクセス権付与の依頼が来る/してもらうことを避けるために?、かなり広範囲でアクセス権を付与してしまうことがありますが、Principle of Least Privilegeのもと、本来データの共有相手には必要最低限の権限のみが付与されるべきです。
Segragation of Dutiesの観点からも、ロール別にアクセス権を分けて管理するのが理想です。例えばデータ管理者、レポート作成者、レポート閲覧者で権限を分けて、それぞれ必要な権限"のみ"を付与します。
そして、これらのアクセス権は"承認"されて付与されていることを示すために、申請=>承認、というプロセスを経ること、そのプロセスを準備しておくことも必要かと思われます。
またPower BIではセマンティックモデル、データフロー、ワークスペース、レポート、Power BIアプリなどに対して共有設定を行えるようになっていますが、どこで共有設定を行うべきなのか、動作を理解した上で設定する必要がありそうです。
やみくもに共有せずに、上記を意識しながらデータ共有の設計は行いたいです。
以上