概要
PDF からの情報漏えいが度々発生しています。
https://www.itmedia.co.jp/news/articles/2302/28/news189.html#utm_term=share_sp
この記事では、なぜ PDF からの情報漏えいが発生するのか、必要な対策はなにか? について検討します。
この記事は、PDF の技術的な特性だけでなく、PDF からの情報漏えいに関する包括的な対応について検討を行います。
注意
この記事は、記載の対策によって安全であることを保証するものでは有りません。
PDF やファイルを共有する際は、組織のルールに従って共有をしてください。
この記事は、永遠に作りかけです。
対策方法が分かり次第、対応策を逐次追記します。
TL;DR
以下のような対応は情報漏えいにつながるため、避けてください。(SHOULD NOT)
- Excel や Word で機密データを黒塗りする。
- PDF ファイルの編集で機密データを黒塗りする。(ただし、墨消しツールを除く)
- PDF ファイル上で機密データを編集して保存する。 (ただし、墨消しツールを除く)
- PDF 前のファイル名や、作者などに機密情報が入っている。
- モザイク処理で機密データをマスクする。
- マーキングペンにより物理的に機密データをマスクする。
なぜ漏洩が発生するのか?
PDF から情報漏えいが発生する背景には、 PDF ファイルがもった技術的な特徴が影響している場合が多いと考えます。
ここでは、情報漏えいにつながる背景や、必要な対策について検討します。
レイヤー機能によりデータが閲覧できる。
PDF は、 透明なシートが複数重なって 1枚の紙になったようなデータ構造をしています。
よくある漏洩として、画像や文書の上に黒いシートを重ねた状態で公開している。というものがあります。
この場合、上の黒いシートを移動させることで下の情報を確認することが出来ます。
これは、例えば Word や Excel などで、上に黒いシートを重ねて PDF 変換した場合も同様です。
Word や Excel から黒塗り変換を行いたい場合は、データを削除した上で黒塗りを行う。
または、一度画像に変換し、画像編集ソフトで黒塗り処理を行う必要があります。
編集履歴により、過去の機密データが残る。
PDF は、追記型のデータ構造をしています。
たとえば、編集でデータを削除しても、以前のバージョンを復元することが可能です。
PDF 編集ソフトで、データの削除や黒塗りを行っても、以前のバージョンを復元することでデータが漏洩することが考えられます。
対策としては、印刷機能を経由して PDF 変換を行うことが考えられます。
最近のパソコンには、 印刷機能のなかに PDF 変換が含まれています。
これを利用することで、過去の編集履歴は変換時に失われるため、以前のバージョンからのデータ漏洩は発生しません。
メタデータに機密情報が入っている。
PDF には、文書自体の情報であるメタデータが含まれています。
これには、変換前のオリジナルの文書名や、オリジナルの形式、オリジナルのソフト名、作成者、変換ソフトなど、多岐にわたる情報が含まれています。
ファイル名に、氏名などの機微情報を含んでいた場合、PDF のメタデータに該当の情報が残る場合があります。
PDF 変換を行う際は、オリジナルのファイルから機微情報を削除するとともに、変換のオプションでメタデータを極力含まないように変換してください。
また、変換後のメタデータを確認することで、意図しないデータが含まれていないか確認を行った後に共有を行うことが必要です。
モザイク処理が完全ではない。
人間の認識による不備で、モザイク処理が読める場合があります。
モザイク処理で画像や文字列を隠した場合、元の画像では読めなくても、縮小すると読めるようになることがあります。
これは、人間の目がかけた情報を補い、補完するためです。
特に、数字や英語、ひらがななどの簡単な文字列の場合、縮小することによって読めるようになることが多々あります。
マスク処理を行う場合は、モザイクのマス目を充分に大きくする、黒塗りにするなどの対策が必要です。
マーキングペンによる黒塗りが不完全
マーキングペンによって行われた黒塗りが、画像加工によって情報漏えいする場合があります。
一度印刷したものをマーキングペンによって黒塗り、スキャンして PDF 変換する場合、
紙の状態や PDF データ上では完全に黒塗りされているように見えても、画像処理によって復元可能な場合があります。
マーキングペンなどの物理的な手法によって行われた黒塗りは不完全であることの確認が難しいため、
必ず画像編集ソフトなどを用いたデジタル上での黒塗りも併用してください。
以上