はじめに
顔検出のOSSモデルは数多く存在しますが、いざ商用利用しようとするとライセンスの罠が潜んでいます。特に注意すべきは以下の点です。
- ソースコードのライセンスと学習済みモデルの重みのライセンスが異なるケースが多い
- コードがMITでも、重みが非商用の学習データで訓練されている場合、商用利用はグレーゾーンまたはNG
- 学習データセット自体のライセンスが重みに波及するかどうかは法的に議論が分かれる
本記事では、主要な顔検出のライセンスを網羅的に調査し、商用利用の可否を一覧にまとめました。
TL;DR: 商用利用可否の一覧表
顔検出モデル
| モデル | 開発元 | コードライセンス | 重みライセンス | 商用利用 |
|---|---|---|---|---|
| BlazeFace (MediaPipe) | Apache 2.0 | Apache 2.0 | OK | |
| YuNet | OpenCV Zoo | MIT | MIT | OK |
| libfacedetection | Shiqi Yu (深圳) | BSD 3-Clause | BSD 3-Clause | OK |
| Ultra-Light-Fast-Face-Detector | Linzaer | MIT | MIT | OK |
| CenterFace | Star-Clouds | MIT | MIT(WIDER FACEで訓練) | グレー |
| MTCNN | Kaipeng Zhang | MIT | MIT (WIDER FACEで訓練) | グレー |
| RetinaFace | InsightFace | MIT | 非商用 | NG |
| YOLOv8-face | Ultralytics | AGPL-3.0 | AGPL-3.0 | NG (Enterprise License要) |
各モデルの詳細
BlazeFace (MediaPipe)
| 項目 | 内容 |
|---|---|
| 開発元 | |
| 用途 | 顔検出(軽量・モバイル向け) |
| コードライセンス | Apache 2.0 |
| 重みライセンス | Apache 2.0 |
| 商用利用 | OK |
| GitHub | https://github.com/google-ai-edge/mediapipe |
MediaPipe に含まれる BlazeFace は、コード・モデル重みともにApache 2.0で提供されています。Apache 2.0 には特許権の付与も含まれており、商用利用において最もリスクが低いモデルの一つです。Full-range modelのサイズは1.1MBほど(tflite形式)。
YuNet
| 項目 | 内容 |
|---|---|
| 開発元 | Shiqi Yu |
| 用途 | 顔検出 |
| コードライセンス | MIT |
| 重みライセンス | MIT |
| 商用利用 | OK |
| GitHub | https://github.com/opencv/opencv_zoo/tree/main/models/face_detection_yunet |
OpenCV Zoo の公式顔検出モデルです。旧来の OpenCV DNN 顔検出器(res10_300x300_ssd)はライセンスが不明確ですが、YuNet はMITで明確に商用利用可能です。モデルのface_detection_yunet_2023mar.onnxのサイズは227KB。
根拠: OpenCV Zoo face_detection_yunet、元実装 ShiqiYu/libfacedetection
libfacedetection
| 項目 | 内容 |
|---|---|
| 開発元 | Shiqi Yu |
| 用途 | 顔検出 |
| コードライセンス | BSD 3-Clause |
| 重みライセンス | BSD 3-Clause |
| 商用利用 | OK |
| GitHub | https://github.com/ShiqiYu/libfacedetection |
C++で実装された軽量な顔検出ライブラリです。SIMD最適化時に1000FPSを達成する高速モデル。現在のオープンソース版はBSD 3-Clauseです。
Ultra-Light-Fast-Generic-Face-Detector-1MB
| 項目 | 内容 |
|---|---|
| 開発元 | Linzaer |
| 用途 | 顔検出(超軽量) |
| コードライセンス | MIT |
| 重みライセンス | MIT |
| 商用利用 | OK |
| GitHub | https://github.com/Linzaer/Ultra-Light-Fast-Generic-Face-Detector-1MB |
1MBという軽量モデルで、ONNX形式のエクスポート(version-RFB-640.onnx 等)も MIT で配布されています。
CenterFace
| 項目 | 内容 |
|---|---|
| 開発元 | Star-Clouds (Yuanyuan Xu et al.) |
| 用途 | 顔検出・アラインメント |
| コードライセンス | MIT |
| 重みライセンス | MIT |
| 商用利用 | グレーゾーン(学習データの来歴に注意) |
| GitHub | https://github.com/Star-Clouds/CenterFace |
7.3MBのコンパクトなアンカーフリー顔検出モデルです。コード・重みともにMITで配布されています。ただし、論文(arXiv:1911.03599)に記載の通り、WIDER FACEのトレーニングセットで訓練されており、WIDER FACEは商用利用を明示的に禁止しているため、学習データの非商用制限がどこまで波及するかはグレーゾーンです。
MTCNN
| 項目 | 内容 |
|---|---|
| 開発元 | Kaipeng Zhang et al. |
| 用途 | 顔検出・アラインメント |
| コードライセンス | MIT |
| 重みライセンス | MIT(ただし WIDER FACE で訓練) |
| 商用利用 | グレーゾーン |
| GitHub (原著) | https://github.com/kpzhang93/MTCNN_face_detection_alignment |
| GitHub (Python) | https://github.com/ipazc/mtcnn |
コードと重みはMITで配布されていますが、原著論文(IEEE SPL 2016)の通り、顔検出の学習にWIDER FACEのトレーニングセットが使用されています。WIDER FACEデータセットは商用利用を明示的に禁止しており、モデルの重み自体はMITでリリースされているものの、非商用データから派生した重みの商用利用が法的にどう解釈されるかは議論が分かれます。
RetinaFace
| 項目 | 内容 |
|---|---|
| 開発元 | InsightFace (Jiankang Deng et al.) |
| 用途 | 顔検出 |
| コードライセンス | MIT |
| 重みライセンス | 非商用(研究目的のみ) |
| 商用利用 | NG |
| GitHub (公式) | https://github.com/deepinsight/insightface |
| GitHub (serengil) | https://github.com/serengil/retinaface |
serengil のラッパーも MIT ですが、内部で使われる InsightFace の学習済み重みは非商用制限を継承します。
YOLOv8-face
| 項目 | 内容 |
|---|---|
| 開発元 | Ultralytics(ベース)/ 各種コミュニティフォーク |
| 用途 | 顔検出 |
| コードライセンス | AGPL-3.0 |
| 重みライセンス | AGPL-3.0 |
| 商用利用 | NG(Enterprise License が必要) |
| GitHub | https://github.com/ultralytics/ultralytics |
AGPL-3.0 はネットワーク経由でサービス提供する場合もソースコード公開が必要です。クローズドソースでの商用利用にはUltralytics Enterprise Licenseの購入が必要です。
学習データセットのライセンス
多くのモデルの商用利用可否は、学習に使われたデータセットのライセンスに大きく左右されます。
| データセット | ライセンス | 商用利用 | 備考 |
|---|---|---|---|
| MS-Celeb-1M | 非商用研究のみ | NG | 2019年にMicrosoftが撤回。倫理的問題あり。コピーはAcademic Torrents等に残存 |
| CASIA-WebFace | 非商用・教育目的のみ | NG | CASIAのデータベースリリース契約が必要 |
| VGGFace2 | CC BY-NC 4.0 | NG | 公式のダウンロードリンクは既に利用不可 |
| WebFace260M / WebFace4M / WebFace12M | 学術研究のみ | NG | 明示的に商用利用を禁止 |
| WIDER FACE | 商用利用不可 | NG | 顔検出用。「商用目的の搾取」を明示的に禁止 |
| LFW (Labeled Faces in the Wild) | ライセンス未定義 | 不明確 | 正式なライセンスが存在せず権利が不明確。元画像はWebクロールであり各画像の著作権は元の権利者に帰属 |
学習データの問題: MS-Celeb-1M
MS-Celeb-1M は特に注意が必要です。
- 2016年にMicrosoftが「100万人のセレブリティ」として公開
- 実際にはジャーナリスト、活動家、学者など一般人も多数含まれており、同意なく収集されていた
- SenseTime、Megvii等の監視技術企業の論文で使用された
- 2019年にMicrosoftが撤回したが、20以上のGitHubリポジトリでMS-Celeb-1Mで訓練されたモデルが公開されている
- 撤回後18ヶ月間で120以上の研究論文が引用
法規制の概要
EU AI Act(2025年2月施行開始)
| 規制対象 | 内容 |
|---|---|
| 禁止 | インターネット / CCTV からの顔画像スクレイピングによるデータベース構築(例外なし) |
| 禁止 | 公共空間でのリアルタイム遠隔生体認証(限定的例外あり) |
| 禁止 | 人種・政治的意見・性的指向を推定する生体分類 |
| 禁止 | 職場・教育機関での感情認識 |
| 高リスク | 上記以外の遠隔生体認証システム(2026年8月から義務化) |
| 対象外 | 生体認証(1:1照合、例: スマホのロック解除) |
違反時の罰則: 最大3,500万ユーロまたは全世界年間売上高の7%
重要な区別として、Verification(1:1照合)とIdentification(1:N識別)で規制の厳しさが大きく異なります。
日本(個人情報保護法 / APPI)
- 顔の特徴データは個人識別符号として個人情報に該当
- ただし、生体データは現行法では要配慮個人情報に分類されていない(GDPRとの大きな差異)
- 2023年3月に個人情報保護委員会が顔識別機能付きカメラシステムの利用に関するガイダンスを公表
商用利用時の推奨事項
安全に商用利用できるモデルの選び方
最もリスクが低い選択肢:
- BlazeFace / MediaPipe — Apache 2.0 + Google の特許付与。検出のみ
- YuNet (OpenCV Zoo) — MIT。検出のみ
- クラウドAPI (Rekognition, Azure Face, Cloud Vision) — ライセンス問題なし。従量課金
まとめ
顔検出モデルの商用利用において最大の落とし穴は、「コードのライセンス」と「学習済み重みのライセンス」の乖離です。多くのモデルでコードは MIT や Apache 2.0 といった寛容なライセンスですが、学習済み重みは MS-Celeb-1M、CASIA-WebFace、VGGFace2 等の非商用データセットで訓練されています。
商用プロジェクトで安全に利用するには:
- スタック全体のライセンスがクリーンなモデルを選ぶ(MediaPipe 等)
- または、許容的ライセンスのコードを使い、自前のデータセットで訓練する
- またはクラウドAPIを利用する(AWS Rekognition, Azure Face, Google Cloud Vision)