異常検知の最新動向レポート 2024-2025
MCPの御世話になりながら、異常検知の最新動向を簡単にまとめてみました。
要約
2022前後に異常検知技術が大きく発展して、これから飛躍的な進化は難しいなと思っていたところ、2024年から2025年にかけても新しい技術が次から次へと出てきました。すなわち、深層学習の進化、生成AIの活用、そして基盤モデル(Foundation Models)の導入などで、応用範囲が広がって新たな発展期に入ったようです。製造業における品質検査から、IoTネットワークのセキュリティ、金融詐欺検出まで、異常検知の応用範囲は急速に拡大しています。
世界の異常検知市場は2024年の42億8,000万米ドルから年率10%で成長すると予測されています。この記事では、過去数年間の技術進歩の歴史を概観した上で、直近の2024年から2025年の進化内容を整理し、最新のアルゴリズム動向、産業応用事例、そして今後の展望について紹介したいと思います。
1. 異常検知技術が注目されるわけ
1.1 労働力課題
これまでの産業を支えてきた熟練技術者が続々と引退する年代になってきている一方、少子高齢化であらたに産業界に入ってくる若年労働者の数が減少しているという問題があります。それにともない、工場などでは技能継承が難しくなっている状況にあります。そのため、なるべく人手に依存しない品質管理システムの必要性がますます高まっています。
1.2 技術的要因
深層学習技術が成熟度を増し、利用環境が整ってきています。さらに、拡散モデル、GANなどの画像系の生成AIが実用的になったこと、 CLIP、VLMなどの基盤モデルの産業応用が進んできたこと、これらが異常検知の発展に寄与するという技術的要因があります。
1.3 産業ニーズ
世界的な技術競争の激化は、当然のことながら品質要求の高度化を招いています。また、デジタル変革(DX: Digital Transformation)の波に乗り遅れると淘汰されるという危機感があり、コスト削減と効率化を両方を同時に目指すことで競争に打ち勝つことが求められています。
2. 異常検知技術の歴史を振り返る
2.1 フェーズ1:ベンチマーク時代の幕開け(2019年)
2019年以前は、自前のデータセットを自前の指標を使って評価するのが一般的で、技術同士の優劣が明確ではありませんでした。性能を見定める評価軸はないことが、産業での応用が進まなかった原因の一つであったと考えられます。
そこに現れたのが、MVTec ADデータセットです。
MVTec Anomaly Detection Dataset
https://www.mvtec.com/company/research/datasets/mvtec-ad
MVTec ADは、産業用外観検査における標準ベンチマークとしての地位を獲得しました。その結果、共通の技術比較軸ができ、技術革新がスピードアップしました。MVTec ADの特徴を以下に示します。
- 実写・実機に近い欠陥データの収集
- 画像レベル・ピクセルレベルの評価の共通化
- 15カテゴリ、5,000枚以上の高品質画像
2.2 フェーズ2:ラベル不足と局所化への挑戦(2020-2021)
一般に、正常データは大量にあるものの、不良サンプルは希少であり、異常データ収集に課題を抱えていました。そのため、正常データのみで学習し、未知の欠陥も検出したいという要求が高まっていました。さらに、異常の有無だけでなく、異常と判定された場所はどこかという(局所化)も望まれていました。その解決策として、以下のものが提案されました。
解法①:知識蒸留(Knowledge Distillation)
大きな教師モデルの特徴を小さな学生モデルに模倣させ、両者の出力差が大きい箇所を「異常」として検知します。正常データのみで訓練可能、推論計算コストが低い、未知の異常パターンにも対応できる、などの利点があります。代表的な手法に Uninformed Students があります。
Student-Teacher Anomaly Detection with Discriminative
https://arxiv.org/abs/1911.02357
解法②:再構成系(AE/VAE/GAN)
AE/VAE/GANなどのモデルを使って復元した画像は、「正常品ならそっくりに復元できるのに対し、異常品は復元に失敗する」というギャップを使って検知する方法です。直感的にはうまくいきそうですが、異常まで復元してしまうモデルでは使えない、損失関数の設計とノイズ耐性の工夫が継続的に必要などの課題があります。代表的な手法に DRAEM があります。
DRAEM -- A discriminatively trained reconstruction ...
https://salty-vanilla.github.io/portfolio/post/dream/
2.3 フェーズ3:密度推定とメモリバンクの台頭(2021-2022)
フェーズ2の課題をクリアする手法が提案されました。
- 画像復元の曖昧さを避け、正常分布からの外れ度を厳密に測定
- 推論高速化と省メモリ化の両立
解法①:正規化フロー(Normalizing Flow)
特徴を正規分布に写像し、確率密度で異常度を定量化する方法です。利点は、数学的に厳密な確率評価ができる、高速推論ができる、解釈性が高いなどです。代表手法な手法に以下の2つがあります。
- FastFlow (2021): 高速な異常検知を実現 https://arxiv.org/abs/2111.07677
- DifferNet (2021): 差分ベースのフロー https://arxiv.org/pdf/2008.12577
- CFlow-AD (2022): 局所化のリアルタイム志向 https://arxiv.org/abs/2107.12571
解法②:メモリバンク(最近傍記憶)
正常特徴を記憶庫に蓄積し、最近傍距離や類似度で異常度を測定する方法で、代表手法に以下があります。
PaDiM (2021): https://arxiv.org/pdf/2011.08785
パッチごとの多変量ガウス分布で正常分布を明示的にモデル化する方法で、画素レベルの異常検知に優れています。
PatchCore (2022):https://arxiv.org/pdf/2106.08265.pdf
中層パッチ特徴を活用する方法で、アルゴリズムは単純だが非常に強力であり、MVTec ADで高精度を達成しています。産業応用に適した実用性コアセット圧縮により高性能と高速性の両立が可能で、埋め込み系異常検知の代表格といえます。
2.4 フェーズ4:意味理解と生成モデルの刷新(2023年)
論理的不整合や高次の意味に基づく異常の検出(部品欠落、取り付けミス等)ができる、テクスチャだけでは捉えにくい異常、への対応が可能、という利点がありますが、複雑背景や微小欠陥での局所化困難という弱点もあります。
解法①:言語-視覚事前学習(CLIP系)
テキストプロンプトで「正常/異常」概念を与える方法で、ゼロショット/少数ショットで新しいタスクに適応できます。代表的な手法である WinCLIP (2023)の特徴は、CLIPの視覚エンコーダを活用し、テキストによる柔軟な異常定義できて、ラベルデータなしでの適応が可能であることです。それにより、事前学習済み知識の活用や複数カテゴリへの汎用性、データ効率の向上が見込めます。
https://openaccess.thecvf.com/content/CVPR2023/papers/Jeong_WinCLIP_Zero-Few-Shot_Anomaly_Classification_and_Segmentation_CVPR_2023_paper.pdf
解法②:拡散モデル(Diffusion Models)
表現力の高い生成モデルによる復元品質の向上を図り、ノイズ除去プロセスを利用した異常検知です。具体的には、順拡散プロセス(データ→ノイズ)や逆拡散プロセス(ノイズ→データ復元)、復元誤差による異常スコア算出を行います。
想定される適用対象は、異常サンプルの合成生成や難しい背景での検知、高精度な局所化などで、画像異常検知での復元品質向上、マスキング戦略による欠測値処理が期待されます。
A Survey on Diffusion Models for Anomaly Detection
https://arxiv.org/abs/2501.11430
2.5 フェーズ5:基盤モデル化と実装展開(2024-2025)
残された課題は、マルチカテゴリ・未知欠陥への汎化、3D形状異常の把握、現場導入(速度、省電力、セキュリティ)などでしたが、以下の対策が取られるようになりました。
解法①:視覚言語モデル(VLM)への適応
プロンプトエンジニアリングの高度化、マルチモーダル特徴融合の最適化、意味駆動型検知の強化が取り組まれました。2023-2024年の主要研究を以下の表にまとめています。
| 手法 | 年 | 特徴 | ソース |
|---|---|---|---|
| CLIP-AD | 2023 | CLIPの産業検査への初期適用 | https://arxiv.org/abs/2311.00453 |
| AnomalyCLIP | 2024 | 異常検知専用のCLIP最適化 | https://arxiv.org/pdf/2310.18961.pdf |
| AdaCLIP | 2024 | 適応的プロンプト設計 | https://arxiv.org/abs/2407.15795 |
| DiAD | 2024 | 二段階異常検知フレームワーク | https://github.com/lewandofskee/DiAD |
解法②:3D・マルチモーダル異常検知
三次元データセットである MVTec 3D-ADデータセットが整備され、多視点画像の統合や点群データの活用が進んできたと同時に、RGBカメラだけでは捉えにくい形状/深度の異常も評価したいという要望が増え、さらに立体構造の欠陥検出ニーもズ増えています。具体的には、精密部品の形状検査、建造物の構造健全性評価、3Dプリント製品の品質管理の実用化が視野に入ってきています。
THE MVTEC 3D ANOMALY DETECTION DATASET
https://www.mvtec.com/company/research/datasets/mvtec-3d-ad
解法③:実運用技術(エッジ・セキュリティ・継続学習)
エッジコンピューティングでは、FPGA/TPUによる高速推論、エッジ-クラウド協調処理、リアルタイム異常検知が実用レベルになってきています。セキュリティ対策分野では、対攻撃性(Adversarial Robustness)、データ漏洩防止、フェデレーテッドラーニングが進められています。継続学習では、インクリメンタル学習による適応、オンライン学習の実装、モデル更新の自動化などが進行中です。
以上