最近、いろいろな案件で異常検知用の機械学習モデルを作成することが多いので、自分がよく使うオープンデータをダウンロードできるサイトのリンクをまとめて、データセット一覧を作成してみました。
今後も新しく見つけたデータセットを追記していくつもりです。
データセット一覧
画像データ系
MVTec
産業検査に焦点を当てた異常検知用の画像データセット。現時点で15種類のデータセットが公開されており、種類が豊富。
よく論文でベンチマークとして使われている。
ADFI
最近公開された異常検知用の画像データセット。
サイトは日本語なのでわかりやすい。外観検査などに使用できる。
時系列データ系
心電図・呼吸データ
2005年に公開された時系列データセット。心電図データや呼吸データなどが公開されている。
E-Commerceデータ
Amazonが公開しているデータセット。プラットフォームと利用国ごとの、閲覧数・収益を1時間おきに記録した履歴データ。
音声データ系
機械操作音データ
小型機械の操作音のデータセット。3つのサブデータセットが含まれている。
様々な音のデータ
Googleが公開している音声データ。人の声、動物の鳴き声、楽器の音などが含まれている。
異常検知の関連記事