ICCV2017より以下の論文
[1] W. Andrew, et. al. "Visual Localisation and Individual Identification of Holstein Friesian Cattle via Deep Learning"ICCV2017
のまとめ
CVF open access:
https://openaccess.thecvf.com/content_ICCV_2017_workshops/w41/html/Andrew_Visual_Localisation_and_ICCV_2017_paper.html
FriesianCattle2017 dataset:
https://data.bris.ac.uk/data/dataset/2yizcfbkuv4352pzc32n54371r
AerialCattle2017 dataset:
https://data.bris.ac.uk/data/dataset/2yizcfbkuv4352pzc32n54371r
いずれのdatasetもフリーで入手できる
概要
- ホルスタインの体の模様から個体識別を行う一連のシステムを提案している
- Deep Learningを同タスクに用いた最初の論文と主張
- 動画の各フレームに対してFaster-RCNN等でdetectionし、KCF trackerでトラッキングする。このシーケンスをInception-v3で特徴量化し、LSTMで回す
以下は detection、localization 部分の推論例。
システムの全体像
以下の図のような、ありがちなシステム。上側は単一フレームのみから個体認証するパターンで、detectionモデルのclassを個体数+backgraoundにする。
下側は動画のシーケンスを利用する手法。(前述)
これまでのホルスタインの個体認証に関して
ホルスタインを生体情報から個体認証する手法として、主に以下の3つが提案されている。
- 鼻あたりの模様から識別する手法
- 虹彩や顔、体から識別する手法
- 体の白黒模様から識別する手法
しかし現状の現場では生体情報以外の
- 耳タグ
が使われる場合が多い。
体の白黒模様から個体識別する従来手法
従来は
- PCA+SIFT(かなり初期)
- Affine SIFT+RBF-SVM
など用いられた。後者はかなり計算コストが高い。
データセット
以下2つのデータセットを利用した
- FriesianCattle2017 dataset
- AerialCattle2017 dataset
FriesianCattle2017 dataset
以下のような牛舎において上部から撮影したもの
- 940枚のRGB画像
- 89頭の個体
- 2fps
- FriesianCattle2015 datasetを改良したもの??
AerialCattle2017 dataset
以下のような野外においてドローン等を利用して上部から撮影したもの
- 34の群れ
- 160のシーン
- 23の個体
実験と結果
detection, localizationの精度
dataを2つに分けてクロス・バリデーションした。(fold1, fold2)
mAPは以下。
またrecall-precision curveは以下。
まぁ、こんなもんでしょう。
単フレームで個体識別した場合の精度
上記の単一フレームから個体識別するパターンの精度は以下。detectionモデルのみなのでmAPで評価。
複数フレーム(ビデオから)で個体識別した場合の精度
上記のLSTM等使うパターンの個体識別精度。