趣旨
- 一般物体認識のアルゴリズムは、改良が続いていて性能の向上が著しい。
- だからといって、一般物体認識を利用した利用例が、必ずしも飛躍的に伸びているとは言い難い。
- それは実は、問題の本質が一般物体認識にあるのではないのにかかわらず、一般物体認識の問題としてしか理解していないことによるのではなかろうか?
一般物体認識の後に続くありがちな処理
例:前方車両検出
- 追跡処理
- 検出対象の方位と角度幅の算出
- 検出対象物への距離の算出
- 検出対象物との相対速度の算出
- 衝突可能性と衝突予測時刻の算出
- 緊急ブレーキ処理の判断
(前方の車両検出を見つけたいという処理は、これらの後処理を含んだものになっている。)
参考記事 qiita AI映像解析で車両の速度を自動算出すると異常値ばっかりで苦労した
交差点での車両検出
- その車両があるというだけの情報では、行動を起こすための情報としては不足していますよね。
- それが自車の進行方向に対して影響する車両なのかどうかが知りたいですよね。
- その自動車は近づいてくいる側の見え方なのか、前方に進行している車両なのかの区別は必須ですよね。
- 四角い枠で囲ってあるのでは不十分であって、どっちの見え方なのかという見え方の分類も必要ですよね。
- 乗用車と大型車両との区別もほしいですよね。
- 右折するタイミングを見計らっている車両についても注意を払いたいですよね。
- 自車が右折車両だったら、トラックの影に直進しようとするバイクが隠れているかもしれないという予測に基づいて、余裕のある判断で右折をしたいですよね。
- そういった全てを満たすように、交差点での車両検出はなされているはずですよね。
例:信号検出
1.交通信号を検出する
2.交通信号が何色の表示であるか判定する。
3.自車の走行に影響する信号を選択する。
4.信号に付随する表示の検出
5. さまざまな車両の照明と信号との区別。
6. さまざまなイルミネーションとの区別
6. 標識検出も関連している。
6. 信号の時系列的な理解。青信号・黄信号・赤信号への推移を理解すること。
6. 信号機は、3次元のルートの中でその位置を開削されなくてはならない。
(だから、画像上の位置では不十分だ。)
信号機は、それがどのルートのどういう車種に向けてなされているものかを解釈されねばならない。
参考記事 Zenn 【自動運転】信号機認識に挑む / 走行画像15,000枚のアノテーションとYOLOXモデルによる深層学習実践
例:立ち入り禁止区域への立ち入り者の検知
1.人物検出
2.立ち入り禁止区域の理解
3.検出した人物の位置と立ち入り禁止区域との判定の連動
4.人物の追跡
5.人物の顔の検出
6.照合可能な顔画像の保存
7.警備システムへのアラーム処理
8.記録の保持。
いずれの場合も検出したこと自体は一連の処理の最初のきっかけにすぎないということだ。
- だから、最初の検出をクリアしたところで、残りの課題が解決しなければならないまま残っている。
- ビジネスとして成功するための他の要因をどのように解決するのかを同時に考えなくちゃならない。
解決しやすい課題に置き換えることが大事
~回転レーン上での寿司カバーの異常を検知し迷惑行為を防止
食べ終わった皿をレーンに戻すなどの行為があった場合 に検出するということに徹していることで、課題の多くを解決している。
付記: 検出してくれという依頼が実は検出だけではないことについて類似の指摘
ディープラーニングで映像から動かない歩行者を検出するのに苦労した
・映像解析はCSV吐き出して終わりではない。どこまで何を可視化するかが重要。