本記事は公開情報と個人的な技術検討をもとに構成しています。特定の実運用環境に基づく数値・成果物は含みません。
この記事の位置づけ
本記事はシリーズの第3稿にあたる。
第1稿では固定カメラ前提での精度劣化の診断と再設計を扱った。第2稿では誤検知への対処としてハードネガティブマイニングの判断基準を整理し、「背景のバリエーションを明示的に学習させることで、撮影環境の制約を緩和できる」という方向性を示した。
本稿ではその先を扱う。固定カメラで構築したモデルを移動体カメラ条件に拡張する際のデータセット再設計だ。AMR(自律移動ロボット)への搭載を想定した事前検証として実施した。
問題の構造:固定カメラと移動体カメラで何が変わるか
第1稿で扱ったドメインシフト問題の第二形態として整理できる。
第1稿の問題は「静止画で学習、動画で推論」というギャップだった。今回の問題は「固定背景で学習、移動背景で推論」というギャップだ。問題の構造は同じだが、対処の設計は変わる。
| 比較軸 | 固定カメラ | 移動体カメラ |
|---|---|---|
| 背景の制御 | 撮影場所を選べば単純化できる | 360度方向に映り込む、制御不能 |
| 視点の変動 | ほぼ固定 | 移動に伴い連続的に変化 |
| 背景対処の設計 | 単純な背景を選んで回避 | 背景バリエーションを学習して対処 |
固定カメラでは「単純な背景(壁・ボード)を意図的に選ぶ」という撮影設計で背景への誤反応を回避していた。移動体カメラではその戦略が成立しない。360度方向に映り込む多様な背景を、データとして吸収する設計に切り替える必要がある。
最大の懸念はFP(偽陽性:検出対象でないものを誤って検出してしまうこと)の増加だった。移動体視点では背景の複雑さが固定カメラと比較にならない。この懸念に対してどう設計したかが本稿の核心だ。
検証環境の設計と限界
AMR実機が用意できない条件で移動体カメラをどう模擬するか、という問題から始まった。
採用した方法はキャスター付きハイテーブルにノートPCを載せ、手で押して移動させるというものだ。協力者2名にカメラ前をランダムに移動するよう指示し、撮影した。
この方法で再現できるものと再現できないものを明確にしておく。
再現できるもの
- 移動体視点固有の背景パターン(360度方向への映り込み)
- 視点の水平移動に伴う背景の変化
- 撮影対象の位置・角度のばらつき
再現できないもの
- AMR実機の速度域・加速度特性
- 実機走行時の振動によるブレ
- 実際の運用空間の空間構造
本番環境を完全に模擬できているとは言えない。ただし「移動体視点固有の背景パターンを収集する」という目的に対しては機能した。検証設計の限界を認識した上で、得られた知見をPoC設計の前提条件として扱う。
データセット設計の三つの判断
判断① 固定カメラデータとの比率設計
移動体カメラデータを既存の固定カメラデータセットに追加する設計とした。
データ量の不均衡がドメイン間の重みの偏りを生じさせると判断し、固定カメラデータと移動体カメラデータの比率を50:50に近づけることを意識した。
厳密な均衡ではなく「意識した」という表現にとどめているのは、撮影可能なサンプル数の制約があったためだ。しかし、どちらかのドメインが圧倒的に多い状態を避けることには意味がある。一方のドメインに偏ったデータセットで学習させると、もう一方のドメインへの適応が弱まる。
判断② カメラ高さの選定と事後再評価
カメラ高さは170cmに設定した。日本人の平均身長を基準とした。AMR搭載を想定した場合、カメラが人の目線高さ付近に位置するという前提からの選定だ。
撮影後の検討で、180cmのやや俯瞰角度の方が検出精度向上が期待できるという仮説に至った。理由はヘルメットの天面が映り込む面積が増えるためだ。ヘルメット着用判定において、天面の視認性は重要な特徴量になる。
この仮説はPoC設計に反映した。初期設計で設定した根拠を言語化し、事後の再評価プロセスで修正する——この反復が設計の精度を上げる。
判断③ 背景負例の設計思想の転換
これが今回の設計変更の核心だ。
固定カメラ時代の背景対処は「撮影場所を選ぶことで単純な背景に限定する」という回避策だった。
移動体カメラでは回避が不可能になる。テストサイトで実際に映り込んだ背景パターンは以下のようなものだった。
- 蛍光灯からの逆光
- 天井の高い空間における空調・照明の骨組み
- 自然光が入る窓ガラス
- 机、衝立、ディスプレイ
これらをラベルなし画像として学習データに追加した。360度全方向の背景パターンを明示的にネガティブとして学習させることで、移動体視点固有のFP増加を設計段階から抑制する方針だ。
第2稿で整理したイージーネガティブの役割——「撮影環境の制約を緩和する」——を、移動体カメラという条件で実際に適用した形になる。
結果として、最大の懸念だったFP増加は想定より限定的だった。背景の明示的学習という設計判断が機能したと評価している。ただし「なぜ機能したか」の定量的な検証は今後の課題として残る。
撮影環境の照明条件について
テストサイトは蛍光灯がカメラに対して逆光として入りやすい構造だった。
本番運用環境を完全に模擬した条件とは言えない。一方で、照明条件の観点ではハードな側の設定になったと評価している。逆光という難しい条件での撮影データが学習に含まれることは、照明変動への頑健性という観点ではプラスに働く可能性がある。
意図した設計ではなかったが、撮影環境の物理的制約がデータセットに対して追加的な条件負荷を与えた事例として記録しておく。
残課題と次の設計への接続
本稿で設計した移動体データセットは、推論環境の要件を自然に変化させる。
固定カメラ前提では問われなかった問いが浮上する。「何FPSで推論するか」「カメラのフレームレートと推論速度のバランスをどう取るか」「移動体搭載に適したエッジAIユニットの選定基準は何か」——これらは移動体化によって初めて設計上の問いになる要件だ。
第1稿でモーションブラーをデータ側で吸収したのと同じ問題意識が、次のフェーズではハードウェア選定という別の角度から再び問われることになる。
次稿ではエッジAIユニットの選定基準、カメラ選定の判断軸、TensorRT変換による推論最適化の設計判断を扱う予定だ。