ニューラルネットワーク
人口ニューラルネットワークデータから複雑な情報を解析する。
画像が認識した特徴をもとに重みづけを行い、インプット情報が何かを判断する。
どのように認識しているかは必ずしもわからない。
車を認識した際に、
車輪、窓、色などを検知する。
その際に、
0.8車輪+0.2窓+0*色など。
また、コンピュータ側で認識した特徴から重みづけを調整していく。
バックプロパゲーション
学習はトレーニングと言われ3つのステップがある。
フィードフォワード、エラー測定、バックプロパゲーション
フィードフォワード
人口ニューロンの値である初期重みをランダム化する。ニューラルネットワークを通じて各画像をフィードして、出力地を生成する。
エラー測定
グラウンドトゥルースラベルとフィードフォワードプロセスによって生成された出力との差のこと。
バックプロパゲーション
フィードフォワードプロセスと同様に、ニューラルネットワークを介してエラーを逆方向に送信する。
3つのステップを繰り返すことで、正確なニューラルネットワークが形成される。
畳み込みニューラルネットワーク(CNN)は知覚の問題に適した人口ニューラルネットワークの一種である。
画像行列を1つのきょどあいな業に接続するベクトルに再形成することにより、画像を1次元ピクセル配列に展開できる。しかし、画像のピクセルがピクセル配列に分散し検出が困難になる。
そのため、CNNは入力ピクセル間の空間関係を維持することで解決する。
入力画像上を継続的にスライドさせて情報を収集するフィルターがあり、情報を収集すされるたびに全体画画像の小さな領域のみが分析される。
入力画像全体に畳み込みフィルターを使用することで、エッジと色の情報を使用して車輪、ドア、フロントガラスなどのより複雑な構造を検出する可能性がある。
Detection and classfication
障害物には動的と静的がある。
静的障害物は壁、木、電柱、建物
動的障害物は歩行者、車両、自転車など
障害物のクラスによって自動運転車両の挙動を変化させる必要があある。
前方の障害物が自転車の場合は速度を落とし、回避。
先行者の場合は追従する形になる。
また、信号機の場合色によって信号機を分類する。
R-CNN, Fast R-CNN, Faster-RCNN, YOLO, SSD