画像認識における、画像分類、画像検出、セマンティックセグメンテーションの3つを紹介します。
画像分類
画像分類は取り込んだ画像を学習データから種類別に分類するのが目的です。この場合は読み込んだ画像に写っているものが猫か犬かマグカップか帽子かの種類分けをします。
画像検出
画像の中から何が・どこにあるのか見つけることができます。上の画像では、読み込ませた写真の中の目の位置から顔を推定して人の正面顔(front-face)がどこにあるかを見つけ出しています。飛鳥ちゃんと白石さんをちゃんと見つけられていますね。
セマンティックセグメンテーション
画像検出とは異なり、ピクセルごとに意味付けをして領域ごとの意味付けを行います。上の画像でバイクとライダーがしっかり区別されて検知されました。