初めての機械学習に使うデータセットについての質問(実務)
解決したいこと
お菓子を生産ラインを自動化するため、お菓子に欠けがあるかどうか判定するためのソフトウェアを開発することになり、画像処理及び機械学習が素人なので現在を勉強しています。深層学習で判別させるようと考えておりまして、単純に定点観測し、下記の画像のように欠けがあるかないかの判定を行うだけです。
データセットについての質問
欠けがあるかないかの判定は赤枠の列のみ判定したく、他の列に欠けがあるかどうかは考慮しません。取り合えず、欠けのない写真、欠けのある写真を撮影しまくっているのですが、こういった場合、モデルに与える画像データはOpenCVなどで赤枠の列のみトリミングして取り出して、正解ラベル(欠けなし)と不正解ラベル(欠けなし)と分けた方が良いのでしょうか?
それとも他の列に欠けがあったとしても赤枠の列に欠けがなければ正解ラベルとし、赤枠列のみ欠けがある場合は不正解ラベルとして学習させた方が良いのでしょうか?
アルゴリズムの選定についての質問
アルゴリズムを全て理解しているわけでなく、取敢えず、参考書に記述されていた、KerasのSequentialモデルから試してみようかと思っておりますが、今回のように定点観測でバックグランドがほぼ変わらないような画像で、小さな変化だけで判定するような場合はどういった方法が最適でしょうか?
申し訳ございません。本来は自分で試行錯誤しながら最適解を見つけていくものだとは思いますが、何かアドバイスだけでもいただけると助かります。
お忙しいところ恐縮ですがご意見いただけると幸いです。