CNNでの入力画像サイズについての質問
解決したいこと
現在CNNを使って画像認識を行っているのですが、入力画像のサイズについて疑問になりました。
最初は画像サイズ150x150でやっていたのですが、サイズが上がれば精度も上がると思い、300x300のサイズで実行した場合精度が少し下がりました。サイズを大きくすると画像認識精度も上がるといった考え方は間違っているのでしょうか。また、CNNでの入力画像の推奨サイズがあれば教えてもらいたいです。
現在CNNを使って画像認識を行っているのですが、入力画像のサイズについて疑問になりました。
最初は画像サイズ150x150でやっていたのですが、サイズが上がれば精度も上がると思い、300x300のサイズで実行した場合精度が少し下がりました。サイズを大きくすると画像認識精度も上がるといった考え方は間違っているのでしょうか。また、CNNでの入力画像の推奨サイズがあれば教えてもらいたいです。
サイズを大きくすると画像認識精度も上がるといった考え方は間違っているのでしょうか
ケースバイケースだと思います。サイズを大きくすることで特徴量が増えるため、認識精度が向上する場合もあると思いますが、例えば画像の特徴がある特定箇所にのみ現れる場合は、その箇所を抽出して学習させた方が精度は向上します。CNNで画像認識精度を向上させるためには単にリサイズや水増しのみならず、その画像セットの特徴が現れるよう工夫する必要があります。以下の記事が参考になると思います。
CNNでの入力画像の推奨サイズがあれば教えてもらいたいです。
私は聞いたことがないです。
似たような質問を発見しました。
https://teratail.com/questions/93085
https://detail.chiebukuro.yahoo.co.jp/qa/question_detail/q13169485663
@beginner_programan
Questioner
ちなみに
CNNでの入力画像の推奨サイズがあれば教えてもらいたいです。
について、Optunaというハイパーパラメータチューニングのライブラリを使用すると良いかもしれません。CNNのスコアが最も良くなるように、画像サイズをOptunaが自動で調整してくれるはずです(やったことないですが)。