Resnetを用いた時、学習用と検証用でaccuracyが序盤のみ乖離する
解決したいこと
CNNの一般的なモデルであるResNet50を用いて一部転移して学習させていたところ、写真のような挙動を確認いたしました。
epoch 1~15あたりを見てほしいのですが、トレーニングデータの精度が高い一方で検証データの精度は低く、結果が乖離しています。
16以降からはコツをつかんだのかそこそこの精度まで上がってきていますが、何故このような挙動が起こりえるのでしょうか?
使用したネットワーク
base_model = ResNet50(weights='imagenet', include_top=False, input_tensor=input_tensor)
一般的に以下(これはVGG&別データ)のようになるケースが多いと思いますが、ここまで(序盤のみ)結果が乖離するのは初めてです。終盤に乖離するのは過学習かなと想像できますが、序盤に乖離する理由をしりたいです。
よろしくお願いします。