ハイパーパラメータチューニングのベストスコアの扱い
解決したいこと
LightBGMのハイパーパラメータチューニングのときにoptunaやグリッドサーチを利用するのですが、その時のベストスコア(3クラス分類のaccuracy score)とテストデータを予測したときのスコアが少し違います。とはいっても0.532が0.524に下がるというだけなのですが。
この場合、手動でテストデータに対するスコアがより高くなるパラメータを探すのかグリッドサーチやoptunaのベストスコアを信じるのではどちらのほうが良いのでしょうか。
また余談ですが、optunaはどこまで信じていいのでしょうか?optunaで出したハイパーパラメータの一部をグリッドサーチにかけたらベストスコアが少し向上したのですが、これはグリッドサーチの方が優秀ということでしょうか。