recallとprecisionから閾値を求めるのはvalidationそれともtestでしょうか?
解決したいこと
ここに解決したい内容を記載してください。
PythonのImageDataGeneratorを使って画像分類しています。
recallとprecisionとF1scoreを一つのグラフに重ねて、閾値を求めようと思っています。
ネットでは殆どがtestデータを使ってrecallとprecisionとF1scoreを求めて、閾値(threshold)を算出している記事を見かけますが、これは正しいのでしょうか?
validationdataを使って閾値を求めて、testdataでその閾値を応用するというという考え方で合ってますでしょうか?
0