GPU使用率が上がらない。調べるとPyTorchのDataLoaderが遅い。
まさかそんな、と思うぐらい遅い。
大した仕事してないのに。
高速化オプションも調べたがあんまり効かないしコケる。
仕事にもよるけど、わざわざDataset,Dataloaderを使って書くのは時間のムダ。
直接copilotとかに書かせたほうがいいかも。
学習用データセットをGPUに送っといて、batch取り出しできるようにしとけばいいだけだしねえ。特定の仕事に使うのなら汎用性は必要ない。単純に考えてGPUが24GBならデータをストックしておくのに1,2GB使っても問題ないだろう。非同期データ転送も可能らしい。
DataLoaderはGPUでもCPU並列でも動かさなあかんし設計思想からしてしんどそう。生pythonで書かれてるのかもしれん。
2020年にhttps://qiita.com/bauer/items/98cb096e9fe585e7a926
だし、あんまりメンテされてないのかもしれないということかな。