0
0

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?

PyTorchのDataLoader使わないほうがいいかも

Last updated at Posted at 2024-10-29

GPU使用率が上がらない。調べるとPyTorchのDataLoaderが遅い。
まさかそんな、と思うぐらい遅い。

大した仕事してないのに。
高速化オプションも調べたがあんまり効かないしコケる。

仕事にもよるけど、わざわざDataset,Dataloaderを使って書くのは時間のムダ。

直接copilotとかに書かせたほうがいいかも。
学習用データセットをGPUに送っといて、batch取り出しできるようにしとけばいいだけだしねえ。特定の仕事に使うのなら汎用性は必要ない。単純に考えてGPUが24GBならデータをストックしておくのに1,2GB使っても問題ないだろう。非同期データ転送も可能らしい。

DataLoaderはGPUでもCPU並列でも動かさなあかんし設計思想からしてしんどそう。生pythonで書かれてるのかもしれん。
2020年にhttps://qiita.com/bauer/items/98cb096e9fe585e7a926
だし、あんまりメンテされてないのかもしれないということかな。

0
0
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
0
0

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?