More than 1 year has passed since last update.

LLM推論時のメモリ使用量の調査

Posted at 2023-03-16

最近流行りのLLMを動かした時のメモリ使用量を調査した。今回の調査では時間短縮のため２種類のPCで実行しているが結果はどちらとも対して変わらないと思う。

LLaMA-FP16

LLaMA.cppのプロセスのみの使用量です。

LLaMA.cppのプロセスのみの使用量です。

felxgenのプロセスのみの使用量です。GPU100%で実行してます。

felxgenのプロセスのみの使用量です。GPU100%で実行してます。
重み圧縮なしです。

モデル	メインメモリ使用量(ピーク)
6.7B	1 GB

モデル	VRAM使用量(ピーク)
6.7B	14 GB

LLM入門セットはRTX3090 + 128GBメモリかなと思います。

DGX Station A100ほしい。