AIモデルの量子化とファイルサイズの目安

Posted at 2026-03-22

ポイント

パラメーター数 × 精度（bytes/param） = モデルサイズ（概算）

※ 列 = パラメーター数、行 = 精度、セル = 重みのサイズ（概算）

精度	bytes/param	7Bモデル	13Bモデル	70Bモデル
FP32	4 byte	~28 GB	~52 GB	~280 GB
FP16	2 byte	~14 GB	~26 GB	~140 GB
Int8	1 byte	~7 GB	~13 GB	~70 GB
Int4	0.5 byte	~3.5 GB	~6.5 GB	~35 GB

重み、精度、パラメーターというワードが飛び交う中で頭の整理がてらまとめてみました