Skip to content
首页/在线工具/量化对比

量化对比

对比不同量化方案的显存占用、效果与部署可行性。

量化方式对比

对比同一模型在不同量化方式下的显存需求,并结合指定 GPU 判断是否可部署。

量化方式建议总显存每卡显存相对 INT4 变化NVIDIA RTX A6000 48GB 适配说明
INT4666.91 GiB666.91 GiB基线显存不足当前参数下显存超出 48 GB,建议升配或增加并行卡数。
INT81083.43 GiB1083.43 GiB+62.5%显存不足当前参数下显存超出 48 GB,建议升配或增加并行卡数。
FP81083.43 GiB1083.43 GiB+62.5%架构不支持当前 GPU 架构未列出对该量化的支持。
FP162009.02 GiB2009.02 GiB+201.2%显存不足当前参数下显存超出 48 GB,建议升配或增加并行卡数。
BF162009.02 GiB2009.02 GiB+201.2%显存不足当前参数下显存超出 48 GB,建议升配或增加并行卡数。