快速估算模型推理与训练场景下的显存需求。
含权重、激活与缓存开销
或更高显存的 GPU
可将显存占用进一步压缩
当前配置可流畅运行推理
根据模型总参数量选择合适规模。
选择精度类型、序列长度和 Batch Size。
获取显存占用预估与优化建议。
帮助您选择最合适的 GPU 配置。
对比量化方案效果与显存占用。
评估存储容量与带宽规划计算。