VRAM 计算器
VRAMLLMGPU显存
等待处理
场景预设
模型与精度
164128192256
08152230
硬件配置
1481216
1128256384512
输入参数
卸载与推理优化
训练数据与优化器
能耗与成本
结果
适配状态 -
-
预计总需求 -
-
单设备压力 -
-
-
显存占用
-
性能与内存
模型权重-量化后的基础模型
KV cache-序列、batch、并发与注意力结构
激活/临时缓冲-训练或推理过程中的中间张量
优化器/梯度-微调状态、LoRA/QLoRA buffer
框架与多卡开销-runtime、通信与碎片余量
卸载到系统侧-CPU/RAM 或 NVMe 承载的估算量
生成速度-tokens / second
TTFT-首 token 延迟估算
训练 token-样本、tokens/sample 与 epoch
训练时间-吞吐估算
能耗与成本
功耗-按设备功耗和利用率估算
本地成本 / 小时-电价 x 功耗
本地成本 / 月-按 24x30 小时估算
云租赁 / 小时-按所选 GPU 市场价估算
碳排 / 天-kg CO2e
碳排 / 年-kg CO2e
模拟输出
选择配置后可播放一段生成速度模拟。