量化模型選擇指南：參數大小 vs 精度的取捨

2026-03-02

本地跑模型時，量化後的大參數模型通常優於小參數的全精度模型：

經驗法則：140B FP8 模型通常比 70B BF16 模型效果好，但記憶體使用相同。MoE 架構（如 Qwen 3.5 35B A3B）實際啟動參數少，RAM 需求更低。