isunty

大模型本地部署必读：参数量、精度、量化、显存需求全解析

大模型本地部署必读：参数量、精度、量化、显存需求全解析在本地部署大语言模型（LLM）的过程中，我们常会遇到「到底要多少显存」「参数数量和模型大小的关系」「量化会带来什么影响」这些问题。本文就来系统、简单地讲清楚： ✅ 什么是模型参数量 ✅ 浮点精度（FP）意味着什么 ✅ 量化（Q）的原理和效果

Linux AI