QWEN2 模型架构配置;GGUF的概念:实现量化存储
Qwen2不同配置的模型,其头数量和MLP大小有所不同,以下是具体信息 :
- Qwen2-0.5B:query heads数量为14,head size为64,intermediate size(即MLP)为4864。
- Qwen2-1.5B:query heads数量为12,head size为128,intermediate size为8960 。
- Qwen2-7B:query heads数量为28,head size为128,intermediate size为18944 。
- Qwen2-72B:query heads数量为64,head size为128,intermediate size为29568 。
- Qwen2-57B.A14B:query heads数量为28,head size为128,intermediate size为2560 。
QWEN2 模型架构配置
以下是对这段内容的解释:</