当前位置：首页 > article >正文

【qwen2-1.5-instruct 好于Gemma2-2b-instruct\Llama3.2-1B-instruct】

article 2025/1/18 0:05:07

最新的qwen Llama Gemma小参数模型比较，移动端

qwen2-1.5-instruct 好于Gemma2-2b-instruct\Llama3.2-1B-instruct
从 Qwen2–1.5B-instruct 到 Gemma2–2B-instruct，再到 Llama3.2–1B-instruct，最后是新的 Qwen2.5–1.5B-instruct。虽然我对 Llama3.2–1B-instruct 感到相当失望，但对新的 Qwen2.5–1.5B-instruct 的出色表现感到惊讶。
涵盖了聊天机器人中使用的许多主要语言任务，例如总结、简短总结、随意聊天、RAG、真实RAG等等。
涵盖了聊天机器人中使用的许多主要语言任务，例如总结、简短总结、随意聊天、RAG、真实RAG等等。
从这几个维度进行人工打分比较
在这里插入图片描述
他们的声明伴随着关于新模型家族的事实：密集型、易于使用的仅解码器语言模型，提供 0.5B、1.5B、3B、7B、14B、32B 和 72B 尺寸，以及基础和指令变体。在我们最新的大规模数据集上进行预训练，涵盖多达 18T 的标记。指令跟随方面的显著改进对系统提示的多样性更具弹性，增强角色扮演实施和聊天机器人的条件设置。支持高达 128K 的上下文长度，并可以生成最多 8K 的标记。支持超过 29 种语言的多语言功能