【AIGC半月报】AIGC大模型启元:2024.09(下)
【AIGC半月报】AIGC大模型启元:2024.09(下)
- (1) Qwen2.5(阿里巴巴LLM)
(1) Qwen2.5(阿里巴巴LLM)
2024.09.019 阿里巴巴官宣了史上最大规模的开源发布,推出了基础模型Qwen2.5、专用于编码Qwen2.5-Coder和数学的Qwen2.5-Math。
这三大类模型一共有10多个版本,包括0.5B、1.5B、3B、7B、14B、32B和72B,适用于个人、企业以及移动端、PC等不同人群不同业务场景的模型。
如果不想进行繁琐的部署,阿里还开放了旗舰模型Qwen-Plus 和 Qwen-Turbo的API,帮助你快速开发或集成生成式AI功能。
本次阿里开源的最大版本指令微调模型Qwen2.5-72B在MMLU-Pro
- MMLU-redux、GPQA、MATH、GSM8K、HumanEval、MBPP等全球知名基准测试平台的测试结果显示。
- 虽然Qwen2.5只有720亿参数,但在多个基准测试中击败了Meta拥有4050亿参数的最新开源Llama-3.1指令微调模型;全面超过了Mistral最新开源的Large-V2指令微调模型,成为目前最强大参数的开源模型之一。
推荐文章: 阿里史上最大规模开源发布,超GPT-4o 、Llama-3.1!
开源地址: https://huggingface.co/collections/Qwen/qwen25-66e81a666513e518adb90d9e
GitHub: https://github.com/QwenLM/Qwen2.5?tab=readme-ov-file
在线demo: https://huggingface.co/spaces/Qwen/Qwen2.5
API地址: https://help.aliyun.com/zh/model-studio/developer-reference/what-is-qwen-llm