当前位置：首页 > article >正文

【AIGC半月报】AIGC大模型启元：2024.09（下）

article 2025/2/21 3:56:12

【AIGC半月报】AIGC大模型启元：2024.09（下）

- (1) Qwen2.5（阿里巴巴LLM）

(1) Qwen2.5（阿里巴巴LLM）

2024.09.019 阿里巴巴官宣了史上最大规模的开源发布，推出了基础模型Qwen2.5、专用于编码Qwen2.5-Coder和数学的Qwen2.5-Math。
这三大类模型一共有10多个版本，包括0.5B、1.5B、3B、7B、14B、32B和72B，适用于个人、企业以及移动端、PC等不同人群不同业务场景的模型。
如果不想进行繁琐的部署，阿里还开放了旗舰模型Qwen-Plus 和 Qwen-Turbo的API，帮助你快速开发或集成生成式AI功能。
本次阿里开源的最大版本指令微调模型Qwen2.5-72B在MMLU-Pro

MMLU-redux、GPQA、MATH、GSM8K、HumanEval、MBPP等全球知名基准测试平台的测试结果显示。
虽然Qwen2.5只有720亿参数，但在多个基准测试中击败了Meta拥有4050亿参数的最新开源Llama-3.1指令微调模型；全面超过了Mistral最新开源的Large-V2指令微调模型，成为目前最强大参数的开源模型之一。

推荐文章： 阿里史上最大规模开源发布，超GPT-4o 、Llama-3.1！
开源地址： https://huggingface.co/collections/Qwen/qwen25-66e81a666513e518adb90d9e
GitHub： https://github.com/QwenLM/Qwen2.5?tab=readme-ov-file
在线demo： https://huggingface.co/spaces/Qwen/Qwen2.5
API地址： https://help.aliyun.com/zh/model-studio/developer-reference/what-is-qwen-llm

查看全文

http://www.kler.cn/a/310271.html