当前位置: 首页 > article >正文

【AIGC半月报】AIGC大模型启元:2024.09(下)

【AIGC半月报】AIGC大模型启元:2024.09(下)

    • (1) Qwen2.5(阿里巴巴LLM)

(1) Qwen2.5(阿里巴巴LLM)

2024.09.019 阿里巴巴官宣了史上最大规模的开源发布,推出了基础模型Qwen2.5、专用于编码Qwen2.5-Coder和数学的Qwen2.5-Math。
这三大类模型一共有10多个版本,包括0.5B、1.5B、3B、7B、14B、32B和72B,适用于个人、企业以及移动端、PC等不同人群不同业务场景的模型。
如果不想进行繁琐的部署,阿里还开放了旗舰模型Qwen-Plus 和 Qwen-Turbo的API,帮助你快速开发或集成生成式AI功能。
本次阿里开源的最大版本指令微调模型Qwen2.5-72B在MMLU-Pro

  • MMLU-redux、GPQA、MATH、GSM8K、HumanEval、MBPP等全球知名基准测试平台的测试结果显示。
  • 虽然Qwen2.5只有720亿参数,但在多个基准测试中击败了Meta拥有4050亿参数的最新开源Llama-3.1指令微调模型;全面超过了Mistral最新开源的Large-V2指令微调模型,成为目前最强大参数的开源模型之一。

推荐文章: 阿里史上最大规模开源发布,超GPT-4o 、Llama-3.1!
开源地址: https://huggingface.co/collections/Qwen/qwen25-66e81a666513e518adb90d9e
GitHub: https://github.com/QwenLM/Qwen2.5?tab=readme-ov-file
在线demo: https://huggingface.co/spaces/Qwen/Qwen2.5
API地址: https://help.aliyun.com/zh/model-studio/developer-reference/what-is-qwen-llm


http://www.kler.cn/a/310271.html

相关文章:

  • 【循环神经网络】
  • 【C++】详解RAII思想与智能指针
  • 【GPTs】MJ Prompt Creator:轻松生成创意Midjourney提示词
  • 如何使用IDEA创建Maven/SSM工程?
  • 介绍和安装及数据类型
  • 丹摩征文活动 | Kolors入门:从安装到全面活用的对比指南
  • 无人机之控制距离篇
  • CloudFlare问题与CDN问题
  • uni-data-select 使用 localdata 传入数据出现 不回显 | 下拉显示错误的 解决方法
  • 初识ZYNQ——FPGA学习笔记15
  • 观察者模式,回调函数,事件调度
  • K近邻算法_分类鸢尾花数据集
  • 海康威视摄像机和录像机的监控与回放
  • C++/CLI编程知识点小记
  • spug项目实现代码本地启动步骤
  • GEC6818初次连接使用
  • Python快速入门 —— 第六节:模块与包
  • 【VUE3】Vite编译的打包输出dist包大小的小工具
  • React-Hook原理
  • vue的插槽
  • 08 Shell Script条件判断
  • 传输层——UDP协议
  • CentOS 上配置多服务器 SSH 免密登录
  • 【oj刷题】二分查找篇:二分查找算法的原理和应用场景
  • 滤波器的分类
  • PM2.5粉尘传感器详解(STM32)