当前位置：首页 > article >正文

阿里千问Qwen-72 b在中文测试中击败了GPT-3.5

article 2025/2/21 3:24:31

2023.11.30 我们在 ModelScope 和 Hugging Face 上发布了Qwen-72B和Qwen-72B-Chat，它们在 3T 令牌上进行训练并支持 32k 上下文，以及Qwen-1.8B和Qwen-1.8B-Chat 。

我们还增强了 Qwen-72B-Chat 和 Qwen-1.8B-Chat 的系统提示功能，请参阅示例文档。

另外，支持Ascend 910和Hygon DCU上的推理。检查ascend-support并dcu-support了解更多详细信息。

网友讨论：

Qwen 在所有测试中击败 GPT-4 的都是中文。虽然这对开源来说是个好消息，但 Qwen-72B 的最大性能看起来与 GPT-3.5 不相上下。
到目前为止，所有这些基准都是普通话的。在英语中它仍然落后于 GPT4。尽管如此：与 175b GPT4 相比，70b LLM 有多好！
为什么击败 GPT 4 如此困难且花费如此长的时间？
更令人印象深刻的是，这是在制裁下通过拆解 4090 显卡下实现的。

https://www.jdon.com/70415.html

http://www.kler.cn/a/154249.html

相关文章：

【Matlab】如何快速入门一项新技能-以Matlab/Simulink入门为例

C语言中的格式化输出符号：%d %c %p %x等

750mA Linear Charger with Power Path Management

Windows安装Mysql Workbench及常用操作

vscode一直不能跳转函数定义或者别的定义c_cpp_properties.json、settings.json

七、ZooKeeper选举机制

深入浅出 Golang 中的直接依赖和间接依赖管理

Fiddler抓包工具之fiddler设置抓HTTPS的请求证书安装

(C++)盛水最多的容器--双指针法

Jmeter组件执行顺序与作用域

cuda 在 torch神经网络中哪些地方可以用？

使用JSP+Servlet+MySQL实现登录注册功能

Linux基础项目开发1:量产工具——UI系统(五)

计算机网络408

zabbix 监控

【蓝桥杯选拔赛真题72】Scratch找一找少儿编程scratch图形化编程蓝桥杯创意编程选拔赛真题解析

关于qiankun沙箱sandbox（面试题）

SQL Server 数据库，使用函数查询统计信息

Android HCI日志分析案例1

医保支付方式探索——利益共享机制的文章分析