当前位置: 首页 > article >正文

阿里巴巴Qwen团队发布AI模型,可操控PC和手机

  每周跟踪AI热点新闻动向和震撼发展 想要探索生成式人工智能的前沿进展吗?订阅我们的简报,深入解析最新的技术突破、实际应用案例和未来的趋势。与全球数同行一同,从行业内部的深度分析和实用指南中受益。不要错过这个机会,成为AI领域的领跑者。点击订阅,与未来同行! 订阅:https://rengongzhineng.io/

这周,科技界的目光几乎都被DeepSeek的R1模型吸引,但阿里巴巴并没有袖手旁观。

1月27日,阿里巴巴 Qwen团队 正式发布了一系列 全新AI模型——Qwen2.5-VL,具备 文本解析、图像分析、视频理解 以及 远程操控PC和手机 的能力,类似于OpenAI的 Operator。https://github.com/QwenLM/Qwen2.5-VL/blob/main/README.md

Qwen2.5-VL:能看、能听、还能动

根据官方介绍,Qwen2.5-VL不仅能读取文件、解析视频,还能 数图像中的物体,甚至可以 远程控制电脑和手机

🔹 超越国际大厂?
阿里巴巴的Qwen团队声称,Qwen2.5-VL在多个评测中 超越了OpenAI的GPT-4o、Anthropic的Claude 3.5 Sonnet和Google的Gemini 2.0 Flash,尤其在 视频理解、数学运算、文档解析和问答能力 上表现突出。

🔹 强大的视觉理解
Qwen2.5-VL可分析 图表、发票、表格,甚至能“理解” 长达数小时的视频内容。此外,它还能 识别影视IP和各类商品,暗示该模型可能曾使用 受版权保护的内容 进行训练。

🔹 AI变身“遥控助手”
最令人瞩目的是Qwen2.5-VL的 跨设备控制能力
👉 在 PC端,该模型可以操作Linux系统,比如切换标签页(虽然当前还不够智能,无法完成复杂任务)。
👉 在 手机端,一位Hugging Face的技术负责人分享了一段视频,展示 Qwen2.5-VL自动打开Booking.com应用并预订机票(从重庆到北京)。

这意味着,AI未来可能不仅仅是 对话助手,更可能成为 真正的智能操作员,帮助用户完成各种任务!

不同版本与开源策略

Qwen2.5-VL提供了三种规格的模型:

Qwen2.5-VL-3B 和 Qwen2.5-VL-7B
👉 完全开源,开发者可自由下载、使用,无商业限制。

Qwen2.5-VL-72B(旗舰版)
👉 受 阿里巴巴自定义许可协议 限制,
👉 若月活用户超1亿,企业和开发者 需获得阿里巴巴的授权 才能商用。

未来展望:AI助手真的要来了?

尽管目前Qwen2.5-VL的 PC操控能力尚未成熟,但它已经展示了AI向 全能助手 进化的可能性。

未来,我们或许真的能看到 AI远程帮用户订票、编辑文件,甚至控制智能家居。而中国AI公司的快速进步,正让全球科技巨头 感受到前所未有的压力


http://www.kler.cn/a/524593.html

相关文章:

  • 第十四讲 JDBC数据库
  • doris:HLL
  • SpringBoot 中的测试jar包knife4j(实现效果非常简单)
  • CMake常用命令指南(CMakeList.txt)
  • DeepSeek--通向通用人工智能的深度探索者
  • uniapp 地图添加,删除,编辑标记,在地图中根据屏幕范围中呈现标记
  • 8. 马科维茨资产组合模型+FF5+ARCH风险模型优化方案(理论+Python实战)
  • LabVIEW春节快乐
  • 前端-Rollup
  • 实验三---基于MATLAB的二阶系统动态性能分析---自动控制原理实验课
  • 图漾相机——Sample_V1示例程序
  • aws(学习笔记第二十六课) 使用AWS Elastic Beanstalk
  • 力扣【235. 二叉搜索树的最近公共祖先】Java题解
  • 分享| RL-GPT 框架通过慢agent和快agent结合提高AI解决复杂任务的能力-Arxiv
  • 【Day28 LeetCode】动态规划DP
  • 「全网最细 + 实战源码案例」设计模式——适配器模式
  • 【事务管理】
  • 多协议网关BL110钡铼6路RS485转MQTT协议云网关
  • 【数据结构】_顺序表经典算法OJ(力扣版)
  • 虚拟机里网络设置-桥接与NAT
  • 基于微信小程序的新闻资讯系统设计与实现(LW+源码+讲解)
  • 【Unity3D】aab包太大无法上传Google问题
  • 防御保护第一次实验:安全策略配置
  • 【漫话机器学习系列】067.希腊字母(greek letters)-写法、名称、读法和常见用途
  • 【越学学糊涂的Linux系统】Linux指令篇(二)
  • Go学习:类型转换需注意的点 以及 类型别名