当前位置: 首页 > article >正文

AI新闻周刊 | 最新AI资讯速递(11.11-11.17)

AI最前沿

OpenAI及其竞争对手寻求通往更智能AI的新路径,因当前方法遇瓶颈

OpenAI等人工智能公司正在创新训练技术,以突破大型语言模型的局限。OpenAI的o1模型背后的技术侧重于类人推理,摒弃了“越大越好”的理念。这种方法可能会重塑人工智能资源格局,并影响英伟达在人工智能芯片领域的主导地位。其竞争对手也在追求类似的进步。

Anthropic推迟下一代人工智能模型Opus 3.5的发布,且无新时间表

Anthropic推迟了Opus 3.5的发布,且未设定新的时间表,这反映出整个行业在人工智能模型开发方面出现放缓情况。首席执行官达里奥·阿莫代伊透露了开发这些模型所面临的挑战,强调改进完善而非重大突破。其复杂性涉及大量的预训练、微调以及安全测试,使得进展更像是一门艺术而非科学。

Qwen2.5-Coder系列:功能强大、多样且实用

开源的Qwen2.5-Coder系列已推出,包含从0.5B到32B的各类模型,在编码性能方面可与GPT-4o相媲美。Qwen2.5-Coder-32B-Instruct在40多种语言的代码生成、修复及推理方面表现出色。它通过代码竞技场基准测试贴合人类偏好,为开发者提供了一个强大且可扩展的工具。

亚马逊准备使用自有AI芯片,降低对英伟达的依赖

亚马逊即将推出Trainium 2人工智能芯片,旨在减少对英伟达的依赖,并为亚马逊网络服务(AWS)的客户削减成本。这些芯片有望实现高效并节省成本,吸引了Anthropic和Databricks等用户。这一举措凸显了科技巨头开发定制芯片以推动人工智能发展的趋势日益增强。

ChatGPT致Chegg股价暴跌99%,Chegg处境艰难

ChatGPT扰乱了Chegg的商业模式,使其面临巨大挑战。自2021年以来,该公司股价暴跌99%,市值蒸发了145亿美元。Chegg的用户订阅量正在减少,债务偿还也成问题。尽管其努力借助人工智能进行创新,但ChatGPT提供了更快速、更广泛的解决方案,吸引了更多学生用户。

XAI正在测试AI聊天机器人Grok的免费版本

XAI正在测试其AI聊天机器人Grok的免费访问权限,此前该机器人仅面向付费用户开放。向免费用户开放Grok可能会加速xAI获取用户反馈,并加剧与ChatGPT等产品在市场上的竞争。

OpenAI推出ChatGPT桌面集成功能,与Copilot竞争

OpenAI已针对Mac OS和Windows系统推出ChatGPT桌面集成功能,目标是融入日常工作流程。用户现在可以直接打开第三方应用程序,与GitHub Copilot的集成功能类似。该功能最初在Mac上可用,Windows用户可获得高级语音模式和截图功能。

Pleias发布了最大的多语言开放预训练数据集Common Corpus

这是用于训练语言模型的最大的开放多语言数据集,包含超过2万亿个获得许可的数据标记。该数据集可在HuggingFace平台获取,它促进了对诸如《欧盟人工智能法案》等法规的遵守,并通过过滤有害内容来确保高质量。Common Corpus包含书籍、法律文件以及学术论文等多样资源,支持30多种语言。

最新论文

LLaVA-o1:让视觉语言模型逐步推理

LLaVA-o1将类似OpenAI的“o1”模型的分阶段推理方式融合到像LLaVA这样的视觉语言模型中。借助LLaVA-o1–100k数据集,它基于多样的视觉问答及推理标注进行训练。LLaVA-o1能自主处理多个阶段,包括总结、视觉解读、推理以及得出结论。

gregpr07/browser-use:使网站对人工智能智能体可访问

Browser Use是一个用于将人工智能智能体连接到浏览器的库,能实现诸如航班搜索和数据提取等任务。它支持多种操作、多标签管理,并可与LangChain模型集成。其功能包括自我修正、自定义操作以及HTML提取。

混合Transformer(Mixture-of-Transformers):一种适用于多模态基础模型的稀疏且可扩展架构

混合Transformer(Mixture-of-Transformers,简称MoT)为多模态模型引入了一种稀疏架构,在保持文本、图像和语音等模态性能的同时降低了计算成本。在实验中,MoT与密集型基准模型表现相当甚至更优,且浮点运算次数(FLOPs)显著减少,训练时间缩短,展示了其在多种多模态任务中的效率和可扩展性。

穿针引线:大型语言模型(LLMs)能否在近百万规模的数据堆中追踪线索?

研究人员针对复杂检索任务对17个领先的大型语言模型进行了评估。他们发现许多模型是线程安全的,能有效处理多条信息线索。然而,随着上下文长度增加,性能会下降,这揭示了有效上下文长度存在较短的限制。

以上是本文所有内容

创作不易,如果这篇文章对你有帮助,请【点赞】并【关注】,谢谢!╰(°▽°)╯

期待与你一同进步❤️


http://www.kler.cn/a/401372.html

相关文章:

  • 基于Java Springboot甘肃旅游管理系统
  • 【第七节】在RadAsm中使用OllyDBG调试器
  • 讯飞、阿里云、腾讯云:Android 语音合成服务对比选择
  • Web3浪潮下的区块链应用:从理论到实践的全面解析
  • 使用 OpenAI 进行数据探索性分析(EDA)
  • Java 全栈知识体系
  • SMARTFORMS函数调用完整示例:打印工厂物料信息
  • 建造者模式(Builder Pattern)
  • 数字后端零基础入门系列 | Innovus零基础LAB学习Day11(Function ECO流程)
  • [控制理论]—位置式PID与增量式PID
  • 【大数据学习 | Spark】RDD的概念与Spark任务的执行流程
  • JMeter实战技巧:使用Java Request Sampler进行接口测试
  • MySQL高级SQL技巧:提升数据库性能与效率
  • 【机器学习】机器学习中用到的高等数学知识-8. 图论 (Graph Theory)
  • Redis配置主从架构、集群架构模式 redis主从架构配置 redis主从配置 redis主从架构 redis集群配置
  • STM32完全学习——外部中断
  • 【第七节】在RadAsm中使用OllyDBG调试器
  • Android 12.0 系统默认蓝牙打开状态栏显示蓝牙图标功能实现
  • postman快速测试接口是否可用
  • css3中的多列布局,用于实现文字像报纸一样的布局
  • 解决Windows + Chrome 使用Blob下载大文件时,部分情况下报错net:ERR_FAILED 200 (OK)的问题
  • Spark RDD各种join算子从源码层分析实现方式
  • 发那科机器人-SYST-348 负载监视器报警(力)
  • 【漏洞复现】某UI自动打印小程序任意文件上传漏洞复现
  • docker 占用空间过大导致磁盘空间不足解决办法
  • 23种设计模式-状态(State)设计模式