DeepSeek发布新模型,遭遇大规模攻击,梁文锋回应证实为假,吴恩达盛赞DeepSeek!AI Weekly 1.27-2.2
📢本周AI快讯 | 1分钟速览🚀
1️⃣ 🖼️Janus-Pro-7B:DeepSeek发布7B开源多模态模型,视觉理解&生成能力超越DALL-E 3!
2️⃣ 🚨DeepSeek遭遇大规模攻击:DDoS+暴力破解,攻击源IP指向美国,已采取防御措施。
3️⃣ 📉DeepSeek引发科技股震荡:DeepSeek高性价比AI模型引发市场担忧,英伟达股价大跌16.97%,市值蒸发5900亿美元!
4️⃣ 🎭梁文锋回应是假消息:《黑神话》制作人冯骥盛赞DeepSeek,网传梁文锋回应实为乌龙传播。
5️⃣ 🏆吴恩达盛赞DeepSeek:称其AI进步缩小中美差距,推动开源模型发展,挑战OpenAI。
6️⃣ 🧠Qwen 2.5-Max:阿里云发布超大规模MoE模型,多项能力超越DeepSeek V3和Llama 3.1-405B!
7️⃣ 🤖o3-mini上线:OpenAI新推理模型,速度+24%,代码数学能力大幅提升,免费用户可体验。
8️⃣ 📈ChatGPT订阅激增:1550万+ 付费用户,同比增长近两倍,API调用量翻7倍。
9️⃣ 🏛️ChatGPT Gov:OpenAI推出政府专属AI,高安全性,助力美国政府AI应用。
🔟 🛰️OpenAI估值3000亿:新一轮融资谈判中,软银或投资250亿美元,目标AI基础设施建设。
1️⃣1️⃣ 🤯Grok 3:xAI即将发布,支持思维链推理,类人认知,或推Pro版挑战OpenAI!
1️⃣2️⃣ 🔍Copilot深度思考功能免费开放:微软AI助手升级,提供更精准推理及复杂任务拆解!
1️⃣3️⃣ ⚡Mistral Small 3:新晋开源模型,低延迟+高性能,媲美Llama 3.3 70B,Apache 2.0许可。
1. DeepSeek发布新模型 Janus-Pro-7B
1月28日,DeepSeek宣布推出并开源其最新的多模态AI模型——Janus-Pro-7B
。该模型在GenEval和DPG-Bench基准测试中表现出色,击败了OpenAI的DALL-E 3和Stable Diffusion。
Janus-Pro-7B
是对去年10月发布的Janus
模型的升级版本。通过优化训练策略、扩展训练数据集并增加模型规模,Janus-Pro-7B
在图像生成任务中实现了更高的准确性和稳定性。具体而言,在GenEval测试中,Janus-Pro-7B
的准确率达到80%,而DALL-E 3为67%;在DPG-Bench测试中,Janus-Pro-7B
的准确率为84.2%,显著高于其他对比模型。
该模型采用创新的自回归框架,统一了多模态理解和生成能力。在多模态理解任务中,Janus-Pro-7B
使用SigLIP-L作为视觉编码器,支持384 x 384像素的图像输入;在图像生成任务中,模型通过特定的分词器将图像降采样至16倍,以实现高效的图像生成。
目前,Janus-Pro-7B
已在Hugging Face平台上线,开发者可以通过API进行访问。此外,DeepSeek还提供了本地部署和Colab部署的教程,方便用户在不同环境中体验该模型的功能。
2. DeepSeek遭遇大规模恶意攻击
本周,DeepSeek宣布,其线上服务遭遇了大规模恶意攻击,导致新用户注册功能受到影响。已注册用户的登录和使用未受影响。
为应对此次攻击,DeepSeek采取了限制措施,暂时仅允许使用中国大陆手机号码(+86)进行注册。此前,DeepSeek已开放了通过Google、Apple ID或电子邮件的注册方式,但由于此次攻击,暂时恢复了对中国大陆手机号码的限制。
网络安全专家指出,此次攻击可能是分布式拒绝服务(DDoS)攻击,旨在通过大量虚假流量使服务瘫痪。DeepSeek尚未公布具体的攻击细节,但表示正在积极应对,以尽快恢复正常服务。
据官媒“玉渊谭天”向奇安信安全专家了解到的消息,DeepSeek这次受到的网络攻击,攻击形式多样,包括DDoS和暴力破解,且攻击者IP地址都来自美国。
3. DeepSeek引发全球科技股震荡
近期,DeepSeek发布了高效且低成本的AI模型,引发全球科技股市场的剧烈波动。其最新的AI模型因具备高性价比,并能够在较低端芯片上运行,导致市场对英伟达等公司高估值的质疑。
受此影响,英伟达股价在本周一暴跌16.97%,市值蒸发近5900亿美元,创下美国金融史上的纪录。其他科技巨头如微软、谷歌母公司Alphabet等也出现不同程度的下跌,纳斯达克综合指数下跌3.07%。
DeepSeek的AI模型展示了在低成本硬件上实现高性能的可能性,这对当前依赖高端芯片的AI产业链提出了挑战。瑞士联合私立银行董事总经理Vey-Sern Ling表示:“DeepSeek表明,开发低成本的高性能AI模型是可能的。这可能会动摇整个AI供应链的投资逻辑,因为目前这一供应链主要由少数超大规模企业的高额支出驱动。”
此次事件引发了投资者对科技股高估值的重新审视,尤其是对英伟达等依赖高端芯片销售的公司的未来增长和利润率的担忧。分析人士指出,市场可能需要重新评估AI技术发展的成本结构,以及对高端硬件的依赖程度。
截至目前,英伟达股价有所回升,但市场对其高估值的质疑仍在持续。
4. 梁文锋回应冯骥的消息被证实为假
1月28日消息,《黑神话:悟空》制作人、游戏科学创始人冯骥近日在社交媒体发文,盛赞DeepSeek大模型,称其“可能是国运级别的科技成果”,并详细列举了DeepSeek的六大卓越特性,包括推理能力、开源策略、训练效率等,认为其在多个方面都实现了业界突破。冯骥的评价在国内科技圈引发了广泛讨论。
随后,网上流传出一则消息,称DeepSeek和幻方量化的联合创始人梁文锋在知乎的相关问题下发表回应:“我们不过是站在开源社区巨人们的肩膀上,给国产大模型这栋大厦多拧了几颗螺丝。”该言论被不少网友解读为梁文锋对开源社区贡献的认可,也进一步提升了DeepSeek在国内AI领域的影响力。
然而,据新浪科技报道,该回应实际上并未出自梁文锋本人,而是某些自媒体误传的假消息。新浪科技向DeepSeek相关人士求证后确认,梁文锋从未在知乎或其他社交平台上发布上述评论,所谓的回应纯属杜撰。此外,近期关于DeepSeek的讨论热度持续上升,不少未经核实的消息在社交平台上迅速传播,例如早前网传英伟达创始人黄仁勋内部信谈及DeepSeek,最终也被英伟达官方否认。
DeepSeek作为国内备受瞩目的大模型团队,其技术进展和市场竞争力不断引发业界关注。然而,在信息传播加速的背景下,部分未经核实的消息可能会误导公众认知,甚至影响行业的发展节奏。业内人士提醒,对于AI行业的相关新闻,尤其是涉及企业核心团队和技术竞争力的内容,仍需以官方信息为准,避免被不实信息误导。
5. 吴恩达发文盛赞DeepSeek
2月1日,斯坦福大学计算机科学系客座教授、AI领域的领军人物吴恩达(Andrew Ng)在X平台发文,对中国AI公司的快速崛起表示认可,特别提及了DeepSeek的最新突破。他表示,中国在生成式AI领域的进展令人瞩目,正在快速缩小与美国的差距。
吴恩达在长文中指出,DeepSeek的成功不仅展示了中国AI企业的技术进步,还反映了几个关键趋势:
-
中国AI实力崛起——中国企业正在加速生成式AI的发展,这将对全球AI格局产生深远影响。DeepSeek的出现表明,领先的AI技术不再仅仅由美国主导,中国的研究机构和企业正在迅速迎头赶上。
-
开源推动行业变革——DeepSeek近期发布的DeepSeek-R1模型,在性能上已可媲美OpenAI的o1模型,并且以MIT许可证完全开源。吴恩达强调,开源模型正在推动基础模型的“商品化”,这为更多应用开发者提供了机会,加速AI在各行业的落地应用。
-
算法创新降低训练成本——吴恩达特别提到,AI模型的规模不断扩大虽然能提升性能,但优化算法和更高效的训练方法同样重要。DeepSeek的突破展示了如何在降低训练成本的同时保持高性能,这意味着不依赖于庞大的计算资源,也能取得技术突破。
6. 阿里云发布通义千问 Qwen 2.5-Max
1月29日,阿里云正式发布了其最新的通义千问Qwen 2.5-Max
超大规模混合专家(MoE)模型。该模型使用超过20万亿tokens的预训练数据,并采用精心设计的后训练方案,展现出卓越的综合性能。
在多项公开主流模型评测基准上,Qwen 2.5-Max
取得了高分,全面超越了目前全球领先的开源MoE模型DeepSeek V3
,以及最大的开源稠密模型Llama-3.1-405B
。具体而言,在知识(MMLU-Pro)、编程(LiveCodeBench)、综合能力评估(LiveBench)以及人类偏好对齐(Arena-Hard)等基准测试中,Qwen 2.5-Max
的表现均优于竞争对手。
目前,开发者可以通过API访问该模型,或登录Qwen Chat平台直接体验其功能,包括与模型对话、使用artifacts以及搜索等。然而,Qwen 2.5-Max
尚未开源,具体开源计划尚未公布。阿里云此次选择在农历新年第一天发布这一重要模型,显示了其在生成式AI领域追赶竞争对手的决心。此前,DeepSeek的迅速崛起给行业带来了巨大压力,阿里云此举被视为对这一竞争态势的积极回应。
7. OpenAI发布新推理模型 o3-mini
2月1日,OpenAI正式推出了全新的推理模型o3-mini
,并首次向免费ChatGPT用户提供有限速率的访问权限。相比之前的o1-mini
模型,o3-mini
在响应速度上提升了24%,答案准确性也有所提高。与o1-mini
类似,o3-mini
会展示推理过程,而非仅提供答案。开发者可以通过OpenAI的API服务(包括Chat Completions API、Assistants API和Batch API)使用o3-mini
。
值得注意的是,o3-mini
支持开发者调整“AI推理努力程度”,分为低、中、高三个级别。在2024年美国数学邀请赛(AIME 2024)的测试中,o3-mini
在最高努力水平下的准确率提升至87.3%,GPQA Diamond基准测试准确率达79.7%,Codeforces竞赛ELO评分突破2130分,达到准专业开发者水平。
面对国产模型DeepSeek-R1
带来的竞争压力,OpenAI同步调整了商业化策略:免费用户每日可体验与GPT-4o
同频次的高级推理,Plus用户限额提升至150次/天,企业版则计划下周开放使用。
8. ChatGPT订阅用户数激增至1550万
根据The Information的最新报道,OpenAI近期向部分股东透露,尽管面临来自谷歌、Anthropic和Meta等竞争对手的挑战,ChatGPT的付费订阅用户数在2024年达到了1550万,较一年前的580万增长了近两倍。此外,OpenAI的API调用量同比增长了7倍,显示出开发者对其服务的需求大幅上升。
与此同时,OpenAI于近日发布了o3-mini
模型,这是其推理系列中最新且最具成本效益的模型,已在ChatGPT和API中开放使用。 该模型在数学、代码等基准测试中刷新了最新纪录。
OpenAI联合创始人兼首席执行官萨姆·阿尔特曼在o3-mini
发布后的在线问答中透露,“在未来几周,完整版o3即将上线。”他还谈及了对DeepSeek的看法,表示:“它确实是一个非常好的模型,OpenAI会开发出更好的模型,但我们不会像往年那样保持那么大的领先优势了。”
阿尔特曼罕见地承认了自己的错误,并表示OpenAI正在讨论一个新的开源策略。 “我个人认为,在这个问题上我们站错了队,需要想出一个不同的开源策略;不是OpenAI的每个人都持有这种观点,而且这也不是我们目前的最高优先级。”
9. OpenAI推出ChatGPT Gov
1月28日,OpenAI宣布推出ChatGPT Gov,这是自企业版ChatGPT发布以来公司最重要的产品之一。ChatGPT Gov专为美国政府机构设计,旨在提供比企业版更高的安全性。该平台允许政府机构在其Microsoft Azure云环境中部署ChatGPT Gov,使其能够更轻松地管理安全和隐私要求。此外,ChatGPT Gov保留了企业版的核心功能,包括保存和共享对话、构建自定义GPT以及为IT团队提供的管理控制台。
OpenAI表示,自2024年初以来,已有超过9万名联邦、州和地方政府雇员在ChatGPT中生成了超过1800万条提示,利用该技术翻译和总结文件、撰写政策备忘录、生成代码以及构建应用程序。通过推出ChatGPT Gov,OpenAI旨在确保AI服务于国家利益和公共利益,符合民主价值观,同时帮助政策制定者负责任地整合这些能力,为美国人民提供更好的服务。
值得注意的是,OpenAI还计划与英国政府合作,在英国政府网站上推出AI聊天机器人,进一步推动AI在公共服务领域的应用。
10. OpenAI计划新一轮融资
据《华尔街日报》报道,OpenAI正在初步洽谈新一轮融资,拟筹集至多400亿美元资金,估值可能达到3000亿美元。据知情人士透露,日本软银集团有望领投,投资额在150亿至250亿美元之间。若交易达成,OpenAI的估值将接近字节跳动,成为全球最有价值的私人科技公司之一。部分资金可能用于支持OpenAI、软银和甲骨文等公司共同发起的“星际之门”项目,该项目计划在未来四年内投资5000亿美元建设AI基础设施。
11. xAI即将推出具备“思维链”的Grok 3
埃隆·马斯克旗下的人工智能公司xAI正在筹备发布其最新的AI模型——Grok 3
。据悉,Grok 3
将引入“思维链”(Chain of Thought)推理能力,使其能够像人类一样,逐步处理复杂任务。这一功能的实现,得益于xAI在独立的Grok应用中添加的“思考”相关功能,如“思考开始时间”、“思考结束时间”和“思考轨迹”等。
此外,Grok 3
可能会推出一个专业模式(Pro mode),以满足高级用户的需求。目前,在iOS版本的应用中曾短暂出现过该模式的相关资源,但具体细节尚未公布。xAI投入了大量计算资源,使用约10万个NvidiaH100GPU训练Grok 3
,以提升其推理、编码和多模态功能。Grok独特的设计提供了“常规”和“趣味”两种模式,用户可以选择直接的回答或带有幽默和讽刺的互动。即将推出的专业模式可能会为专业用户提供更多定制化功能。
12. 微软Copilot开放“深度思考”功能
微软AI公司首席执行官穆斯塔法·苏莱曼(Mustafa Suleyman)于1月30日在X平台宣布,所有Microsoft Copilot用户现在均可免费使用OpenAI的o1推理模型。这意味着此前仅对Copilot Pro订阅用户开放的“深度思考”功能现已向所有用户免费提供。
“深度思考”功能于2024年10月在Copilot Labs首次推出,利用OpenAI的o1模型,专注于思维链推理,旨在提高回复的深度和准确性。用户只需点击Copilot中的“深度思考”按钮,AI就会在大约30秒内分析问题并生成经过充分推理的回复。这一功能在处理复杂查询时,提供了更结构化、逻辑一致的答案。
苏莱曼还强调了该功能的实际应用,例如制定详细的项目计划、深入研究各种主题等。他表示:“我们还有很多正在筹备中的项目,我迫不及待地想告诉大家。”
13. Mistral发布开源模型 Mistral Small 3
2025年1月30日,欧洲领先的人工智能公司Mistral AI推出了全新的开源模型——Mistral Small 3
。该模型拥有240亿参数,采用Apache 2.0许可证,专为低延迟和高性能应用设计。在性能方面,Mistral Small 3
在MMLU-Pro基准测试中表现出色,与Llama 3.3 70B
和Qwen 32B
等更大规模的模型相当。值得注意的是,尽管参数量较小,但其运行速度甚至超过了Llama 3.3 70B
,展现了卓越的效率。
Mistral Small 3
的设计目标是满足80%生成式AI任务的需求,特别是在需要强大语言理解和指令遵循能力的场景中。其优化的架构使其在相同硬件上比同类模型快3倍以上,非常适合需要快速响应的应用,如虚拟助手、低延迟函数调用以及特定领域的专家系统。
目前,开发者可以通过多个平台访问和部署Mistral Small 3
,包括Hugging Face、Ollama、Kaggle、Together AI和Fireworks AI。此外,Mistral AI计划在未来几周内发布具备增强推理能力的小型和大型模型,进一步推动开源AI社区的发展。
我是木易,一个专注AI领域的技术产品经理,国内Top2本科+美国Top10 CS硕士。
相信AI是普通人的“外挂”,致力于分享AI全维度知识。这里有最新的AI科普、工具测评、效率秘籍与行业洞察。
欢迎关注“AI信息Gap”,用AI为你的未来加速。