1月27(信息差)
🌍喜大普奔,适用于 VS Code 的 GitHub Copilot 全新免费版本正式推出,GitHub 全球开发者突破1.5亿
🎄Kimi深夜炸场:满血版多模态o1级推理模型!OpenAI外全球首次!Jim Fan:同天两款国产o1绝对不是巧合!
✨苹果被曝与腾讯和字节洽谈AI模型合作:腾讯拒置评 百度跌超5%
1.创造历史!DeepSeek超越ChatGPT登顶中美AppStore
1月27日,由国产大模型公司深度求索开发的移动应用DeepSeek超越ChatGPT登顶苹果美国区免费应用榜单。同日,苹果中国区应用商店的免费榜也显示,DeepSeek为榜单第一。由于用户源源不断地涌入DeepSeek,继昨天下午出现局部服务波动导致数分钟的短暂系统崩溃后,DeepSeek今日上午又火到“宕机”,服务状态页面显示网页/API不可用。据DeepSeek回应称,可能与服务维护、请求限制等因素有关。
同时,DeepSeek这匹“AI黑马”也在资本界掀起了滔天巨浪。由于DeepSeek通过结构化稀疏注意力、混合专家系统、动态计算路由等技术,显著降低了模型训练和推理的算力消耗,由此引发了市场关于算力需求下降的担忧。受此影响,美股科技巨头股价盘前集体大跌,英伟达跌超8%,超威半导体一度跌超5%,台积电一度跌逾8%,博通跌近9%。除此以外,欧洲股市方面,光刻机巨头阿斯麦跌近10%;A股AI算力指数今日跌3.94%,寒武纪一度跌10%,中际旭创跌超10%,工业富联跌超8%。
DeepSeek火遍国内外
这两天,爆火的DeepSeek已在海内外引发诸多讨论。
记者注意到,华尔街顶级风投A16Z的创始人、被称为风投教父的MarcAndreessen今日在社交平台上发文称,“DeepSeek是AI的斯普特尼克时刻”。所谓的“斯普特尼克时刻”,指的是1957年苏联成功发射第一颗人造卫星斯普特尼克1号。这一比喻充分说明了DeepSeek在生成式人工智能时代带来的震动与冲击。
国内方面,有关DeepSeek的多个词条在27日登上了微博热搜。许多体验了DeepSeek的网友纷纷发帖,对其思考的深度水平、回答的智能程度给予了高度评价。有网友表示,“DeepSeek思考的方向比我全面多了,更不要谈它的知识储备比我丰富好几千倍。”有医生编了几个病例让DeepSeek给出诊疗意见和治疗方案,DeepSeek给出的方案“毫无错误,思考全面而且专业”。网友“自来水”地晒使用体验,这一现象不禁让人想起2022年底OpenAI刚刚发布ChatGPT后,大家争先恐后试用并“秀对话框”的场景。
黑神话悟空的创始人冯骥也在微博发文评价DeepSeek。他说自己已经使用V3一个月了,最新发布的R1则刚刚使用5天。冯骥认为“DeepSeek可能是个国运级别的科技成果”,不仅强大、便宜、免费,而且开源,任何人都可以自行下载和部署,提供论文详细说明训练步骤与窍门。“深度求索是一家很小规模的年轻中国公司,由没有海外经历甚至没有自身从业经验的本土团队开发完成。”冯骥说,“太幸运了!太开心了!这样震撼的突破,来自一个纯粹的中国公司。”
值得注意的是,DeepSeek暂时是目前唯一支持联网搜索的推理模型,这使得DeepSeek的回答能够结合最新的互联网数据,相较其他模型准确性更强。记者实测发现,当让DeepSeek写一份其创始人梁文峰的简历时,它不仅能梳理出梁文峰的基本信息、在浙江大学的教育背景以及量化投资领域的职业经历,还能抓取到梁文峰“2025年1月受邀参加国务院总理座谈会,代表AI领域建言献策”的最新媒体报道。
DeepSeek冲击算力股
作为“国产大模型之光”,DeepSeek不仅引发了硅谷的震动,也让华尔街陷入了恐慌。受此影响,美股科技巨头股价盘前集体大跌,英伟达跌超8%,超威半导体一度跌超5%,台积电一度跌逾8%,博通跌近9%。除此以外,欧洲股市方面,光刻机巨头阿斯麦跌近10%;日本股市方面,英伟达的主要供应商Advantest Corp.一度暴跌超8%。
A股方面,AI算力指数今日跌3.94%,寒武纪一度跌10%,中际旭创跌超10%,工业富联跌超8%。值得注意的是,被称为“英伟达影子股”的高速铜缆概念股沃尔核材,以及英伟达BlackwellGB200供应商英维克今日也双双跌停。
DeepSeek的成功对算力板块构成了巨大的冲击。分析人士认为,DeepSeek在有限的硬件资源下实现顶尖的模型性能,减少了对高端GPU的依赖,低廉的训练成本预示着AI大模型对算力投入的需求将大幅下降。
值得注意的是,就在前几天,刚刚上任的美国总统特朗普宣布,OpenAI、软银集团和甲骨文将合资成立一家名为“星际之门”(Stargate)的新公司,计划未来四年在美国投资5000亿美元建设AI基础设施,其中1000亿美元将立即部署。该项目是历史上最大的AI基础设施项目,因投资金额之巨大,也被称为美国的“AI曼哈顿计划”。
除此以外,美股科技巨头最近一段时间也公布了高额的AI资本开支计划。例如,微软宣布投入800亿美元用于AI数据中心建设,Meta的创始人扎克伯格最近也表示,Meta正在建设一个2GW+数据中心,将拥有超过130块GPU,计划今年将投入600亿美元—650亿美元用于AI资本开支。
DeepSeek让人们开始质疑大规模算力基建投入的效用。美股大V“THESHORTBEAR”在社交媒体上表示,“DeepSeek创造了一个AI巨头们的痛苦时刻,而投资者必须对此敲响警钟。”由于美股过去两年狂飙猛进,背后其实是AI浪潮下“美股科技七姐妹”以及英伟达支撑的主要结果,华尔街担心DeepSeek可能会对美国股市构成冲击。
记者向DeepSeek提出了“DeepSeek利空算力吗?”这一问题,有意思的是,DeepSeek给出的结论是,“算力需求将长期增长,但市场结构将重塑。”它进一步解释称,DeepSeek的算法优化可能短期内抑制训练端的高端GPU需求,但应用端的爆发将推动推理算力需求增长。类比“发动机效率提升反而增加石油需求”,算力总需求可能随AI普及而扩张,因此短期局部利空,但长期整体利好。
至于对产业链的冲击尤其是对英伟达和OpenAI的影响,DeepSeek表示闭源模型将(如OpenAI)面临开源社区的竞争压力,其API商业价值可能被稀释;英伟达在训练端的优势虽稳固,但推理端可能受AMD等厂商挑战。同时,华为昇腾、寒武纪等国产芯片厂商因适配DeepSeek获得技术验证机会,未来或受益于国产替代趋势。
复盘DeepSeek爆火的一周
事实上,DeepSeek并非“一夜爆火”,它的出圈早已有迹可循。去年年底,DeepSeek的全新系列模型DeepSeek-V3首个版本上线并同步开源。由于模型性能超越或媲美全球顶级的开源及闭源模型,同时训练成本极低,DeepSeek-V3以史无前例的性价比被国内外一众圈内大佬点赞。这是DeepSeek第一次在海外引起广泛关注。
自上周末起,海内外关于DeepSeek的讨论开始甚嚣尘上,其导火索是DeepSeek一周前发布的最新模型DeepSeek-R1。记者梳理了一下DeepSeek-R1发布后的几个重要时间线:
1月20日,DeepSeek-R1正式发布并同步开源模型权重。据官方介绍,DeepSeek-R1在后训练阶段大规模使用了强化学习技术(RL),在仅有极少标注数据的情况下,极大提升了模型推理能力。在数学、代码、自然语言推理等任务上,性能比肩OpenAIo1正式版。由于对标海外先进模型的说法在国产大模型领域比较普遍,R1模型的发布当时并未引起太多人的重视。
1月21日至23日,由于DeepSeek在发布R1的同时还公布了技术报告《DeepSeek-R1:强化学习驱动的大语言模型推理能力提升》,AI界一些有影响力的人阅读了DeepSeek的技术报告,并对此感到震撼。例如,英伟达高级研究科学家JimFan在读完报告后表示,“我们正身处这样一个历史时刻:一家非美国公司正在延续OpenAI最初的使命——通过真正开放的前沿研究赋能全人类。看似不合常理,但最有趣的结局往往最可能成真。”DeepSeek开始在AI界小范围引起讨论。
1月24日至25日,纽约时报、金融时报等英美主流媒体开始大量报道DeepSeek,关注的焦点主要是中国的AI创业公司DeepSeek是否会撼动美国硅谷在人工智能领域的领先地位。其中,纽约时报发表了题为《中国的AI创业公司如何与硅谷巨头竞争》的文章,文章指出,“中国可能通过开源主导权重构全球AI竞争格局,使低成本创新成为颠覆行业的新路径”。
与此同时,DeepSeek的影响力开始向资本市场渗透。1月24日,知名投资人MarcAndreessen在社交平台表示,“DeepSeekR1是我见过的最令人惊叹,最令人印象深刻的突破之一,并且是开源的,是给全世界的礼物。”1月24日,英伟达股价大跌超3%。据媒体报道,JPM交易台当晚交易时95%的问题均和DeepSeek有关,交易员、分析师周末开始恶补关于DeepSeek的一切。
据拥有20年投资经验的大V“TMTBreakout”总结,DeepSeek的爆火可能有四点原因,首先是社交平台X的算法推荐,其次是知名投资人MarcAndreessen的推文,再次是纽约时报的文章,最后是英伟达股价的下跌。DeepSeek的R1模型发布若干天后,才在海外引起轩然大波,有业内人士分析称,这侧面表明中国本土的AI科研走到了技术的最前沿。
2.5G无人机化身配送员! 四川打造低空经济示范区
用手机点上一杯咖啡,10分钟后一架载有咖啡的无人机,稳稳降落在四川天府新区科创生态岛兴隆湖畔的停机坪。
物流配送、空中巡逻、医疗急送……以无人机为代表的低空经济,如今正逐步进入普通老百姓的生活日常。在四川天府新区,这样的科幻场景变为现实。
▍无人机变身为“智能空中配送员”
在四川天府新区科创生态岛,无人机化身为“智能空中配送员”,把一杯咖啡按时、准确地送到顾客手中,其背后是5G-A低空监管运营服务平台的控制。
通过5G网联技术,平台可远程进行航线规划、一键启动、远程控制、无人化操作飞行等操作,实现全程自动化配送。同时对货物进行定位和跟踪,确保货物在运输过程中的安全性和可追溯性。借助通感一体和可见光AI识别技术,对飞行无人机进行精确AI识别和视觉跟踪,为监管部门提供直观实时的观测、决策和取证支持。
5G-A低空监管运营服务平台
“目前是配送的是咖啡,未来我们会考虑到覆盖整个兴隆湖周围的物流配送,包括规划医疗用品的配送,以及一些高附加值对民生有贡献的产品。”现场人员介绍。
除了物流配送外,5G网联无人机的另一大应用场景是巡检。在天府新区万安街道, 5G网联无人机就可以实现航线自主飞行、能够实时分析拍摄的图像和视频数据,一旦监测到火源等异常情况,系统会立即将相关信息发送给社区管理人员。
只需要设置好飞行路线,无人机就能在空中对于管理辖区进行巡检,及时发现违章建筑、企业排放、违规施工、占道经营、垃圾堆放等各种异常违规事件;通过无人机系统平台中移凌云的AI算法能力,无人机空中视角,可快速发现识别道路障碍物、人员车辆、施工挖掘、密集人群等异常事件,及时通知执法人员现场处置。
“比如,森林防火的巡检工作,过去需要两人去巡一天。现在,无人机只需要几分钟就能把一个森林区域完成巡检。在道路巡查方面,比如情况拥堵的时候,车和人过不去,无法知道拥堵点的具体位置,无人机可以实时更精准地分析是哪个路口造成的拥堵,然后联系交警及时地疏导交通。”四川天府新区万安街道的社区管理员介绍。
▍成都加码低空经济先行先试
天府新区是成都低空经济的先行示范区域,相较成都主城区更广阔的空间、更低的人口密度,使其具备了开展低空经济应用场景示范试点的优势。
2024年11月底,四川天府新区低空经济产业联盟成立。四川天府轻型动力科技有限公司为理事长单位,成都纵横鹏飞科技有限公司、四川傲势乐翼科技有限公司、天齐鑫隆(成都)有限公司、四川天府新区厦大创新研究院、四川天府新区西工大先进动力研究院、北航(四川)西部国际创新港科技有限公司、四川天府新区北理工创新装备研究院、上海交通大学四川研究院、成都西电网络安全研究院9家单位为理事单位。
《科创板日报》了解到,中国移动也把成都作为低空经济的重要试点城市。此前,中国移动宣布与15个城市联合共建低空经济生态圈,计划在明年内打造100个示范项目,成都正是其中之一。
“中国移动的三大研究院之一成都产业研究院,其一大主攻方向就是低空经济领域。目前我们正与双流机场合作,利用5G-A的通感一体化能力来提升机场的民航安全,目前正在试验认证过程中。”四川移动的相关人士表示。
▍5G基站达到20.7万个算力规模达到11.1EFLOPS
除了低空经济外,四川省还积极利用5G赋能制造、文旅等应用场景。四川省通信管理局相关负责人向记者介绍,四川省围绕加快建设西部地区信息通信业发展高地、国家战略腹地关键信息基础设施备份基地,推动新型信息基础设施演进升级,应用赋能提质扩面,数字惠民走深走实,网络数据安全巩固提高,应急通信保障高效有力,行业高质量发展呈现加速和提质的势头。
截至目前,四川省共建成5G基站达到20.7万个,算力规模达到11.1EFLOPS,运力指数居全国第4。10G-PON端口139.2万个,同比增长13%,5G移动互联网用户接入流量达104亿G,同比增长50.3%。千兆固定宽带用户数达1214.4万户,同比增长38.9%,实现省级以上工业园区万兆光网全覆盖。电信业务总量、电信业务收入累计完成918.6亿元、754.9亿元,均居全国第6位。
此外,四川省把电信普遍服务和“满格天府”项目纳入30件民生实事统筹实施,实现了行政村5G通达率较23年底大幅提升18个百分点,全省2.6万个行政村全面实现“村村通5G”的历史性跨越,提前完成了“十四五”建设任务目标。同时,四川省开展网络精准降费,覆盖220万农村用户,降费金额达8亿元,并推广智慧安防、网络电视、在线教育等服务,农村智慧安防服务近1000万用户,在线教育使用量超过1400万人次,农村网络零售额超过2600亿元。
3.利用Function接口告别冗余代码:构建高效、可维护的Java应用
在软件开发的长河中,冗余代码(俗称“屎山代码”)如同沉重的包袱,拖慢了开发速度,增加了维护成本,降低了代码的可读性和可维护性。幸运的是,Java 8引入了函数式编程的概念,特别是Function接口,为我们提供了一种强大的工具来消除这些冗余,构建更加高效、简洁且易于维护的Java应用。
一、冗余代码的危害
冗余代码通常表现为大量重复的逻辑、不必要的变量声明、复杂的条件判断等。它不仅占用了更多的存储空间,还增加了代码执行的开销。更重要的是,冗余代码使得代码库变得臃肿不堪,难以导航和理解。当需要修改或扩展功能时,开发人员往往需要在庞大的代码库中艰难地寻找相关部分,这不仅耗时费力,还容易引入新的错误。
二、Function接口简介
Java 8中的Function接口是一个函数式接口,它定义了一个名为apply的方法,该方法接受一个输入参数并返回一个结果。Function接口是函数式编程中的核心概念之一,它允许我们将逻辑封装为可重用的函数对象。
三、利用Function接口消除冗余
- 封装通用逻辑
通过将通用的逻辑封装为Function对象,我们可以避免在多个地方重复编写相同的代码。例如,我们可以创建一个Function对象来处理字符串的转换、格式化或验证等常见任务。 - 简化条件判断
在复杂的条件判断逻辑中,我们可以使用Function接口来封装不同的处理路径。这样,我们可以根据输入参数动态地选择执行哪个Function对象,从而简化代码结构。 - 提高代码复用性
Function接口允许我们将函数作为参数传递给其他方法,这大大提高了代码的复用性。我们可以创建一个通用的方法,该方法接受一个Function对象作为参数,并根据该Function对象的逻辑来处理输入数据。 - 链式调用和组合
Function接口可以与其他函数式接口(如Predicate、Consumer等)结合使用,实现链式调用和组合逻辑。这允许我们以声明性的方式构建复杂的处理流程,而无需编写大量的嵌套代码。
利用Java 8的Function接口,我们可以有效地消除冗余代码,提高代码的复用性、可读性和可维护性。通过将通用逻辑封装为函数对象,并将它们组合成处理链,我们可以构建出更加简洁、高效且易于理解的Java应用。然而,要实现这一点,我们需要深入理解函数式编程的概念,并学会如何在实际场景中正确地应用它们。