讯飞星火4.0 Turbo发布,国际14项主流测试集9项第一
10月24日,2024科大讯飞全球1024开发者节正式开幕。在数千名行业领袖、专家学者与开发者的共同见证下,讯飞星火大模型4.0 Turbo正式发布。七大核心能力全面超过GPT-4 Turbo,数学和代码能力超越GPT-4o,效率相对提升50%,国内外中英文14项主流测试集中实现了9项第一!
现场,科大讯飞董事长刘庆峰还发布了超拟人数字人、星火多语言大模型,以及科大讯飞多语种AI翻译透明屏等10项基于讯飞星火底座能力的产品与创新应用。在语音语义市场份额,讯飞继续稳居第一;在大模型生态,开发者规模实现倍数增长!核心技术突破创新,正在加速开发者生态的繁荣!
01
讯飞星火4.0 Turbo正式发布
国际14项主流测试集9项第一
人工智能应用正日益进入场景的深水区!在公共服务窗口,科大讯飞多语种AI翻译透明屏正解决语言障碍,让国际友人轻松找到归属感和幸福感;在智慧工厂,讯飞AI技术正助力检测空调与智能汽车,赋能中国智能制造高质量发展。规模化应用的落地,离不开底层核心技术的持续突破。讯飞星火在清晰技术路线指引下迭代升级,自发布至今,一直稳居国内大模型第一梯队。全新发布的讯飞星火4.0 Turbo版本,在大模型核心的七大能力全面超过GPT-4 Turbo。
由艾伦人工智能研究所、OpenAI等国内外权威机构发布,涵盖理解和推理、数学和科学、代码等不同类型任务的14项主流测试集中,星火4.0 Turbo在9个测试中超越GPT-4o等国际大模型,已跻身国际前列,实现国产大模型与国际领先水平的差距在进一步缩小。
值得一提的是,在“硬碰硬”的数学和代码领域,星火4.0 Turbo表现尤其抢眼!
数学能力持续提升,在标准考试任务以及计算、财务、金融、度量等多个维度的实用数学任务中均超过GPT-4o水平。目前,已完成超长思维链、树搜索和自我反思评价等算法验证,预计今年底可实现类Open AI o1的高难度数学能力显著提升。
代码能力则进一步升级。在真实应用场景中,基于认知智能全国重点实验室构建的iFLYCode-Eval-2.0代码实用场景测试集,讯飞星火4.0 Turbo在代码生成、代码检错、单元测试等任务上都超过了GPT-4o。
02
首发多模交互、超拟人数字人
讯飞星火APP成首选AI助手
语音是万物互联时代最主流的交互方式之一。大模型技术的突破,带来了语音技术发展的全新机会,使人机交互发生革命性的变化。
重新定义万物智联时代的多模AIUI交互标准。在远场高噪、全双工、多语种多方言能力基础上,讯飞星火升级了多模态能力,新增超拟人和个性化,从语言交互拓展到音视频流的实时多模交互,实现更全面的情境感知和更精准的任务理解。
全新版本的星火APP,已正式上线“星火超拟人数字人”,在业界率先实现语义贯穿的“口唇-表情-动作”的超拟人数字人生成。从现场演示可以看到,数字人能够轻松扮演“孙悟空”、“小猪佩奇”与用户对话,还能够根据指令做出各种微表情和动作。
多模态加持下的人机交互,不仅有着百变声音,也可借助摄像头让大模型实时“看到”外面的世界。借助已搭载多模态交互的小星畅聊功能,旅行购物时,你可以让大模型帮你介绍商品信息;生活中,看到不认识花花草草,也能实时为你解答。
此外讯飞星火从声音、形象、人设三个维度,打造了更立体的个性化多维表达。一句语音即可实现声音复刻、自然度达到4.2分;一张照片即可打造专属形象,真实度和自然度达到4.0分;支持多种身份、性格、场景的人设打造,已支持1300+人设。
自2023年9月全面开放以来,讯飞星火APP致力于打造“懂你的AI助手”,在安卓公开市场累计下载量达2亿次,iOS用户评分则高达4.8分!
聚焦用户个性化使用场景,星火APP拥有超过36000个公开智能体。在PPT创作领域,“讯飞智文”已成为AI PPT用户使用时长排名前列*,深受大学生欢迎的智能文档工具。在视频创作领域,“讯飞智作”则是信通院首批“卓越级”可信虚拟人平台,拥有437万内容创作者。面向新媒体运营,“讯飞绘文”能够助力新媒体运营工作者实现平均阅读量提升24%。解放生产力,释放想象力。大模型应用正在百花齐放,有人专注娱乐,有人专注游戏,有人专注社交,讯飞星火最专注的是学习和办公、赋能工业和科研。目前,星火79%使用场景围绕办公与学习,已成为千万级白领人士和大学生的首选AI助手。
03
语音语义份额第一 ,大模型开发者生态第一
繁荣生态构筑人工智能大未来
唯有生态的繁荣,才有人工智能的大未来。讯飞开放平台开放的AI能力及解决方案数已达759项,汇聚767万开发者团队,海外开发者数45万;大模型开发者规模从17.8万更是激增至78.1万!
IDC最新研究报告和公开数据显示,科大讯飞在语音语义市场份额第一,大模型开发者生态第一!依托语音和大模型技术的持续积累,讯飞正推动了开发者生态的加速增长。作为产业生态的构建者,开发者是推动大模型从“能用”到“好用”的关键力量。
在1024开发者节现场,刘庆峰宣布,科大讯飞将开放全场景资源,助力开发者从产品开发到商业成功。
从技术能力到应用落地,用最短路径实现产品成功。基于云端一体和软硬件一体的技术,开发者可以将AI原子能力搭载在“开箱即用”的多样化模组之上,以覆盖20+行业的丰富场景作为设计参考,快速实现应用的落地。以xbot咖啡机器人为例,仅用2h就完成了多模态交互集成,展会场景对话成功率从40%提升到90%。
从线上线下全渠道和资源共享,加速开发者迈向市场成功。科大讯飞将共享C端渠道,包括讯飞C端全球销售平台、以及开放讯飞星火智能体平台流量。同时,B端场景全开放,联合行业龙头企业开放场景需求,并且开放教育、医疗等众多行业场景。
从基金投资到落地支持,加速开发者实现商业成功。在资金支持方面,讯飞牵头成立了5亿元AI专项基金,进一步加速前沿技术产业化进程;在产业落地方面,与29个城市共建产业加速中心,通过免费场地、优惠政策、项目支持等方式,全方位助力创业企业加速成长。全场景资源的开放,帮助开发者构建壁垒,共享市场资源,通过基金和落地支持来真正助力开发者实现商业成功。
当然,繁荣的人工智能生态,离不开新力量!
致力于培育人工智能产业人才,助力人工智能生态建设。讯飞AI开发者大赛已发展成为国内人工智能顶尖竞赛平台,本届大赛联合30所科研院校和44家企业机构共创赛题,参赛团队数再创新高,吸引了14个国家358座城市的超35268支团队参赛,其中9372支是大模型团队。
唯有自主可控的生态,才有生生不息的未来。讯飞星火蓬勃的生态背后,是自主创新的算力底座。2023年10月24日,首个国产万卡算力集群“飞星一号”上线,星火大模型持续引领国产平台发展,一年多来攻坚克难解决了大规模集群训练的诸多“疑难杂症”。 基于国产算力的大模型自主技术创新,需要持续探索无人区。
发布会上,科大讯飞、华为、合肥市大数据资产运营公司联合打造的国产超大规模智算平台“飞星二号”正式启动!再次展现了讯飞作为人工智能“国家队”的担当,也将继续引领国产大模型底座发展。
近些年,人工智能突飞猛进,大模型技术正在改变产业形态和竞争格局,也将带来科研范式的重要变革。未来,人工智能的产业将如何发展?
刘庆峰认为,人工智能产业发展的关键是五个关键词:顶天立地、自主可控、通专结合、端云联动、软硬一体。坚持这五个关键点,我们的人工智能就有大未来,就能真正地解放生产力、释放想象力,改变产业格局和竞争格局,带来科研范式的变化。 在全面共创的智能时代,聚沙成塔,每次提问都是大模型进步的基石,让人工智能时代加速到来!