【AI】数据,算力,算法和应用(3)
三、算法
算法这个词,我们都不陌生。
从接触计算机,就知道有“算法”这样一个神秘的名词存在。象征着专业、权威、神秘、高难等等。
算法是一组有序的解决问题的规则和指令,用于解决特定问题的一系列步骤。算法可以被看作是解决问题的方法或思路,它描述了在给定输入下,如何通过执行一系列明确定义的操作,得到期望的输出。算法可以应用于各种领域,如计算机科学、数学、工程等。一个好的算法应该具有正确性、可读性、高效性和可维护性等特点。
在人工智能领域,自 GPT-3 发布开始,国内外企业相继推出超大规模预训练模型,不断刷新参数规模和数据规模同时,跨模态预训练模型的普遍性提高,以 GPT-4 为代表,从单一文本学习向图像、语音等多模态处理转变,是未来实现人工智能通用化的重要探索。算法的进步推动国内应用模型开发企业的爆发,截至 2024 年 3 月,国产大模型数量已超 200 个,其中 117 个大模型通过国家网信办备案1,包括了互联网企业、行业玩家、软件与 IT 服务企业、高校院所等众多类型企业,涉及教育、媒体、制造、金融等领域的大模型,积极探索商业落地。
目前核心的大模型算法有以下几种:
1. 深度学习算法:如神经网络、卷积神经网络(CNN)、循环神经网络(RNN)、长短时记忆网络(LSTM)等,这些算法在图像识别、语音识别、自然语言处理等领域取得了很大的成功。
2. 支持向量机(SVM):SVM是一种分类算法,它通过将数据映射到高维空间,找到一个最优超平面来进行分类。SVM在二分类和多分类问题中都有广泛应用。
3. 集成学习算法:如随机森林、梯度提升树等,集成学习算法通过组合多个弱分类器来构建一个强分类器,从而提升模型的准确性和稳定性。
4. 聚类算法:如K均值聚类、层次聚类等,聚类算法将数据分组为具有相似特征的群集,用于无监督学习和数据分析。
5. 强化学习算法:如Q学习、深度强化学习等,强化学习算法通过与环境的交互,以最大化累积奖励来学习和优化决策策略。
这些是目前较为常见和热门的大模型算法,但随着研究和技术的发展,新的算法不断涌现。
算法目前仍面临高性能芯片短缺以及算法模型与实际应用间脱节问题。大算力芯片是大模型研发的基础,目前部分行业的算力效率仍无法满足算法企业和应用企业的需求。此外,由于行业应用场景千差万别,算法模型难以使用于每个场景,算法模型与场景实际应用之间存在一定鸿沟。
算法和算力是密不可分的,现在的大模型算法,普通的算力已经无法满足需求。
随着中国算力规模的持续扩大,互联网、大数据、人工智能等与实体经济深度融合,算力应用的新业态、新模式正加速涌现,一方面,围绕“大算力+大数据+大模型”,智能算力成为全球数字化转型升级的重要竞争力。另一方面,算力正加速向政务、工业、交通、医疗等各行业各领域渗透,成为传统产业智能化改造和数字化转型的重要支点。
智算领域,互联网行业对数据处理和模型训练的需求不断提升,是智能算力需求最大的行业,占智能算力 53%的份额;服务行业快速从传统模式向新兴智慧模式发展,算力份额占比位列第二;其余主要应用行业包括政府、电信、制造、教育、金融、运输等。
当前,智算中心主要服务大模型,大模型如“雨后春笋”般涌现,大模型产业的 应用落地也将进一步提速。全国 117 个通过国家网信办备案的大模型中,北京地区有51 个,上海 24 个,广东 19 个,北上广占全国 64%份额。从大模型应用行业来看,医疗、金融、企业服务、工业、科研等领域是目前大模型的主要应用领域。
国内算力哪家强,苏州是当之无愧的。
据不完全统计,苏州目前已建智算中心约 10 家,包括苏州市公共算力服务平台、长三角算力调度中心、苏州市人工智能(太湖)算力中心、昆山智能计算中心等。苏州大数据集团正在规划自建算力,一期规划 1000P,远期规划 2000P。除了智算中心,截至 2023 年 8 月,苏州市共有数据中心 35 家,已建机架数量 16.2 万标准机架,占江苏省(48 万)比重超三分之一。2023 年,苏州市总算力需求超过 1300PFLOPS,其中智能算力需求超过 1000PFLOPS,占比高达 76.9%。
PFLOPS是一种计算能力的度量单位,全称为每秒浮点运算次数(Peta Floating Point Operations Per Second)。其中,“Peta”表示10的15次方,即1,000,000,000,000,000,而“浮点运算次数”则指的是计算机每秒能够执行的浮点运算的次数。
PFLOPS是衡量一个计算机系统或超级计算机在单位时间内进行浮点运算的能力。浮点运算是一种用于执行科学计算、数据分析、模拟和其他需要大量数值计算的计算任务的操作。PFLOPS的值越高,代表计算机系统可以以更快的速度进行复杂的数值计算。
PFLOPS已经成为评估和比较超级计算机性能的重要指标。随着技术的不断进步,超级计算机的PFLOPS能力也在不断提高,从几年前的数十PFLOPS到目前已经接近甚至超过1000PFLOPS的水平。