更快更省更划算:了解亚马逊云科技自研芯片
近年来,伴随着云计算、大数据、人工智能、大模型等新兴技术的飞速发展,企业对于算力的需求也水涨船高。然而另一方面,日益高昂的IT开支,也让许多企业尤其是中小企业感受到了巨大的压力。
那么问题就来了:从降低成本、提升效率、可持续性发展等方面考虑,企业是否有更高性价比的选择?
亚马逊云科技推出的自研芯片,正是为此而生。
云计算巨头的自研芯片之旅
在许多人的印象里,亚马逊云科技是全球云计算技术的开创者和引领者。殊不知早在2012年,亚马逊云科技就开始了芯片创新的历程。2015年,亚马逊云科技更是极具前瞻性地收购了半导体微电子企业Annapurna Labs。从此亚马逊云科技在为全球客户提供云计算服务的同时,也在不断突破计算机硬件设计和制造的极限,并且在自研芯片领域开辟出了一片广袤的天地。
亚马逊云科技在自研芯片领域的发力并非偶然,而是基于对客户需求的深刻洞察和对技术趋势的精准把握。在与众多客户的沟通交流中,亚马逊云科技发现传统X86平台和古早的虚拟化技术已经无法满足云计算应用对性能和效率的要求,因此决定推出自研芯片,以更好地满足客户需求。
自从成功收购Annapurna Labs之后,亚马逊云科技通过垂直整合、定制硬件设计以及与合作伙伴的紧密合作,以持续不断的研发和创新,推出了Amazon Nitro系统、通用处理器芯片Amazon Graviton、机器学习训练芯片Amazon Trainium、推理芯片Amazon Inferentia等四大系列自研芯片。这些自研芯片不但性能卓越,而且与市场上同类产品相比具有极高的性价比,并且每一次的更新迭代,都可以为客户带来两位数以上百分比的性价比提升,因此在广大客户中好评如潮。
Amazon Graviton系列:性能与性价比的双重提升
在亚马逊云科技旗下的众多自研芯片中,Amazon Graviton系列处理器可以说是当仁不让的佼佼者。从最初的Graviton1一直到最新的Graviton4,每一代Amazon Graviton都在性能和性价比上实现了巨大提升。
Amazon Graviton系列处理器的设计,充分考虑了云计算业务和新时代的需求。通过自研设计,亚马逊云科技能够更灵活地优化处理器架构,以适应各种工作负载。这也使得Graviton系列处理器在性能上表现优异,能够满足客户对高性能计算的需求。
与此同时,Amazon Graviton系列处理器在性价比方面的表现也极其出色。与传统的X86处理器相比,Graviton系列处理器能够提供更高的计算性能,但是能耗却要更低,可以很好地帮助客户降本增效。此外,亚马逊云科技还推出了越来越多基于Graviton的托管服务,譬如仅需几分钟就可以将托管服务迁移至Graviton实例,并实现高达40%的性价比提升,让客户能够更轻松地获取Graviton实例带来的高性价比。
值得一提的是,最新一代的Amazon Graviton4处理器在性能和性价比上再一次实现了新的突破。与上一代Amazon Graviton3相比,Graviton4的性能提升高达30%,独立核心增加50%以上,内存带宽提升75%以上。这也使得Graviton4成为了市场上性能最强劲的通用处理器之一。
从基准测试到实际工作负载的评价标准
在芯片设计和评价方面,亚马逊云科技也进行了大胆的创新。传统的芯片设计往往依赖于MicroBenchmark基准测试评价体系,然而这种评价体系往往无法准确反映芯片在实际工作负载中的表现。为此,亚马逊云科技决定从传统的基准测试转向以实际工作负载为评价标准。
为了更好地衡量实际工作负载的优化效果,亚马逊云科技设计了真实工作负载雷达图。该雷达图将CPU微架构涉及的参数特性分为前端和后端,并各自列出六项参数特性。相应轴上的数值代表其与该参数的依赖程度,数值越小依赖程度越低,即工作负载处理效率越高。这样在芯片设计的时候,就可以通过雷达图的面积,来更好地衡量实际工作负载的优化效果。
这种以实际工作负载为评价标准的做法,使得亚马逊云科技能够更加准确地评估芯片在实际应用中的表现,并有的放矢地对其进行优化。这不仅可以提升芯片的性能和性价比,还能够更好地满足客户的需求。
广泛的应用场景和丰富的客户案例
Amazon Graviton系列处理器在推出之后,迅速在各行各业得到了广泛应用。在高性能计算领域,Graviton的多核和高效能特点,使得其成为了科学计算、基因组学分析、天气预报等任务的理想选择;在机器学习领域,Graviton在运行TensorFlow、PyTorch等深度学习框架时有出色表现,适合模型训练和推理任务;在人工智能领域,Graviton可以高效支持图像识别、自然语言处理等实时AI任务的推理部分,提供低延迟的计算环境;在容器化应用构建领域,Graviton对多种容器编排工具和镜像仓库的支持,让用户可以更方便地部署和管理容器化应用;在数据分析领域,Graviton可以在EMR、Spark等大数据分析框架上运行,支持批处理和流式数据分析等场景,适合实时数据分析和处理大规模数据集;在数据处理领域,Graviton可以通过优化的实例类型提供高效的处理能力,适合ETL、数据清洗、预处理等任务……
以游戏行业为例,Epic Games早在2021年就在《堡垒之夜》中大规模使用Amazon Graviton实例。Epic Games在测试中发现,即使是对延迟要求最高的游戏,Graviton3的实例C7g也非常适合,并且还能带来显著的性价比提升。而在最新的Graviton4实例的测试中,更是有着比Graviton3更强的性能表现。截止目前为止,Epic Games已经使用了上万个Graviton芯片来承载他们的游戏业务。
作为一个开源的云原生、高性能的API网关,Apache APISIX被广泛应用于微服务架构、云原生应用等场景。亚马逊云科技搭建了基于多种实际应用场景组合的测试环境,并通过RPS(Request Per Second每秒请求数)来衡量APISIX的处理能力。在同为2xlarge实例规格下,基于Amazon Graviton4的R8g实例与基于英特尔的R7i实例相比,性能提升14.9%,性价比提升30%,在每个测试场景中无论是单项还是平均值,都实现了全面领先。
与此同时,越来越多的客户也开始选择基于Amazon Graviton的托管服务。根据云成本管理和优化平台Vantage的一项调查显示,2024年第一季度,在Amazon EC2 M7系列通用实例的成本支出方面,采用Graviton的M7g系列已经超过三分之一(34.5%)。在2024年第二季度,Amazon RDS、Amazon ElastiCache和Amazon OpenSearch托管服务中,客户选择使用基于Graviton的占比也已经超越了芯片巨头英特尔。
自研芯片将开启怎样的未来
自2012年以来,Amazon Graviton等自研芯片的大放异彩,让亚马逊云科技在自研芯片领域取得了巨大的成功。在2022年的亚马逊云科技芯片创新日(Silicon Innovation Day)上,亚马逊高级副总裁兼杰出工程师James Hamilton更是回顾了上一个10年间,亚马逊云科技自研芯片领域的“光辉岁月”。
展望未来,Hamilton强调,亚马逊云科技将继续加大在硬件研发方面的投入,推动下一代处理器的创新,以满足全球客户日益增长的需求。Hamilton坚信,随着技术的不断发展,亚马逊云科技将继续保持在云计算和硬件设计的前沿,引领行业走向更加高效、智能的未来。
我们有理由相信,通过从客户需求出发,不断创新和优化芯片产品,不断突破计算机硬件设计和制造的极限,亚马逊云科技未来还将为客户提供更高性能、更低成本、更多选择的计算服务。