AWS发布Graviton5芯片:192核Arm服务器能否撼动x86云生态?

2026年6月11日,亚马逊云科技(AWS)正式推出基于第五代自研Arm架构处理器Graviton5的Amazon EC2 M9g与M9gd实例。此次发布标志着AWS在云端计算芯片领域迈入新阶段:Graviton5不仅将核心数量从上一代Graviton4的96核翻倍至192核,更首次采用多芯片组(Chiplet)设计,在能效、内存带宽与I/O性能方面实现系统性升级。根据AWS官方披露的数据,M9g实例相较前代M8g,在通用计算、Web应用、机器学习推理及数据库负载等关键场景中,性能提升幅度介于25%至35%之间,同时维持了Arm架构一贯的高能效优势。
架构革新:从单片集成到Chiplet互联
Graviton5最显著的技术突破在于放弃了传统单片式CPU设计,转而采用由四个独立芯片组构成的Chiplet方案。每个芯片组集成48个Arm核心,并配备专属的DRAM内存控制器与PCIe 6.0 I/O控制器。这种模块化架构不仅提升了制造良率,还允许AWS针对不同工作负载优化局部资源分配。
四个芯片组之间通过定制高速互连技术连接,提供高达420GB/s的片间带宽,有效缓解了多核协同中的通信瓶颈。与此同时,L3缓存容量暴增至192MB,较Graviton4提升五倍,显著增强了数据密集型任务(如关系型数据库查询或实时分析)的缓存命中率。分支预测能力的改进进一步优化了复杂代码路径的执行效率,AWS称其在真实数据库负载下的性能提升可达30%。
制程工艺方面,Graviton5采用台积电(TSMC)3纳米先进制程。这一节点在晶体管密度与功耗控制上相较5纳米有明显进步,使AWS能在相同功耗包络下集成更多计算单元,从而实现更高的每瓦性能比。对于大规模数据中心运营商而言,这意味着在不显著增加电力与散热成本的前提下,可部署更高密度的计算资源。
性能实测:全栈优化下的多场景增益
AWS公布的基准测试数据显示,M9g实例在多项典型企业级工作负载中表现突出。通用计算任务(如编译、批处理)性能提升25%;Web应用(包括HTTP请求处理与动态内容生成)提速35%;机器学习推理——尤其是基于Transformer的小模型或边缘推理场景——同样获得35%的吞吐量增长;而在OLTP数据库(如MySQL、PostgreSQL)运行中,延迟降低与QPS提升综合体现为30%的性能增益。
值得注意的是,这些提升并非仅来自核心数量的简单堆叠,而是架构、内存子系统、I/O与软件栈协同优化的结果。AWS强调,Graviton5继续深度集成Nitro系统虚拟化层,减少虚拟化开销,并通过定制固件优化Arm指令集在云环境中的调度效率。此外,对主流开源框架(如TensorFlow Lite、PyTorch、Redis、Kafka)的针对性调优,也确保了开发者无需大幅修改代码即可获得性能红利。
Arm服务器生态的竞争格局与战略意义
Graviton5的发布正值Arm架构在数据中心领域加速渗透的关键窗口。过去十年,x86架构长期主导服务器市场,但随着能效成为云计算的核心成本变量,Arm凭借精简指令集与高核心密度优势,正吸引越来越多云厂商投入自研。除AWS外,微软Azure已在其部分实例中试用Ampere Altra系列Arm芯片,谷歌Cloud亦在探索基于Arm的定制计算方案。
然而,AWS凭借Graviton系列的持续迭代,已建立起显著先发优势。自2018年推出首代Graviton以来,AWS已将其应用于数百万台EC2实例,覆盖从Web前端到大数据分析的广泛场景。Graviton5的192核设计不仅刷新了Arm服务器CPU的核心数纪录,更通过Chiplet架构展示了其在高端计算领域的工程能力——这直接挑战了传统x86双路服务器在高性能计算(HPC)与内存数据库等场景的统治地位。
对客户而言,Graviton5带来的不仅是性能提升,更是成本结构的优化。历史数据显示,Graviton实例通常比同代x86实例便宜20%以上。若M9g延续这一定价策略,结合30%左右的性能增益,其性价比优势将进一步扩大,有望推动更多企业将关键业务迁移至Arm平台。
技术演进背后的云基础设施逻辑
Graviton5的架构选择反映了AWS对云计算未来需求的深刻判断。随着AI推理、实时分析与微服务架构的普及,工作负载日益呈现“高并发、低延迟、内存敏感”的特征。单一超大核心的设计已难以高效应对这类碎片化、并行化的任务流。Chiplet方案通过将计算、内存与I/O资源解耦并模块化,提供了更高的灵活性与扩展性。
此外,PCIe 6.0的支持也为未来硬件加速器(如GPU、DPU、FPGA)的集成铺平道路。在AI与数据密集型应用中,CPU与加速器之间的数据传输带宽往往是性能瓶颈。Graviton5原生支持PCIe 6.0,意味着其可无缝对接下一代加速卡,构建更高效的异构计算平台。
从供应链角度看,选择台积电3nm制程也体现了AWS对先进半导体产能的战略押注。在全球先进制程产能紧张的背景下,AWS通过长期协议锁定台积电产能,确保Graviton芯片的稳定供应,这对其全球基础设施扩张至关重要。
展望:Arm能否重塑云端计算范式?
Graviton5的上线不仅是AWS产品线的一次升级,更是Arm架构向数据中心核心地带进军的重要里程碑。192核、3nm、Chiplet、PCIe 6.0——这些关键词共同勾勒出一幅高性能、高能效、高集成度的未来服务器蓝图。尽管x86阵营仍在通过Intel Granite Rapids与AMD EPYC 9005系列持续进化,但Arm凭借架构灵活性与垂直整合优势,正逐步从“替代选项”转变为“首选平台”。
对于投资者而言,Graviton5的成功将强化AWS在云计算市场的技术护城河,并可能加速整个行业向定制化、异构化计算架构的转型。而对开发者与企业用户来说,一个更强大、更经济的Arm云生态,意味着更低的运营成本与更高的创新自由度。随着M9g和M9gd实例在全球各区域陆续开放,市场将很快验证这一“最强Arm CPU”是否真正具备重塑云端计算格局的能力。












