本报讯 记者姬晓婷报道:2月22日,Arm控股有限公司宣布推出基于全新第三代Neoverse IP构建的新的Arm Neoverse计算子系统(CSS)。与上一代Neoverse CSS N2相比,Neoverse CSS N3的每瓦性能可提高20%。据介绍,CSS N3的首个实例具备32核,热设计功耗 (TDP) 低至40W。该芯片可扩展性非常强,可覆盖电信、网络和DPU等一系列应用。
此外,Arm还首次将计算子系统引入性能优先的V系列产品线,Neoverse CSS V3单芯片性能可比Neoverse CSS N2提高50%。Arm基础设施事业部产品解决方案副总裁Dermot O’Driscoll表示,CSS V3在使用两个芯粒(Chiplet)的情况下,单芯片最高可支持128核心,如果客户需要实现更高的核心数量,可以借助Arm所提供的IP平台实现。
发布会上介绍了部分基于Arm Neoverse CSS研发的芯片实例,以及基于Arm全面设计生态项目中合作伙伴的协作成果,其中包括Socionext和台积电共同打造的32核Neoverse V3芯粒产品、智原科技基于英特尔代工服务构建的64核服务器SoC、由ADTechnology与三星代工厂共同打造的16核边缘服务器SoC等。
Dermot O’Driscoll表示,随着生成式AI广泛应用于实际业务场景,服务器的工作重点将转向推理。有分析师估计,已部署的AI服务器中有高达80%专用于推理,且这一数字还将持续攀升。这一转变意味着要找到合适的模型和模型配置,并加以训练,然后将其部署到更具成本效益的计算基础设施上。
记者在发布会上了解到,采用芯粒技术已成为芯片厂商管理良率的常用方法,能让企业在单个芯片上利用到多种工艺节点。例如,使用较旧的工艺节点处理I/O,同时搭配先进的工艺节点处理逻辑功能。企业也在努力寻找巧妙的方法来复用芯粒,但当他们将不同团队的设计组合在一起时,还是面临一些挑战,比如协议层存在多种标准,包括PCIe、CXL和AMBA等。
Dermot O’Driscoll表示,Arm正在深入参与到AMBA CHI,引入芯片到芯片(C2C)的扩展功能,但在系统架构层面仍面临难题,包括怎样在设计时对芯粒进行逻辑分区、如何设置直接内存访问(DMA)中断、电源安全等管理功能问题仍有待解决。