• 官方微信公众号
  • 电子信息产业网
  • 微博
第07版:半导体

AMD全力押注AI

本报记者 姬晓婷

半导体商圈,像是一个巨大的赌局。一次选择的失误,就可能意味着失去“上桌”的权利。而一次成功的抉择,却没有很长的“保质期”。带领AMD从至暗时刻走出的公司董事长兼CEO苏姿丰,怕是深谙这句话背后的道理。经历了三起三落的苏姿丰,在AI时代,再次选择了“All in(全力押注)”。

一年投资十几家AI公司

美国加利福尼亚时间7月10日,AMD官网发布了这样一条消息:以全现金交易收购欧洲最大的私人人工智能实验室Silo AI,价值约为6.65亿美元。

这条消息经由苏姿丰个人社交媒体X转发,引起了业界的广泛关注。一众媒体开始挖掘这家公司的创始人以及被冠以“豪华”名号的团队。然而,很少有人注意到,在AMD发布的这则声明中还有这样一句话:在过去的12个月里,AMD向十几家AI 公司的投资金额超过了1.25亿美元,还收购了Mipsology和Nod.ai,以扩展AMD AI生态系统、支持合作伙伴并提升AMD计算平台的领导地位。

关于收购AI团队对AMD自身业务的影响,Counterpoint研究副总监Mohit Agrawal在接受《中国电子报》记者采访时给出了这样的回复:通过收购Silo AI,AMD得以增强软件功能。借助Silo AI的SiloOS和MLOps(机器学习运维)功能,AMD现在可以为客户提供更全面的端到端AI解决方案,包括允许定制AI解决方案的高级工具和模块化软件组件,以及用于大规模部署、优化和操作AI模型的功能。收购Silo AI也使AMD服务层能力得以增长。

此外,Mohit Agrawal还回应称:Nod.ai增强了AMD的AI软件生态系统,为开发人员提供了必要的工具、库和模型。Mipsology为AMD硬件带来了量身定制的复杂AI推理和优化解决方案,支持公司的统一AI堆栈,用于跨边缘和云环境的训练和推理。

简单总结一下,收购一众AI团队,使AMD服务AI客户的软件能力增强了,这将极大地提升其AI解决方案供应能力。

当前,在AI芯片的竞争格局中,软件对于硬件性能的发挥尤其重要。在接受《中国电子报》记者采访时,半导体业内人士李国强打了个比方:“就像一辆车,高质量的马达加上卓越的调校才能跑得更快更丝滑。”对于AI芯片公司来说,好的软件,就像是帮客户把一辆跑车全面融合协调起来的强劲引擎。软件和硬件适配得好,AI芯片这个算力巨兽,才能跑得更快。

而AI芯片行业领军企业英伟达,有超过70%的研发人员是软件工程师,他们所做的工作,有一个重要的目标:帮助客户把英伟达的硬件性能发挥得更好。相较于英伟达,软件工具和服务能力是AMD一大短板。

无疑,对AI公司的收购将帮助AMD缩小其与英伟达之间软件的能力差距。

AI全家桶

6月3日,苏姿丰带着标志性的笑容和几乎覆盖所有产品线的更新,来到2024台北电脑展,进行了一场一个多小时的演讲。

在这场演讲中,“AI”是她说的最多的一个词。

从产品类型来看,AMD的业务范围涵盖CPU、GPU、FPGA三大类产品线。

从应用场景来看,AMD将其业务划分为云、高性能计算、企业、嵌入式和PC五大类型。

而“AI”这一关键词,贯穿三大产品线、五大应用场景业务。用苏姿丰本人的话来说,AMD正在“为端到端AI基础设施提供推动力”。从硬件上来看,AMD的全线产品更新,都是为人工智能训练和推理提供更高性能的计算引擎,这包括CPU、GPU、NPU。从软件上来看,AMD正在试图搭建开放的、经过验证的且对开发人员友好的AI框架库和模型,构建与AMD硬件完全适配的生态系统。

公布竞品比分是AMD最擅长的经营策略。AMD也曾凭此方法实现了对竞品市场份额的争夺。2011年,AMD推出企业级芯片霄龙,对标当时市场上认可度最高的Intel至强处理器,并在官网上直接提供霄龙与至强的TCO对比工具,凸显霄龙耗电量低的优势,一举拉高了霄龙在服务器CPU市场的采购比例。

在台北电脑展上,苏姿丰再次采用这一战略,全方位“碰瓷”竞争对手且对比项集中于AI模型运算适配度。

当介绍第三代Ryzen时,苏姿丰着重强调了其NPU的AI处理能力,称在处理8位浮点数据类型时,第三代Ryzen AI性能优于高通骁龙X Elite、英特尔Lunar Lake、Apple M4等竞争对手。

当介绍Ryzen AI300时,苏姿丰强调其与所有x86和Arm CPU相比的单线程相应能力、多任务处理能力更优。

转向服务器领域,苏姿丰又将老对手Intel拉上了PK台,苏姿丰声称其代号为“Turin”的第五代128核EPYC产品与Intel Xeon 64核8592相比,在运行计算密集型科学软件NAMD、虚拟运行Llama-2 7B大模型以应对常见企业场景时具有更高的性能表现力。

不仅如此,苏姿丰还展示了将于2025年推出的Instinct MI350服务器端产品与英伟达B200的性能对比,宣称MI350支持内存为B200的1.5倍,人工计算性能为B200的1.2倍。

在软件方面,苏姿丰展示了AMD开放式软件栈ROCm对AI硬件和操作系统的支持力度,并把主要竞争对手英伟达的H100与自家Instinct MI300X拉上了PK台,对比了在ROCm助力下,二者对Meta Llama-3 70B大模型、Mistral 7B大模型的推理性能,结果是Instinct MI300X分别以1.3倍于H100和1.2倍于H100的比分胜出。

对于AMD而言,在发布会上公开与竞品的性能对比数据,无疑像田忌赛马,对比项限定的场景必然都是精挑细选的,既能突出自身优势,又能压对手一头。综合来看,AMD林林总总的对比传递出两大信号:

其一,在许多特定场景中,AMD的产品性能的确达到了相当的水平,且与诸多人工智能模型适配。一如Stable Diffusion联合CEO兼CTO Christian Laforte所展示的那样,当使用模型文生图功能时,应用英伟达H100生成的图像为32MP,而采用AMD的Instinct MI300X生成的图像为100MP,图片清晰度得以大幅提升,且AMD可实现“开箱即用”。

其二,AMD与英伟达的产品性能仍存在不小的差距。AMD展示了Instinct与英伟达产品的两组对比数据,一组是MI300X和H100,其中英伟达的H100是2022年3月推出的,MI300X是2023年12月推出的,二者发布时间间隔了近两年的时间。且根据苏姿丰展示的数据来看,MI300X相较于H100的性能优势有限,约为H100的1.2~1.3倍。另一组对比是AMD将在2025年发布的MI350X和英伟达在2024年3月发布的B200,二者之间同样存在1年多的时间差。

开放、开源、定制化

AI时代,具有大规模运算需求的客户资源有限,入局速度决定着AI芯片企业未来在该领域的话语权。为了全方位应对与英伟达在AI时代的竞争,苏姿丰找到了一条差异化的发展路径:开放、开源、定制化。

NVLink是英伟达继CUDA之后的又一制胜法宝。依托这一技术,英伟达得以实现大规模AI处理器的高效互联,以应对大模型训练带来的超高算力需求。

针对竞争对手的这一利器,苏姿丰宣布,将联合Intel、Meta、Google、微软等一众合作伙伴开发能够连接数百个加速器的UALink(Ultra Accelerator Link)。

而与英伟达的“自建生态”相区别,苏姿丰将“开放”作为UALink的最大卖点。

“我们相信,人工智能网络的未来必须是开放的,得以允许行业中的每个人共同创新并推动最佳解决方案。”苏姿丰在演讲中说道。

而且这一链接标准,将不仅仅针对GPU,而是针对所有类型的加速器。苏姿丰补充道:“UALink将成为专有协议的绝佳替代方案。”这里的“专有”二字,显然暗指竞争对手英伟达。

不仅如此,AMD还打通了专注于通信交换领域的一众头部企业生态链,称UALink提供来自博通、思科和Marvel等领先供应商的最新交换技术。

AMD的这套组合拳,无疑为英伟达现有的客户,提供了一个具有吸引力的替代方案。

“开源”,也是AMD扩展生态伙伴的一大举措。

今年5月,AMD在GPUOpen.com上发布了涉及RDNA 3架构的MES(Micro Engine Scheduler)固件完整文档。

2023年12月,AMD曾宣布开源AMD FidelityFX Super Resolution 3(FSR 3) ,作为 AMD FidelityFX SDK 的一部分提供给所有开发者下载,同时还提供了适用于 Unreal Engine 5的插件。FSR 3支持 DirectX 12以及虚幻引擎5,符合条件的开发者现可通过 GPUOpen获取FSR 3完整源码。

最后,是定制化的能力。

英伟达极高的市占率,除了其硬件产品之外,很大程度上是由软件(CUDA)和服务(NGC与MLOps、TAO等)驱动的。而AMD一系列收购AI公司的举措,在Mohit Agrawal看来,将大大增强AMD提供端到端解决方案的能力,换句话说,这将帮助AMD吸引并留住AI客户。比如,收购Silo AI帮助AMD获得MLOP(机器学习运维)能力,可以为客户提供从AI实验到可扩展生产模型的简化路径。

综合AMD近期的系列动作,似乎不难看出苏姿丰在AI这波时代红利下的布局战略:

第一步,打造出性能过关的硬件产品,并与业内主流的大模型公司做功能适配。

第二步,聚拢一波使用AMD硬件的AI公司,一边利用这些公司的既有客户拓展市场,一边把这些案例打造成能讲出成功故事的“样板间”。在此过程中培养为客户提供定制化方案的能力。

第三步,争取得到重点区域的稳定客户。例如AMD近期收购的Silo AI是一家欧洲公司,AMD便有机会借由其在欧洲的影响力实现一定区域内的市场拓展。

第四步,逐渐将产品影响力拓展到更多地区。

英伟达固然是一个强大的竞争对手。但对于客户来说,也不见得总要拼性能最顶的产品,毕竟,除了性能,价格也是非常关键的参考要素。

2024-07-26 本报记者 姬晓婷 1 1 中国电子报 content_10941.html 1 AMD全力押注AI /enpproperty-->