本报讯 记者沈丛报道:7月11日,英特尔推出针对中国市场的第二代Gaudi深度学习加速器——Habana Gaudi 2,该加速器专用于高性能深度学习AI训练,能够帮助中国客户以更低的成本进行AI训练,并更高效地进行大规模AI应用部署。
据了解,此次发布的第二代Gaudi AI深度学习夹层卡HL-225B专为数据中心实现大规模横向扩展而设计。该训练处理器基于第一代Gaudi的高效架构打造。
英特尔公司执行副总裁、数据中心与人工智能事业部总经理Sandra L.Rivera表示,第二代Gaudi是为数不多的能替代英伟达H100进行大模型语言训练的可靠方案。在性价比方面,第二代Gaudi预计在2023年9月份将超过英伟达H100,成为更具备成本优势的产品。
此外,记者了解到,与其他代工厂进行合作,也是英特尔深化IDM 2.0的关键步骤之一,而此次发布的第二代Gaudi搭载的便是台积电7nm工艺。对此,英特尔数据中心与人工智能集团副总裁兼中国区总经理陈葆立向《中国电子报》记者表示,虽然英特尔的大部分芯片产品是在英特尔自己的工厂制造的,但英特尔也在积极与第三方代工厂进行合作。在选择代工策略时,会根据性能、成本等因素综合决策。
在发布会上,记者了解到,国际通用版的第二代Gaudi产品已于2022年发布,但此次发布的第二代Gaudi产品针对中国市场进行了一定的改良,同时也在中国收获了一批客户。在此次Gaudi 2发布会上,浪潮信息发布了搭载8颗Gaudi 2 AI加速器以及2颗第四代至强处理器的新一代AI服务器NF5698G7。浪潮信息高级产品经理王磊介绍,该款服务器面向生成式AI市场,支持业界主流AI框架、开发工具、大模型算法。此外,英特尔还宣布,新华三等企业也将推出搭载第二代Gaudi的产品。
英特尔发言人表示,未来英特尔将持续推出与人工智能相关的产品,2024年将发布第三代Gaudi加速器。英特尔也将持续关注GPU领域,虽然Gaudi属于ASIC芯片,但他们也将在2025年推出结合第二代Gaudi的GPU产品。