本报讯 记者许子皓报道:近日,全球首个面向半导体行业的专用开源大语言模型“SemiKong”发布了70B版本,官方表示,可将新芯片推向市场的速度加快30%。
据悉,SemiKong是由Aitomatic公司和包括Meta、AMD、IBM等在内的“人工智能联盟”(AI Alliance)合作伙伴共同开发的开源大语言模型,是世界上第一个专门为满足半导体行业需求而设计的大语言模型。Aitomatic公司宣称,“SemiKong有望在未来5年内重塑价值5000亿美元的半导体行业。”
据了解,Aitomatic是一家专注于利用人工智能推动半导体行业发展的公司,定位于半导体产业与人工智能的交汇点,通过人工智能来解决半导体制造过程中的复杂问题并加速产品的研发周期。
“人工智能联盟”于2023年12月成立,联盟成员包括IBM、AMD等科技巨头,以及耶鲁大学、东京大学等学术机构,目标是抗衡英伟达在人工智能产业的主导地位,而 SemiKong便是该联盟合作的首批成果之一。
按照Aitomatic公司的说法,目前的半导体行业正面临着专业知识严重流失的困境,SemiKong旨在融入半导体设计公司的工作流程,并充当半导体领域的“数字专家”,加速新芯片的研发和面市进程。
“随着每年半导体行业大量资深专家的退休,他们积累的技术知识和丰富经验也随之流失,加剧‘知识断层’,越来越多的半导体公司面临着越来越严重的人才缺口。面对这一困境,专门针对半导体产业量身打造的大语言模型SemiKong有望成为帮助新晋工程师快速获取专业知识并维持竞争力的有效途径。”Aitomatic公司表示。
据了解,SemiKong的首个版本SemiKong 8B,即80亿参数版本,于今年7月在Semicon West 2024大会上推出,而此次最新发布的SemiKong 70B为700亿参数版本,相较于首个版本有了进一步提升,该模型基于Meta的Llama 3.1平台,其中,Aitomatic公司的DXA系统是SemiKong 部署的核心架构。
DXA(Domain-Expert Agents),即领域专家代理,其将较小的大语言模型与 SemiKong 70B的核心功能进行整合。通过客户公司的技术库或专家工程师提供的项目进行训练,可以有效地捕获和构建工程师的知识体系,确保关键专业知识得到保留和扩展,以备在将来使用,与此同时,DXA还可根据不同公司的特定需求进行相应调整。
经过训练的DXA能进一步整合到核心 SemiKong部署中自动执行开发任务,或充当工程师与员工间的互动界面,类似于聊天机器人的通信方式。
在最新的700亿参数版本中,加上使用基于SemiKong的小型DXA,SemiKong 70B在半导体领域的实用价值已经大幅超越各种通用大模型(比如GPT和Llama 3),在准确性、相关性以及对半导体工艺的理解方面有着显著优势。
Aitomatic公司表示,“在半导体领域,SemiKong生成特定内容和理解复杂过程方面的表现优于多个闭源大语言模型。该模型可将新芯片设计的面市时间缩短20%~30%,并将一次流片成功率提高15%~25%。此外,该模型还可以将新工程师的学习曲线缩短40%~50%。”例如,支持SemiKong的DXA能够大幅减少蚀刻配方所需的时间,从数小时减少到只需要数分钟。