• 官方微信公众号
  • 电子信息产业网
  • 微博
第03版:两会专题

全国政协委员,上海市政协副主席、致公党上海市委主委邵志清:

加快大模型基础设施和创新应用生态建设

本报记者 徐恒

人工智能是新一轮科技革命和产业变革的重要驱动力量。当前,大模型技术引领人工智能领域迈上新的发展高度,在世界范围内受到广泛关注。

全国政协委员,上海市政协副主席、致公党上海市委主委邵志清表示,随着大模型技术不断迭代升级,模型能力不断加强,已逐渐形成从底层算力、模型开发到行业应用的全新智能化产业。大模型正在引发新一轮行业变革甚至新一次工业革命,已经上升为国家战略,成为大国科技竞争的核心。

“发展国产大模型面临的主要挑战包括超大规模算力需求、超大规模数据需求、全新模型训练算法与框架,以及大模型的应用生态。”邵志清表示。

具体而言,首先,算力资源供应短期内仍然紧张。在基础大模型研发的几个关键要素中,算力是基础,算力紧缺所带来的限制作用尤为明显。

其次,高质量数据成为严重掣肘。精准、专业且高质量的数据,对于大模型进一步发展至关重要。目前国际主流大模型的参数数据集以英文为主,中文数据仅占英文的1/10。中文语料库还存在数据不完整、标注不一致、数据重复、数据更新等问题,严重掣肘行业大模型研发和应用落地。此外,行业大模型对特定行业数据则提出了更高要求,政务、医疗、智慧城市等领域数据获取难度大,隐私性高,阻碍了大模型应用落地的进程。

再次,大模型训练的工程化有短板。即便解决了算力供应和数据集的问题,大模型训练仍面临计算效率问题。构建大模型训练系统不是算力的简单堆砌,而是一个复杂的软硬件系统工程,需要在底层资源、集群架构、网络规划、故障恢复等各个方面进行优化以提升整个系统的计算效率,这通常是大模型的开发者所不具备的。

最后,应用方向同质化。当前大模型的开发存在同质化现象,较多集中在面向知识检索、文字生成等方面,其落地效果及实际业务收益有待进一步提升。大模型厂商需与企业用户深度对接需求,找到高价值、差异化的大模型应用刚需。另外,已有一部分大模型已经聚焦到垂类领域应用,但垂类大模型的难点在于除了要深入理解客户的业务,还需要涵盖特定领域的数据、专业知识。

针对上述问题,邵志清提出以下建议:

一是加快算力基础设施建设。统筹构建公共算力基础设施,加快建设基于国产GPU芯片的大型智算中心。在认证评估、市场推广、政府采购方面给予扶持,引导国内模型企业优先使用国产算力平台。选取3~5个企业不同型号的国产芯片进行测试验证,在形成良性竞争的同时避免市场单一依赖。通过公共算力服务平台,为用户提供按需使用的低成本算力,降低大模型训练门槛,让更多的中小企业和创新创业主体能够参与到大模型的开发应用过程中,为大模型的创新发展提供扎实的基础。

二是加强数据语料供给,提升大模型研发支撑能力。由政府牵头、产业链各环节龙头企业参与,共同推动高水平语料数据要素建设。通过区块链、多方安全计算等技术,保障各参与单位的数据安全与用户隐私。保障语料库建设的公共属性,服务大模型应用,杜绝数据垄断。加强监管,从训练数据集的源头保障大模型应用符合法律法规要求和伦理道德规范。

三是强化工程实施能力,提升资源利用率。将理论研究和工程实践高度结合,提升训练效率,降低资源闲置。鼓励应用创新,保持算力平台的高效率。倡导绿色节能,结合国家“东数西算”工程,将非实时的训练工作转移到西部能源资源充沛的地区,做到“东数西训”,提升大模型产业发展的能耗水平,保障国家“双碳”战略的实施。建设行业标准,提高大模型开发的效率和质量,促进大模型应用的广泛性和普适性。

四是加快创新应用场景建设,牵引成果落地应用。建立常态化机制,重点在智能制造、生物医药、集成电路、智能化教育教学、科技金融等领域构建示范应用场景,打造标杆性大模型产品和服务。引导行业用户向大模型厂商开放有价值的核心业务场景,进一步整合并开放行业数据,开展大模型应用试点,推动大模型在应用中不断提升能力。鼓励大模型团队找准行业或场景数据优势错位发展,探索大模型商业化模式和产业化发展路径。

2024-03-05 本报记者 徐恒 全国政协委员,上海市政协副主席、致公党上海市委主委邵志清: 1 1 中国电子报 content_9570.html 1 加快大模型基础设施和创新应用生态建设 /enpproperty-->