“面向未来,要解决大模型的应用问题,关键要解决知识正确性问题。”日前,阿里巴巴智能信息事业群发布全栈自研、千亿级参数的夸克大模型,夸克技术负责人蒋冠军在接受《中国电子报》记者采访时表示,目前围绕大模型的创新产品,例如生成文案、生成图像或者问答等,主要依靠大模型的创意能力生成。而要让大模型发挥出更大作用,还应把创意和知识相结合。当前,大模型大规模应用的时代还未到来。
“搜索引擎和大模型是天然之配”
在互联网高速发展的30余年中,搜索引擎曾经高效满足了用户主动获取信息的需求。但是随着移动互联网内容生产和供给模式的转变,传统搜索逐步变得封闭化、孤岛化。基于大模型的AIGC技术将会为搜索产品带来全新变化,推进搜索革新已经成为行业共识。
蒋冠军介绍,夸克大模型是面向搜索、生产力工具和资产管理助手的应用型大模型。在搜索应用中,将通过图文多模理解、专业知识生成、交互方式创新进一步拓宽应用场景,提升用户体验。
记者了解到,夸克大模型基于搜索业务的积累,拥有四大优势。一是全面的通用知识数据和行业知识数据,以及知识理解和评估体系;二是千亿级参数平台的模型训练能力;三是拥有长期智能化产品经验的智能技术生产运营团队;四是拥有全行业的知识增强技术体系及能力。
“搜索引擎跟大模型是天然之配。”清华大学新闻学院教授沈阳指出。搜索引擎中汇聚了用户的实时查询需求,为大模型训练提供了海量的数据资源。同时,用户查询、点击、返回的过程也是一种交互,大模型可以将搜索到的结果进行聚合和整合,更好地进行更新迭代。此外,搜索引擎有严格的审核机制,可进一步保障大模型内容安全。“5到10年后,人们有任何问题都会习惯于问大模型,搜索引擎或将不复存在。”沈阳预判道。
蒋冠军认为,现阶段,大模型技术仍有待提高,短期内将继续与搜索引擎共存。但长期来看,以搜索引擎为主、大模型为辅的模式将被逐步取代,演变为以大模型为核心、搜索引擎辅助创新的新形式。
大模型的应用是一个循序渐进的过程
谈及大模型技术的应用落地,蒋冠军表示,夸克大模型将应用于通用搜索、医疗健康、教育学习、职场办公等多个场景,从知识能力、对话能力、创作能力和安全能力等四个方面帮助用户提升效率。
在知识能力方面,夸克大模型拥有广泛的知识覆盖、信息搜集和多语言支持等功能,支持外接专业知识增强,提升跨领域的知识和语言理解能力;在对话能力方面,具备较强的上下文理解、语境推理、关键信息保持和记忆能力,能够更好地适应不断变化的语境,理解用户的意图和需求,确保对话回复准确、合理、连贯;在创作能力方面,能够根据主题或关键词,生成连贯、有逻辑、有深度的文本内容,支持续写、润色、仿写、批改等多种不同写作需求;在安全能力方面,具备较好的世界观、价值观,对于明显的虚假信息,能做到准确识别、正确回答或者给出合理指引。
沈阳指出,大模型的应用是一个循序渐进的过程。不同领域,对准确性、幻觉率有不同要求,应用进程也会存在差异。“大模型将在设计、网络客服这类对准确性要求不高或者以交互为主的领域率先实现应用;而像医学、政务写作等对交互质量有较高要求的领域,要随着其准确率的不断提升,逐步实现应用。”沈阳说。
“未来,大模型技术将朝着多模态融合方向发展,把单一的文本、图像、声音数据进行合并,通过跨模态技术进行输出。”沈阳期待,将搜索引擎的优势充分内化到大模型研发中,让我们的国产大模型,走出一条有别于其他国家的发展新路。