• 官方微信公众号
  • 电子信息产业网
  • 微博
第06版:信息通信

科大讯飞语音大模型正式亮相

本报讯 记者齐旭报道 1月30日,科大讯飞正式发布首个基于全国产算力训练的大模型——讯飞星火V3.5,其逻辑推理、语言理解、文本生成、数学答题、代码、多模态等核心能力均显著提升。科大讯飞同时还发布了星火语音大模型,并携手能源、汽车、通信等领域头部企业,打造大模型应用标杆。

“听说今年哈尔滨特别火,作为南方小土豆还挺想去玩儿一下的。要不你用东北话介绍下有啥好玩儿的呗?”在实操演示环节,科大讯飞研究院院长刘聪和讯飞星火V3.5现场互动,讯飞星火V3.5一口地道的东北话逗乐了现场的所有观众。幽默之余,讯飞星火V3.5为刘聪快速定制了旅游攻略,鉴于春运机票紧俏,还催促他尽快买票。

大模型正在助力提升数智化生产力。随着数学和推理能力的升级,多模态能力逐步进阶,讯飞星火V3.5在视觉问答、联想推理等方面实现了“高分”应对,助力科研、工业等领域提质增效。

据介绍,科大讯飞此次带来的星火语音大模型,对汉语、英语、法语、俄语等首批37个主流语种的语音识别效果超过OpenAI的Whisper V3,在多语种语音合成方面,星火语音大模型的首批40个语种拟人度超83%。

在汽车、客服、家庭、陪伴机器人等场景中,星火语音大模型大有用武之地,可以进一步优化汽车智能驾舱、智能座舱、智能导航、音乐控制等交互体验;陪伴机器人、导购机器人、辅诊机器人、智能家居、可穿戴设备等产业也有望被语音大模型注入新发展动能。

记者了解到,出口的奇瑞汽车中应用的智能语音交互技术全都由科大讯飞提供,出口国的语言覆盖英语、俄语、西班牙语、阿拉伯语、葡萄牙语等数十个语种。除汽车行业,科大讯飞还与国家能源集团联合,在煤炭、电力、运输、化工等方面,打造央企集团一体化联动的大模型应用标杆。

“当前,我们在小样本快速训练、多模态深度学习训练、超复杂深度理解等领域,距离业界领先的水平还有差距。”科大讯飞董事长刘庆峰坦言,此次的通用大模型并不一定代表人工智能的全部未来,还有很多创新要做,如脑科学互动、对抗网络的深度连接等,需要整个生态一起创新。刘庆峰表示,还要让大模型量质齐飞,不仅要发掘行业应用潜力,还要在很多关键技术创新方面与大模型联动。

2024-02-02 1 1 中国电子报 content_9416.html 1 科大讯飞语音大模型正式亮相 /enpproperty-->