在5月9日举办的超高清视频产业高质量发展高峰会上,Fraunhofer IIS中国区负责人Toni Fiedler在主题演讲中表示,人们的手持设备都离不开音频、语音编解码和蓝牙相关技术。由Fraunhofer主导开发的MP3、AAC、xHE-AAC、LC3/LC3+、EVS、MPEG-H等音视频技术作为当前的市场主流,在手机通信、广播电视和数字流媒体等各大领域中皆得到了广泛应用。
从电视机大屏幕到手机的小屏幕,用户对于视频内容的消费习惯随着OTT(通过互联网向用户提供各种应用服务)产业的蓬勃发展不断变革,越来越追求震撼人心的音频体验。众多用户的迫切需求正在不断地激励着音频产业的技术革新。
在音频领域,总部位于德国的Fraunhofer IIS是相关国际标准与技术创新的主要贡献者。在演讲中,Toni Fiedler首先介绍了xHE-AAC技术。
“xHE-AAC是AAC系列编解码器的最新成员,它主要应用于流媒体和广播电视行业。”Toni Fiedler表示,xHE-AAC(拓展型HE-AAC)技术是在全球广为应用的技术,能在极低的比特率(单声道低至6 kbit/s)下传输各式各样的高品质音频内容。即使是在2G或3G网络情况下,xHE-AAC也支持流媒体应用,并可以自动适配极低的比特率流,实现连续不间断的播放效果。xHE-AAC的另一个关键特性是MPEG-D响度和动态范围控制元数据。它允许服务提供商在音频比特流中嵌入特定于内容和端点的元数据,从而在播放端为任何播放设备和环境实现一致的响度级别和最佳动态范围。
“MPEG-H音频技术使用户在家就能体验影院般沉浸式音频效果。此外,它还能够实现交互性音频,即通过基于对象的编解码技术实现各种音频预设,使用户能够根据自身需求调节音频效果。”Toni Fiedler举例道:“MPEG-H可以为用户提供可以选择的不同预设,例如让用户调整对白音量,选择不同的语言或评论员声音。对于那些希望自己掌控音频的用户来说,MPEG-H赋予了他们充分的自由度。”
LC3同样是一项非常优秀的技术。Toni Fiedler表示,通过LC3技术,蓝牙耳机在VoLTE通话中可以实现超宽带语音质量,且将无线设备上的音乐流媒体体验提升到全新高度。该编解码器具备低延迟、低计算复杂度,以及低内存占用量的特点。LC3plus作为LC3的扩展版,包括了许多附加功能。具体来说,LC3plus能够适用于高解析音乐流服务,此外,LC3plus具有很高的传输鲁棒性、极低延迟及高分辨率音频传输能力。LC3plus不仅使产品的能耗显著降低,保证了传输的稳定性,还在无线环境中降低了误码情况的发生。此外,LC3plus还获得日本音频协会认证的无线高采样率音频编解码器标志。
EVS技术则能够提升手机语音通话信号传播质量并且改善音质。Toni Fiedler举例道:“比如说你拿起手机打电话,但是音效非常差,EVS技术就可以解决这个问题。”他进一步表示,EVS能够使信号更加清晰,也能够实现音质的改良。这是3GPP指定的5G语音通话编解码标准,该标准是Fraunhofer与华为等全球领先的企业共同制定的。同时也符合中国通信标准。欧洲、日本、韩国和美国的网络现已开放对EVS技术的支持。
AI在改进编解码器的过程中同样大有可为。“现在几乎每家公司都在研发人工智能。”Toni Fiedler表示。在AI的支持和助力下,Fraunhofer IIS的第五代音频技术正处于研发阶段。
“我们可以把噪声和语音区别开来,也能够以更好的方式识别人声。我们还有更加自然的语音合成技术,当然,我们还有安全的语音协助和自然语言的交互技术,这是可以在专业领域应用的。”Toni Fiedler表示。