7月3日,字节跳动旗下火山引擎以超清修复技术让“Beyond 1991生命接触演唱会精选”“别了家驹十五演唱会精选”两场演唱会在抖音、西瓜视频、今日头条、鲜时光TV平台直播重映,为广大歌迷带来了一场视觉与听觉的盛宴。
演唱会超清修复存在多个技术难点
作为一个时代的文化印记,Beyond乐队在粤语歌坛的地位毋庸置疑。此次被超清修复的演唱会更是跨越了31年的时间长河,再度唤醒了几代歌迷的青春记忆。然而,受限于当时的拍摄器材、存储介质及录音设备技术,演唱会的超高清修复工作存在诸多技术难点。
演唱会的画质直接影响观众的观赏体验。相较于普通影片,在演唱会过程中,歌手面部特写是观众最关注的地方,所以对画面的精细度、还原度要求极高。画质修复方面,普通的画质修复算法对人脸处理不够精细,需要利用先验特性对人像进行精细化修复,不同大小(近景、中景、远景)、不同姿态(侧脸、俯视、仰视),甚至现场一些遮挡物带来的光影效果,都对修复算法提出了极高的要求。比如,由于早期拍摄设备的原因,演唱会影片存在大量的过曝与死黑场景,以及较重的底噪等情况。修复效果与老旧视频的复古感之间的平衡度很难把控。
演唱会精华在于现场声音,声音细节也是观众在意的关键。音质修复方面,由于过去的录音设备技术落后、演唱会录音环境复杂、拾音不佳等情况普遍存在,再加上片源在制作、压缩、传输等过程中带来的各种损耗问题,演唱会的音质修复工作也是难上加难。比如,在演唱会上,现场拾音时,由于设备性能限制,有可能会收录到歌手的歌声、呼吸声、乐器声,观众的欢呼声、说话声,还有风声等,来自周边环境的底噪声会影响到演唱会的整体听觉感受;音源文件可能会因为录制设备或者不当的录制选项导致高频信息缺损,影响音质。
火山引擎以视频修复技术重现经典
“我一直以来最大的心愿就是能再看一场Beyond的演唱会,这次也算是‘圆梦’了。”Beyond的一位忠实粉丝观看了修复版演唱会之后表示,“虽然人不在现场,但是我连黄家驹的发丝、脸上的汗珠、指尖的琴弦都能看得清清楚楚,他的声音就像在耳边一样,这种身临其境的感觉非常过瘾。”据统计,修复版演唱会直播当晚,累计观看人次超1.4亿。那些独属Beyond的辉煌时刻再度在歌迷们的眼前上演。而这一切的背后,离不开火山引擎提供的技术支持。
一方面,火山引擎将其完整的画质全链路端到端解决方案应用其中,基于服务端分析系统、服务端视频处理系统,客户端解码后处理系统在上传、转码、传输等多个环节中对视频内容进行画质、码率、体验的优化。特别是在人脸修复方面,火山引擎多媒体实验室自研的自适应人像增强算法,对人脸压缩损伤、模糊、低分辨率等问题进行修复增强,基于深度学习,在消除人脸整体的模糊和压缩损伤的同时,进一步对人脸关键的五官进行细节重建。同时,依托视频云自研的编码器,可以让视频在确保画质的同时体积做到最小,并能有效减少卡顿、延时等问题的发生。
“我们的目标是从画面整体清晰度、人像五官复原度、色彩亮度、流畅度、美观度等方面对画质进行提升。”火山引擎多媒体实验室研究员赵世杰介绍说。画质上,本次修复通过清晰度增强和瑕疵修复、分区域色彩亮度增强等算法,处理早期软硬件设备落后导致的问题。视频分辨率从不足540p提升到接近4K水平,帧率从25fps提升到60fps。
另一方面,火山引擎音频技术团队通过音频降噪、音频超分和响度算法,消除噪声提升音质,有效解决了响度、噪声干扰、带宽不足等问题。火山引擎音频技术团队研究员舒晓峰指出,与传统降噪方案不同,本次降噪算法针对音乐场景和人声场景,实现了兼容AI降噪算法,在保留音乐和人声的前提下,抑制周围噪声。音频超分算法则对演唱会中的人声部分进行频带拓展,丰富高频信息,使人声更加清晰。
据了解,相关的修复能力目前均已通过火山引擎智能处理、音频技术两个产品对外提供服务。赵世杰表示:“我们做超清修复最大的优势在于像抖音、西瓜视频等业务平台每天都会收到用户海量的投稿,丰富的应用场景有助于我们不断优化迭代相关算法,让我们能够有机会从这个赛道上脱颖而出;与此同时,在算法方面我们也有自己的技术特色,比如人像修复技术做了很多独有的创新。未来,通过超高清修复,我们将持续进行技术沉淀,为经典影像传承及企业客户带来更大价值。”