2018世界VR产业大会于10月19日至10月21日在江西南昌举行。作为大会期间的重要活动之一,上海科技大学虚拟现实与视觉计算中心承办的人工智能分论坛于10月20日下午举行。
本次论坛主题为“AI驱动下的AR和VR”,吸引了来自众多行业人工智能和VR领域的专家、学者及企业代表200余人,一同分享人工智能场景落地的实践经验,展望“AI+行业”的科技未来。与会专家表示,人工智能和虚拟现实技术融合发展的新成果,将广泛应用于医疗、手术、教育、培训、军事、安防、休闲娱乐和数字文化等诸多领域,为经济发展创造出许多新模式、新亮点,也为人们对美好生活的需求提供了新手段、新选择。
当前,人工智能产业仍处于发展初期,需要政府有关部门进一步完善政策环境,加强规划协同,引导资源集聚,推动创新发展。工业和信息化部电子信息司副司长吴胜武在致辞中表示,中国政府高度重视人工智能产业的发展,着力推动互联网、大数据、人工智能和实体经济深度融合。作为产业主管部门,工业和信息化部电子信息司围绕推进人工智能芯片发展做了大量工作,并取得了一定成效。组织研究了人工智能芯片技术的发展路线图,明确阶段发展目标,落实相关措施,推动产业发展;支持FPGA、GPU等高端芯片关键技术研发和产业化,鼓励和指导一批初创企业围绕ASIC芯片路线开展研发布局,目前己有多款人工智能芯片产品发布;引导和支持龙头企业牵头,整机、系统、应用企业协同攻关,进一步优化人工智能产业生态体系。
在人工智能分论坛上,上海科技大学信息科学与技术学院副院长虞晶怡介绍了如何将人工智能研究成果应用于增强现实、影视特效、电商新零售等多个领域,为行业用户提供逼真三维内容服务。康奈尔大学计算机系主任卡维塔·巴拉在演讲中表示,过去几年VR技术的进步和突破给零售业带来带来了巨大的价值,而这一切变化都与计算机图形学和计算机视觉进步有关,它们的进步能够更真实地呈现虚拟世界。北京大学教授黄铁军阐释了强人工智能的意义,以及它可能对人类产生的影响。他预测,未来10~20年,科学家将发现表达知识及其演化的更优算法,人类也将亲眼见证人造“超级大脑”变成现实。
康奈尔大学计算机系主任卡维塔·巴拉:
VR技术进步和计算机图形学与视觉有关
今天,我们所进行的研究能够改变消费者体验社会、体验世界的能力,这令我感到无比振奋。我认为,现在大家所说的毫米级、微量级的分辨率,或者微量级的人工智能的算法,能够让人们更精准地感知真实社会。我也相信,VR/AR技术的发展能够让人类更加了解自己。
以后如果要到零售店,通过分辨率便可以看到整个材质的质量,通过VR技术也能够了解其内在的质量。说到VR,其实我们最终的目标,是能够通过虚拟的世界来呈现整个真实世界的景象。通过我们的算法,能够使整个产品变得栩栩如生,让消费者对产品有更加全面的了解。
过去几年,VR技术的进步和突破给零售业带来了巨大的价值。近几年宜家将它们的产品目录以虚拟现实的方式进行展示,从最初选择10%产品做成虚拟现实,到现在已经有90%做成了虚拟现实,已经做到以假乱真的程度,而这一切的变化都与计算机图形学和计算机视觉进步有关。
北京大学教授黄铁军:
对人工智能的理解要克服局限性
人工智能发展100年的历史进程中,我们关注最多的是新的算法、新的模型这样一些智能层面的东西,我们很少关注实现智能底层的东西及其正在发生什么变化。大家说做人工智能,不就是在计算机上做吗?这样一个想法有一定的道理,但是有局限性,我们要做真正的更强的人工智能,甚至强人工智能或者多人工智能,一定要改变那台机器。我们要创作,要有新的机器。做这个机器过程中的第一步,就是先做出眼睛,然后逐渐做出大脑。
视觉感知是生物智能的重要组成部分,生物视觉信息处理机制优越,仿视网膜超速全时视觉芯片像生物视网膜一样采用神经脉冲表达视觉信息,脉冲发放频率超过人眼百倍,能够“看清”高速旋转叶片上的文字。“全时”是指从芯片采集的神经脉冲序列中重构出任意时刻的画面,这是实现真正机器视觉的基础,有望重塑视觉信息处理体系,为无人驾驶、机器人、视频监控等领域带来重大变革。
瑞士洛桑联邦理工学院教授Daniel Thalmann:
虚拟环境变真实需要更好的传感器
VR最主要的目的就是当我们在虚拟世界当中,我们希望感受是真实的。换句话说,我们应该可以像在真实世界一样完成所有的感知。通过虚拟人或者虚拟人的一些嗅觉、触觉的传感器,可以让整个虚拟环境更加真实。但是要完成这样的目标,就需要很好的传感器。
最近我们做了一个项目,关于排球的一个项目。这是一个多用户的排球游戏项目,两支队伍,每队六个选手,选手之间的互动是使用排球,通过计算机和真实选手之间的一个联合、合并。也就是说,是一个真实世界和虚拟世界的结合。不管你是真实的人,还是几个人也好,都可以和对方的团队来进行互动。这时候你并不知道对面的对手是真正的人还是虚拟世界里面的虚拟人,你可以看到,他们的目光会跟随着球来回运动。这样一个合成视觉是非常有意思的领域。
微软亚洲研究院首席研究员童欣:
三维内容生产是一个瓶颈
三维内容生产本身一直是一个瓶颈问题,我们很多行业需要三维内容,但只有专业人员才能把很多行业的内容变成三维内容,这个瓶颈就产生了,这需要技术的进步。我们通过一些物理知识,通过学到的一些几何知识,或者从数据中学到的知识,帮助我们更加智能,更加有效地生成高质量的三维内容。
我认为,所有学到的物理知识、计算方法,都是机器智能中很有效的部分,我们应该更好地有效地利用它们。但是我们最终的目标是想让一个普通用户来生成高质量的内容,我们实际上还有很长的路需要走。
虚拟的三维,或者在真实世界中叠加的三维,决定了你必须创造出三维的内容,因为人的视野随时在变,光照随时在变,人和物体随时在交互,状态随时在变,传统的视频也好,图像也好,解决不了这个问题,只有三维的图像能解决这样的问题。这也是为什么三维内容的生成,在VR/AR中变得很关键的原因。