更多精彩 >

AI让远程交流“更清晰”:GAN消除视频通话中的抖动

2020-10-22 09:15:03   来源:  作者: 

摘要:NVIDIAMaxine是一款云AI视频流平台,将使用GAN来提高带宽性能

NVIDIA Maxine是一款云AI视频流平台,将使用GAN来提高带宽性能

image.png

Ming-Yu Liu 和Arun Mallya 正在进行视频通话,其中一个人的画面开始出现卡顿,直至画面定格。

这是一种常见且令人反感的情况。但与大多数人不同的是,Liu和Mallya可以做出一些改变。

他们是NVIDIA的AI研究人员,专攻计算机视觉。在与Ting-Chun Wang共事中,他们意识到可以使用神经网络来替代被称为视频编解码器的软件,这种软件通常用于视频在网络传输过程中的压缩和解压缩。

迄今为止,他们的工作成果将用户在视频通话时所需的网络带宽压缩至原来的十分之一,还有望将带宽消耗降低数个数量级。

Mallya表示:“我们希望通过AI提供更好的视频沟通体验,即使在带宽极低的情况下,也可以从语音升级到视频通话。”

GAN让连接质量更佳

即使用户的面部有遮挡(比如戴着帽子、眼镜、耳机或口罩),这项技术同样适用。为了增加趣味性,他们在演示中使用了一些装饰物,这样用户可以在线上更改其发型或衣服或者创建头像。

更重要的是,如上图所示,借助神经网络定位,无需再盯着显示器上方摄像头才能与对方对视,这增强了面对面对话的感觉。

Wang表示:“借助计算机视觉技术,我们可以从多个角度来定位头部。我们认为这将帮助人们更自然地进行对话。”

迎接最前沿的AI技术,让虚拟生活更真实。

AI赋能视频通话的原理

AI辅助视频通话的工作机制十分简单。

与目前使用压缩的视频流的系统类似,参考图像发送后,仅用户眼睛、鼻子和嘴巴周围几个关键点的位置数据被发送,而非发送大量压缩过像素的图像。

接收端的生成式对抗网络通过初始图像和面部关键点,在本地GPU上重构后续图像。因此,通过网络传输的数据要比之前少得多。

Liu在GAN领域的工作成果GauGAN曾引发关注。GauGAN是一种可以将涂鸦转化为写实艺术作品的AI工具,目前已经创建了超过一百万张图像。该工具可在AI Playground中获取。

Liu表示:“疫情期间频繁的视频会议启发了我们,因此我们开始探索突破带宽瓶颈的方式,让供应商可以同时为更多人提供服务。”

GPU突破带宽瓶颈

这一方法顺应当前行业趋势,将网络瓶颈转化为计算任务,从而借助本地或云端资源更轻松地解决此类问题。

NVIDIA媒体集团高级产品总监Andrew Page表示:“如今,许多公司希望将带宽问题转化为计算问题,这是因为带宽一般很难增加,而增强算力则相对容易。”

image.png

NVIDIA Maxine搭配了一套视频会议和流媒体服务工具

AI 工具优化视频服务

GAN视频压缩是NVIDIA Maxine即将推出的几个功能之一,这是一个云AI视频流平台,用于增强视频会议和电话质量。它将音频、视频和对话式AI功能整合在一个工具包中,并支持多种设备。

在上周的GTC大会上,NVIDIA宣布推出了Maxine平台。基于该平台,服务提供商能够在提供超高分辨率的视频的同时,实现实时翻译、噪声消除和情景感知的闭路字幕。用户可以享受到人脸校正、虚拟助手和化身逼真的动画角色等功能。

Page表示:“视频会议正在经历一场复兴。疫情期间,它的缺点给所有人带来了不愉快的使用体验,但回归视觉动物的属性,视频终将成为人们今后生活中的一部分。”

通过利用基于Tensor Core核心的NVIDIA GPU,Maxine可运行如NVIDIA Jarvis的软件。NVIDIA Jarvis是用于对话式AI的SDK,提供了一套语音和文本功能。 它们共同提供了当今有用的AI功能,并成为未来视频产品和服务的基石。

想要了解更多有关AI计算的最新技术,解锁GPU前沿应用,可点击链接:https://www.nvidia.cn/gtc/keynote/,观看GTC 2020秋季站主题演讲上的精彩内容。

image.png

 


猜你喜欢
原创

字节跳动,在中国搞出“ChatGPT”?

AI字节跳动ChatGPT

字节跳动,再次激活AI赛道?

2024-12-25

原创

原创科幻数字IP白月城发布AI短剧先导片,探索千亿级市场

AI

《白月城》由“风起”“云涌”“拨云”“见月”四部曲组成,超现实科幻剧集,各篇章环环入扣,高潮迭起。

2024-08-26

一场AI与设计师的同台竞技,你更看好谁?

金融科技AI

如同工业革命的开启,机器代替了大部分的手工,提升了生产效率;AI时代的到来,减少了重复、低价值的脑力...

2024-08-15

AI创新为消费电子“添翼” 产业链公司加码布局

AI

首先,AI技术的引入将推动消费电子产品的功能升级和性能提升,如更智能的语音助手、更精准的健康监测、更...

2024-06-20

原创

AI“乱杀”时代,我们真正需要的是什么样的产品?

AI

本周,苹果股价连涨三天,终于在美东时间6月13日周四收盘时超过微软,重新夺回全球市值最高公司的头衔。

2024-06-14

五粮液再度携手世界顶尖科学家论坛 展现白酒科技力量

上市公司五粮液

白酒龙头企业五粮液作为世界顶尖科学家论坛全球战略合作伙伴和指定用酒,连续两年与世界顶尖科学家智慧碰撞...

2024-10-28

AI教育大爆发前夜,智谱华章携手豆神教育的背后逻辑

文化传媒智谱华章

今年上半年,好未来、网易有道、高途等企业营收均达到两位数的增长。豆神教育也在2024第三季度交出了优...

2024-10-28

原创

珅斯科技斩获一轮新融资,创新与量产齐飞

珅斯科技

近日,珅斯科技(安徽)有限公司(以下简称“珅斯科技”)宣布完成A轮融资,投资方为同创伟业、协立投资,...

2024-10-28

长盈精密前三季度业绩增长380倍,积极拥抱AI+机器人

上市公司长盈精密

10月25日晚,长盈精密(300115.SZ)披露了2024年三季度报告。

2024-10-27

飞诺门阵荣膺广东省科技进步奖一等奖

创新创业飞诺门阵

2024年10月,飞诺门阵与广东工业大学等多家校企单位联合研发的“高性能大容量固态存储控制器关键技术...

2024-10-27

原创

女明星押注IPO,一把套现1947万

梦金园

梦金园再战港股,海清能否凭此翻身?

2024-10-26

原创

又一巨头扛不住了,被曝大量关店!

星巴克太平洋瑞幸

突然被曝大量关店!曾仅次于星巴克的咖啡品牌凉了?

2024-10-26

投资家网(www.investorscn.com)是国内领先的资本与产业创新综合服务平台。为活跃于中国市场的VC/PE、上市公司、创业企业、地方政府等提供专业的第三方信息服务,包括行业媒体、智库服务、会议服务及生态服务。长按右侧二维码添加"投资哥"可与小编深入交流,并可加入微信群参与官方活动,赶快行动吧。

沙特天空塔投资设立专项基金带领中国氢能独角兽扎根沙特

2016年注册于北京的中氢新能技术有限公司,下设位于大兴的装备制造公司、位于海淀区的技术研究院、材料...

挑战奔驰的明星车企,突然“翻车”了

一度无比高光的理想汽车,猝不及防遭遇重挫。

深圳天使母基金姚小雄:将来股权投资行业竞争是服务能力的竞争

2024年1月10日,由投资家网主办,财经锐眼、有时间协办,北京微金科技有限公司承办的“第十二届股权...

避免卡脖子,硬科技如何“逆境”突围?

2024年1月10日,由投资家网主办,财经锐眼、有时间协办,北京微金科技有限公司承办的“第十二届股权...

VC/PE眼中的“专精特新”

2024年1月10日,由投资家网主办,财经锐眼、有时间协办,北京微金科技有限公司承办的“第十二届股权...

第二届中匈可再生能源、新材料商业投资峰会将盛大启幕

第二届中匈可再生能源、新材料商业投资峰会将盛大启幕

第二届中匈可再生能源、新材料商业投资峰会于2025年4月9日在匈牙利布达佩斯盛大启幕。

雕刻耐心|第18届中国投资年会·有限合伙人峰会在沪召开

雕刻耐心|第18届中国投资年会·有限合伙人峰会在沪召开

“中国投资年会”作为私募股权行业的年度盛会,已成功举办了18届,吸引了全国VC/PE领域从业者的广泛...

雕刻耐心|第18届中国投资年会·有限合伙人峰会即将启幕

雕刻耐心|第18届中国投资年会·有限合伙人峰会即将启幕

2024年的一级市场,“耐心”是最高命题,也引发了持续全年的讨论。

不响不辍|第18届中国投资年会·年度峰会在沪召开

不响不辍|第18届中国投资年会·年度峰会在沪召开

5月8-10日,由投中信息、投中网主办的“第18届中国投资年会·年度峰会”在上海外滩W酒店盛大召开。

2024汽车科技创新与成果转化大会在常州成功召开

2024汽车科技创新与成果转化大会在常州成功召开

4月12日,2024汽车科技创新与成果转化大会在常州经开区成功召开。