更多精彩 >

特斯联实现人工智能科研突破,多项研究成果入选CVPR、TPAMI等国际顶会顶刊

2022-05-09 16:10:27   来源:  作者: 

摘要:随着京津冀、长三角、粤港澳大湾区、成渝等地启动建设全国一体化算力网络国家枢纽节点,“东数西算”工程全面正式启动,作为数据处理的核心新型基础设施,人工智能、物联网、云计算、区块链等技术将迎来更为精细化的发展前景。

随着京津冀、长三角、粤港澳大湾区、成渝等地启动建设全国一体化算力网络国家枢纽节点,东数西算工程全面正式启动,作为数据处理的核心新型基础设施,人工智能、物联网、云计算、区块链等技术将迎来更为精细化的发展前景。近期,作为成渝地区东数西算的深度参与者,特斯联对外公布了其计算机视觉(CV)领域的多个科研突破,并有8篇论文被CVPRTPAMI等顶级国际学术会议和期刊收录。

 

此次,特斯联在 CV 领域的科研突破涵盖了语义分割、图像增强、显著物体识别、迁移学习、行为识别,等方面。其中不少创新技术打破了现有技术上限,亦开发了数个性能更优、识别更快、效率更高的模型,这些技术研究的应用与推广将会成为特斯联赋能城市数字化、智能化的有力保障。

在机器视觉行业产业链中,如上游的光源、镜头、工业相机、图像处理器、图像采集卡等硬件,图像处理软件和底层算法等软件系统会随着机器视觉的迭代而快速发展,推进整个产业链的升级。全球知名AI专家、特斯联集团首席科学家兼特斯联国际总裁邵岭博士及其团队在该领域中提出的图像和视频的识别和学习各算法,极大缩短了训练和推理时间,从图像识别提升、识别效率提升以及解决数据标注瓶颈三个方面,提升了整体视觉应用效果:

 

1)图像识别提升

在图像识别方面,团队的技术突破主要集中在算法层面,囊括背景消除模块、图像特征突出等。这些可以从图像本质入手,丰富图像本身信息,去除多余噪点,为后续图像识别提供高清的图像数据,是高效率识别的基础。更有技术突破采用创新的手法,如加上声音信息来协助识别,提高信息准确度。

 

在被收录于顶会CVPRLearning Non-target Knowledge for Few-shot Semantic Segmentation》(《学习用于小样本语义分割的非目标知识》)研究中,团队从挖掘和排除非目标区域的新角度重新思考了少样本语义分割,继而提出了一个新颖的非目标区域消除(Non-target Region Eliminating)框架,其中包含了一个背景挖掘模块(Background Mining Module)、一个背景消除模块(Background Eliminating Module)和一个分散注意力的目标消除模块(Distracting Objects Eliminating Module)以确保模型免受背景和分散注意力目标的干扰进而获得准确的目标分割结果。不仅如此,该研究还提出一个原型对比学习(Prototypical Contrastive Learning)算法,通过精炼原型的嵌入特征以便更好的将目标对象与分散注意力的对象区分开来。

1.jpg

采用不同模块的目标分割表现

 

在被收录于TPAMI期刊的Learning Enriched Features for Fast Image Restoration and Enhancement》(《学习用于快速图像修复和增强的丰富特征》)研究中,团队发现现实中的相机存在诸多物理限制,尤其在复杂的照明环境,采集的图像经常会出现不同程度的退化现象。比如智能手机相机的光圈很窄,传感器很小,动态范围也有限,因而经常产生噪声和低对比度的图像。为此团队提出了一种全新架构,其整体目标是通过整个网络维持空间精确的高分辨率表征并从低分辨率表征中接收互补的上下文信息。 方法的核心囊括以下关键元素的多尺度残差块:(a) 用于提取多尺度特征的并行多分辨率卷积流,(b)跨多分辨率流的信息交换,(c)用于捕获上下文信息的非局部注意力机制,(d)基于注意力的多尺度特征聚合。 该方法学习了一组丰富的特征,即结合了来自多个尺度的上下文信息,同时保留了高分辨率的空间细节。该技术可以解决现实中物理相机的缺陷,提高图片质量,也为后续识别提供良好的载体。

2.jpg

采用我们所提出方法(下排右二)生成的图像在视觉上更接近于亮度和整体对比度的地面真实情况

 

团队还就显著目标检测(SOD)数据集的严重设计偏差问题进行了研究,并收集了一个全新高质量,目前最大的实例级SOD数据集- Salient Objects in ClutterSOC,以缩小现有数据集与真实场景之间的差距。通过对203个代表性模型的回顾,和一个线上基准模型的维护,以及100SOD模型全面的基准和性能评估,实现对SOD发展的动态追踪以及更深入的理解。此外,团队还设计了三个数据集增强策略,包括标签平滑,随机图像增广和基于自监督学习的正则化技术以有效提高尖端模型的效果。该技术可以在复杂环境中让目标突出,在信息混乱的图像或者视频中,准确抓取目标,为识别分析提供准确信息。此研究成果被收录于TPAMI期刊中。

3.jpg

与实例级ILSO数据集(a)和MS-COCO数据集(c)相比,我们的SOC数据集(b&d)可标注精细、平滑的边界

 

由布景或摄像机视点变化引起的域偏移下的行为识别问题也是团队重点研究的方向。在收录于顶会CVPR中的Audio-Adaptive Activity Recognition Across Video Domains》(《跨视频域的音频自适应行为识别》)的研究中,团队提出了一种新颖的音频自适应编码器,借助丰富的声音信息来调整视觉特征以便模型在目标域中学习更多的判别特征。 它通过引入一种音频注入识别器(Audio-infused Recognizer)以进一步消除特定域(domain-specific)的特征,并利用声音中的域不变信息来实现有效的跨域跨模态的交互。此外,还引入了一个actor shift的新任务,以及相应的数据集,以在行为外观发生巨大变化的情况下挑战该模型。该技术加入声音参数来识别物体活动,可以更加准确识别和分析出物体的行为,在智慧城市应用中可以有更准确的分析结果。

4.jpg

当同一活动的视觉相似性在不同领域间难以发现时,我们的模型(红色)可以使用来自声音的额外线索来提高识别精度

 

基于自注意力的网络在图像描述取得了巨大成功但仍存在距离不敏感和低秩的瓶颈。为解决这一问题,团队在发表于IEEE Transactions on Multimedia期刊中的Multi-Branch Distance-Sensitive Self-Attention Network for Image Captioning》(《用于图像描述的多分支距离敏感自注意力网络》)研究中,对自注意力机制从两个方面进行了优化:一个是距离敏感的自注意力方法(DSA),通过在SA建模过程中考虑图像中目标之间的原始几何距离,来提高图像场景理解;另一个是多分支自注意力方法(MSA),以打破SA中存在的低秩瓶颈,并在可忽略的额外计算成本下提高MSA的表达能力。

5.jpg

我们的方法(下排)和标准Transformer模型(上排)生成的注意力可视化和图像描述示例。一些准确的单词用绿色标记,错误和不准确的单词用红色标记。我们的方法可得到更精确的描述。

 

2)识别效率提升

为提高识别效率,团队研究出新的算法框架以及新的采样器,可以显著提高识别效率,大大缩短训练时间。在图像识别中,快速的识别可以提高服务质量,减少延迟,让人们感受更智能的交互。

团队发现大多数基于循环神经网络的视频物体分割(RVOS)方法采用基于单帧的空间粒度建模,而视觉表征的局限性容易导致视觉与语言匹配不佳。基于此,团队提出一种新颖的多级表征学习方法,通过探索视频内容的固有结构来提供一组视觉嵌入,从而实现更有效的视觉-语言语义对齐。具体来说,它在视觉粒度方面嵌入了不同的视觉线索,包括视频级别的多帧长时信息、帧级别的帧内空间语义以及对象级别的增强对象感知特征。其次,它还引入了动态语义对齐(DSA),可以更紧凑、更有效地动态学习和匹配具有不同粒度视觉表征的语言语义。从实验结果来看,该研究Multi-Level Representation Learning with Semantic Alignment for Referring Video Object Segmentation》(《具有语义对齐的多级表征学习用于参考视频对象分割》)具有较高的推理速度,也因此被顶会CVPR收录。

 

在视觉研究中,团队发现业界最流行的随机采样方法,PK采样器,对深度度量学习来说信息量不足且效率不高,为此提出一种可用于大规模深度度量学习的高效的小批量采样方法,称为图采样(Graph Sampling)。该模型的思想是在每个epoch开始时为所有类别构建最近邻关系图。然后,每个小批量由随机选择的类别和其最近邻组成以便学习信息丰富的示例。该方法显著提高了重新识别率,大大缩短了训练时间。该技术为通用技术,可用于图像检索、识别等。该技术主要目的是提升效率,这是在当下高负荷多信息的智慧领域必不可少的技术,快速分析识别能够在一些图像检索和识别应用快速满足用户需求。该研究Graph Sampling Based Deep Metric Learning for Generalizable Person Re-Identification》(《基于图采样的深度度量学习用于可泛化的行人重识别》)同样收录于今年的CVPR

 

3)解决图像标注问题

数据标注是一个重要的过程,传统人工数据标注费时费力。团队提出了一种新技术以更高效地解决背后的问题。该研究被收录于今年的CVPR中,标题为Category Contrast for Unsupervised Domain Adaptation in Visual Tasks》(《视觉任务中无监督域适应的类别对比》)。团队提出了一种新的类别对比技术(CaCo),该技术在无监督域适应(UDA)任务的实例判别之上引入了语义先验,可以有效地用于各种视觉UDA任务。该技术构建了一个具有语义感知的字典,其中包含来自源域和目标域的样本,每个目标样本根据源域样本的类别先验分配到一个()类别标签,以便学习与UDA目标完全匹配的类别区分但域不变的表征。与当下最先进的方法对比,简单的CaCo技术可以实现更优越的性能表现,也可以成为现有UDA方法的补充,推广到其他机器学习方法中去,如无监督模型适应,开放/部分集适应等。该技术解决了传统监督学习需要大量人工标注的问题,比现有技术拥有更高的效率。

 

 

猜你喜欢

特斯联完成20亿元D轮融资

特斯联

4月9日,人工智能物联网(AIoT)企业特斯联宣布完成 D 轮 20 亿人民币融资交割。

2024-04-09

深度布局华东区域,特斯联加速推进智慧余姚落地

特斯联

近日,特斯联华东总部开业仪式在中意宁波生态园隆重举行。

2024-01-08

特斯联与巴林开启数智合作新篇章

特斯联巴林

近日,巴林王国工业和商业大臣法赫鲁(H.E. Abdulla A. Fakhro)率领巴林王国高级政...

2023-10-27

“一带一路”展现中非合作成果,特斯联艾渝受邀与肯尼亚总统共探中肯数字化合作新机遇

特斯联

作为中国首倡并主办的层级最高、规模最大的多边外交活动,经过十年发展,“一带一路”倡议已成为国际合作的...

2023-10-19

国家电投与特斯联设立合资公司,发掘资本在新能源行业的潜在投资机遇

特斯联国家电投

近日,特斯联与国家电投集团江西电力有限公司签署全面战略合作协议,成立合资公司

2023-07-10

天辅高分科技完成数千万元股权融资

天辅高分科技

天辅高分科技完成数千万元股权融资

2024-09-08

中国银联助力上海市家电家居消费补贴活动

大消费中国银联

上海市财政的补贴范围则扩展为16类家电、15类家装建材、6类家具、15类适老化产品。对于处于国家补贴...

2024-09-08

原创

智度股份:与广州市税务局共同打造的元宇宙税务局项目目前在推进中

上市公司智度股份

公司与广州市税务局共同打造的元宇宙税务局项目目前在推进中。

2024-09-08

资源板块调整后迎来机遇,民生加银基金抢抓市场先机

金融科技民生加银

这种回调也促使前期涨幅较大的资源股估值逐渐回归理性,为寻求价值合理性与长期增长潜力的投资者提供了更为...

2024-09-08

新生纪完成数千万人民币Pre-A++轮融资

新生纪

近日,新生纪智能(CenoBots)完成数千万人民币Pre-A++轮融资,本轮融资由天堂硅谷独家投资...

2024-09-07

原创

“苏焱电子”完成千万级天使轮融资

苏焱电子

“苏焱电子”完成千万级天使轮融资

2024-09-07

原创

智度股份:半年报业绩实现营收净利双增,继续加强与华为鲸鸿动能之智度股份

上市公司智度股份

近日,智度股份(000676.SZ)披露2024年半年报显示,智度股份实现营业收入约14.27亿元,...

2024-09-07

原创

AI赋能,智度股份拓展业务想象空间

智能+智度股份

AI技术的迅猛发展在助力人们提高生活和工作效率的同时,也为许多业务打开了新的想象空间。

2024-09-07

新能源与AI需求激增,民生加银中证内地资源业绩持续增长

金融科技民生加银

2024年以来,在A股市场的风波不断的环境下,资源品行业相对表现出色,特别是石油石化、煤炭等板块,逆...

2024-09-07

投资家网(www.investorscn.com)是国内领先的资本与产业创新综合服务平台。为活跃于中国市场的VC/PE、上市公司、创业企业、地方政府等提供专业的第三方信息服务,包括行业媒体、智库服务、会议服务及生态服务。长按右侧二维码添加"投资哥"可与小编深入交流,并可加入微信群参与官方活动,赶快行动吧。

沙特天空塔投资设立专项基金带领中国氢能独角兽扎根沙特

2016年注册于北京的中氢新能技术有限公司,下设位于大兴的装备制造公司、位于海淀区的技术研究院、材料...

挑战奔驰的明星车企,突然“翻车”了

一度无比高光的理想汽车,猝不及防遭遇重挫。

深圳天使母基金姚小雄:将来股权投资行业竞争是服务能力的竞争

2024年1月10日,由投资家网主办,财经锐眼、有时间协办,北京微金科技有限公司承办的“第十二届股权...

避免卡脖子,硬科技如何“逆境”突围?

2024年1月10日,由投资家网主办,财经锐眼、有时间协办,北京微金科技有限公司承办的“第十二届股权...

VC/PE眼中的“专精特新”

2024年1月10日,由投资家网主办,财经锐眼、有时间协办,北京微金科技有限公司承办的“第十二届股权...

第二届中匈可再生能源、新材料商业投资峰会将盛大启幕

第二届中匈可再生能源、新材料商业投资峰会将盛大启幕

第二届中匈可再生能源、新材料商业投资峰会于2025年4月9日在匈牙利布达佩斯盛大启幕。

雕刻耐心|第18届中国投资年会·有限合伙人峰会在沪召开

雕刻耐心|第18届中国投资年会·有限合伙人峰会在沪召开

“中国投资年会”作为私募股权行业的年度盛会,已成功举办了18届,吸引了全国VC/PE领域从业者的广泛...

雕刻耐心|第18届中国投资年会·有限合伙人峰会即将启幕

雕刻耐心|第18届中国投资年会·有限合伙人峰会即将启幕

2024年的一级市场,“耐心”是最高命题,也引发了持续全年的讨论。

不响不辍|第18届中国投资年会·年度峰会在沪召开

不响不辍|第18届中国投资年会·年度峰会在沪召开

5月8-10日,由投中信息、投中网主办的“第18届中国投资年会·年度峰会”在上海外滩W酒店盛大召开。

2024汽车科技创新与成果转化大会在常州成功召开

2024汽车科技创新与成果转化大会在常州成功召开

4月12日,2024汽车科技创新与成果转化大会在常州经开区成功召开。