基于跨模态元迁移,美图&大连理工的参考视频目标分割方法只需单阶段

引言

参考视频目标分割(Referring VOS, RVOS)是一个新兴起的任务,它旨在根据参考文本,从一段视频序列中分割出文本所指述的对象。与半监督视频目标分割相比,RVOS 只依赖抽象的语言描述而不是像素级的参考掩膜,为人机交互提供了一种更方便的选择,因此受到了广泛关注。

图片

论文链接:https://www.aaai.org/AAAI22Papers/AAAI-1100.LiD.pdf

该研究的主要目的是为解决现有 RVOS 任务中所面临的两大挑战:

如何将文本信息、图片信息进行跨模态融合,从而既保持两种模态间的尺度一致性,又能充分地将文本所提供的有用特征参考充分融入到图片特征中;如何抛弃现有方法的二阶段策略(即先在图片级别逐帧得到粗略的结果,再利用该结果作为参考,经过增强时序信息的结构细化得到最终预测),将整个 RVOS 任务统一进单阶段的框架中。

对此,该研究提出了一种跨模态元迁移的端到端 RVOS 框架 ——YOFO,其主要的贡献和创新点为:

只需单阶段推理,即可实现利用参考文本信息直接得到视频目标的分割结果,在两个主流的数据集 ——Ref-DAVIS2017 和 Ref-Youtube-VOS 上获得的效果超越了目前所有二阶段方法;提出了一个元迁移(Meta-Transfer)模块来增强时序信息,从而实现了更聚焦于目标的特征学习;提出了一个多尺度跨模态特征挖掘(Multi-Scale Cross-Modal Feature Mining)模块,能够充分融合语言、图片中的有用特征。

实现策略

YOFO 框架主要流程如下:输入图片和文本先分别经过图片编码器和语言编码器提取特征,随后在多尺度跨模态特征挖掘模块进行融合。融合后的双模态特征在包含了记忆库的元迁移模块中进行简化,排除掉语言特征中的冗余信息,同时能保存时序信息来增强时间相关性,最后通过一个解码器得到分割结果。

图片

图 1:YOFO 框架主要流程。

多尺度跨模态特征挖掘模块:该模块通过逐级融合不同尺度的两个模态特征,能够保持图像特征所传达的尺度信息与语言特征间的一致性,更重要的是保证了语言信息不会在融合过程中被多尺度图像信息所淡化淹没。

图片

图 2:多尺度跨模态特征挖掘模块。

元迁移模块:采用了一种 learning-to-learn 策略,过程可以简单地描述为以下的映射函数。其中迁移函数图片是一个卷积,则图片是它的卷积核参数:

图片

优化的过程可以表达为以下目标函数:

图片

其中,M 代表能够储存历史信息的记忆库,W 代表不同位置的权重,能够对特征中不同的位置赋予不同的关注度,Y 代表储存在记忆库中的每个视频帧的双模态特征。该优化过程尽可能地使元迁移函数具有重构双模态特征的能力,同时也使得整个框架能够进行端到端的训练。

训练和测试:训练时所使用的损失函数是 lovasz loss,训练集为两个视频数据集 Ref-DAVIS2017、Ref-Youtube-VOS,并通过静态数据集 Ref-COCO 进行随机仿射变换模拟视频数据作为辅助训练。元迁移的过程在训练和预测时都要进行,整个网络在 1080ti 上的运行速度达到了 10FPS。

实验结果

研究采用的方法在两个主流 RVOS 数据集(Ref-DAVIS2017 和 Ref-Youtube-VOS)上均取得了优异的效果,量化指标及部分可视化效果图如下: 

图片

图 3:在两个主流数据集上的量化指标。

图片

图 4:在 VOS 数据集上的可视化效果。

图片

图 5:YOFO 的其他可视化效果展示。

研究还通过一系列的消融实验以说明特征挖掘模块(FM)以及元迁移模块(MT)的有效性。

图片

图 6:特征挖掘模块(FM)以及元迁移模块(MT)的有效性。

此外,研究分别对使用了 MT 模块和不使用 MT 模块的解码器输出特征进行了可视化,可以明显地看出 MT 模块能够正确地捕捉到语言所描述的内容且对干扰噪声进行过滤。

图片

图 7:使用 MT 模块前后的解码器输出特征对比。关于研究团队

本论文由美图影像研究院(MT Lab)和大连理工大学卢湖川团队的研究者们共同提出。美图影像研究院(MT Lab)是美图公司致力于计算机视觉、机器学习、增强现实、云计算等领域的算法研究、工程开发和产品化落地的团队,为美图现有和未来的产品提供核心算法支持,并通过前沿技术推动美图产品发展,被称为「美图技术中枢」,曾先后多次参与 CVPR、ICCV、ECCV 等计算机视觉国际顶级会议,并斩获冠亚军十余项。

以上就是基于跨模态元迁移,美图&大连理工的参考视频目标分割方法只需单阶段的详细内容,更多请关注【创想鸟】其它相关文章!

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至253000106@qq.com举报,一经查实,本站将立刻删除。

发布者:PHP中文网,转转请注明出处:https://www.chuangxiangniao.com/p/1657693.html

(0)
上一篇 2025年2月18日 20:19:57
下一篇 2025年2月18日 20:20:16

AD推荐 黄金广告位招租... 更多推荐

相关推荐

  • PHP中如何使用Laravel框架

    laravel框架是一个开源的php框架,通过许多现代化的特性和便捷的语法来提高开发效率。它采用了mvc(模型-视图-控制器)架构设计模式,可以轻松创建restful的api和web应用程序,并且具有优秀的数据库处理能力。 本文将介绍使用L…

    编程技术 2025年2月23日
    100
  • 通过辅助库(Auxiliary)做ASM迁移案例

    通过辅助库(Auxiliary)做ASM迁移案例系统环境:操作系统:RedHatEL55Oracle:Oracle10gR2通过辅助库建立ASM迁移,可以很方便将文件系统的存储异机迁移;并且可 通过辅助库(auxiliary)做asm迁移案…

    数据库 2025年2月22日
    100
  • MySQL数据复制、迁移、转换

    本文总结各种场景下的mysql数据复制、迁移、转换。1、导入、导出利用mysqldump命令将数据文件导出成一个文本文件,这在不同场景下 本文总结各种场景下的mysql数据复制、迁移、转换。 1、导入、导出 利用mysqldump命令将数据…

    数据库 2025年2月22日
    100
  • Symfony框架中间件:提供错误处理和异常管理功能

    symfony框架中间件:提供错误处理和异常管理功能 当我们在开发应用程序时,经常会遇到错误和异常的情况。为了优化用户体验和提供更好的开发者工具,Symfony框架提供了强大的错误处理和异常管理功能。在本文中,我们将介绍Symfony框架中…

    编程技术 2025年2月22日
    100
  • Symfony框架中间件的使用指南

    symfony框架中间件的使用指南 引言:中间件是一个在请求和响应之间执行操作的技术,它可以用来处理和修改HTTP请求和响应。中间件在Symfony框架中是一个非常强大和灵活的工具,可以用于许多不同的用例和场景。本文将介绍Symfony框架…

    编程技术 2025年2月22日
    100
  • 使用CakePHP框架实现数据库迁移(Migrations)的步骤

    使用cakephp框架实现数据库迁移(migrations)的步骤 引言:在开发过程中,数据库的变更是常见的需求。为了保证数据库的一致性和管理变更,使用数据库迁移是一个好的实践。CakePHP框架提供了强大的迁移工具,可以帮助我们方便地处理…

    编程技术 2025年2月22日
    100
  • 如何在CodeIgniter框架中创建数据库连接

    如何在codeigniter框架中创建数据库连接 简介:CodeIgniter是一款流行的PHP开发框架,它提供了一套简单而强大的工具,帮助开发者快速构建高效的Web应用程序。在CodeIgniter中,数据库是一个关键的组成部分,因此了解…

    编程技术 2025年2月22日
    100
  • Symfony框架中间件:实现高效的缓存处理

    symfony框架中间件:实现高效的缓存处理 引言:随着互联网应用的发展和用户量的不断增加,为了提升用户访问体验,缓存成为了几乎所有应用都必备的功能之一。Symfony框架提供了丰富而强大的中间件功能,可以帮助我们实现高效的缓存处理。本文将…

    编程技术 2025年2月22日
    100
  • 使用Symfony框架实现用户权限管理的步骤

    使用symfony框架实现用户权限管理的步骤 Symfony框架是一个功能强大的PHP开发框架,使用它可以快速开发出高质量的Web应用程序。在开发Web应用程序时,用户权限管理是一个不可忽视的重要部分。本文将介绍使用symfony框架实现用…

    编程技术 2025年2月22日
    100
  • 数据库迁移方案之DG方式迁移

    一:环境信息1)主库(单实例)主机平台:AIX6.1数据库版本:11.2.0.3(psu5)2)备库(部署了crs)主机平台:AIX6.1数据库版本:11.2.0.3(psu5)二:方案背景由 一:环境信息 1)主库(单实例) 主机平台:A…

    数据库 2025年2月22日
    100

发表回复

登录后才能评论