Uncertainty Inspired RGB-D Saliency Detection
Uncertainty Inspired RGB-D Saliency Detection引用格式[1] Zhang J , Fan D P , Dai Y , et al. Uncertainty Inspired RGB-D Saliency Detection[J]. IEEE Transactions on Software Engineering, 2021, PP(99).
研究的背景
以往的工作都是将RGB-D SOD作为一个点估计问题,也就是找到一个图像的像素到gt中该像素标签的映射函数。作者认为这样的方法是不适定(ill-posed)的,会无法捕捉数据标注过程中的不确定性。
对人类视觉感知的研究表明,不同人对显著性目标会有偏向(一个人眼中的前景或许是其他人眼中的背景),也就是说,显著性目标检测不应该是一个确定的过程,这跟类别感知的任务是不同的。
使用的方法(创新点)
提出了一个随机框架,通过学习数据标注过程,将不确定性应用到RGB-D SOD。
设计了一个基于编码器-解码器架构的网络作为生成模型,将输入图像和隐式变量映射成显著性预测图。
设计了一个推断模型, ...
UC-Net Uncertainty Inspired RGB-D Saliency Detection via Conditional Variational Autoencoders
UC-Net Uncertainty Inspired RGB-D Saliency Detection via Conditional Variational Autoencoders引用格式[1] Zhang J , Fan D P , Dai Y , et al. UC-Net: Uncertainty Inspired RGB-D Saliency Detection via Conditional Variational Autoencoders[C]// 2020.
研究的背景
现存的模型将SOD视作一种点估计任务,使用一条确定的学习流程,得到显著性图。
使用的方法(创新点)
提出了第一个使用不确定性来进行RGB-D显著性检测的框架——UCNet。这是一个概率RGB-D显著性检测网络,它通过条件变分自编码器(CVAE)来建模人类标注的不确定性,并通过在隐式空间采样来为每一张输入图像生成多张显著性图(使用迭代隐藏策略,逐步隐藏显著性前景,借此来产生多种显著性预测,最后建模人类标注的多样性和不确定性)。最后,借助显著性一致处理,可以基于这些显著性图来生 ...
Uncertainty-Aware Joint Salient Object and Camouflaged Object Detection
Uncertainty-Aware Joint Salient Object and Camouflaged Object Detection引用格式[1] Li A , Zhang J , Lv Y , et al. Uncertainty-aware Joint Salient Object and Camouflaged Object Detection[C]// 2021 IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR). IEEE, 2021.
研究的背景
SOD——找出一张图像中最显著的目标,COD——找出一张图像中通过伪装隐藏在环境中的目标,两种任务的目标正好是相反的。然而冰天雪地中的北极熊既可以被分为显著目标也可以被分为伪装目标,因此,这两个任务也是部分正相关的,这就符合了多任务学习的基本假设——不同任务之间存在共享的信息。
作者试图使用对立的信息来同时加强SOD和COD。
SOD的不确定性来自于:一个目标在某人眼中是显著的,在另一人眼中是非 ...
Pyramidal Feature Shrinking for Salient Object Detection
Pyramidal Feature Shrinking for Salient Object Detection引用格式[1] Ma M , Xia C , Li J . Pyramidal Feature Shrinking for Salient Object Detection[C]// National Conference on Artificial Intelligence. 2021.
研究的背景
各种各样的特征融合策略极大地提高了SOD的性能。但是现有的融合方式大都对高级语义信息和低级细节信息进行了大跨度的融合,这会引入噪音。
生物进化有两个特点:只有特性相似的生物才能繁衍后代(生殖隔离),自然选择会增强合适的基因,筛除不合适的基因。作者以此为灵感提出了PFSNet。
使用的方法(创新点)
提出了新的金字塔特征收缩网络(PFSNet)。模型旨在通过逐层收缩的方式将相邻特征结点成对聚合,使聚合后的特征融合有效的细节和语义,并丢弃干扰信息。模型结构图如下所示。
设计了金字塔收缩解码器(pyramidal shrinking decoder,PS ...
Residual Learning for Salient Object Detection
Residual Learning for Salient Object Detection引用格式[1] Feng M , Lu H , Yu Y . Residual Learning for Salient Object Detection[J]. IEEE Transactions on Image Processing, 2020, 29:4696-4708.
研究的背景
很难直接学到富有判别力的特征和卷积核。
尺度变换会引入错误或者冗余的值。
使用的方法(创新点)
提出新的模型——$R^2Net$。不直接预测显著性图,而是预测显著性图和gt之间的残差。模型有三个部分组成:R-VGG模块,DCPP模块,以及Residual模块。其中R-VGG模块没有什么创新,就是简单的编码器。
膨胀卷积金字塔池化(Dilated Convolutional Pyramid Pooling ,DCPP)。用于生成粗糙预测。考虑到R-VGG提取出的最高层特征图是28的分辨率,为了获取全局信息,在kernel_size=3的时候最大膨胀率应当为13——3+(3-1)*(1 ...
camouflaged object detection
camouflaged object detection引用格式[1] FAN, Deng-Ping, et al. Camouflaged object detection. In: Proceedings of the IEEE/CVF conference on computer vision and pattern recognition. 2020. p. 2777-2787.
研究的背景
伪装目标检测(Camouflaged Object Detection),与显著目标检测(SOD)一样,虽名为检测,但实际是做了分割的工作。COD的作者范登平在SOD领域也做了许多工作。COD的目标是检测出那些无缝地嵌入他们周围环境里的物体。
使用的方法(创新点)
首先提出了新的COD数据集——COD10K,有10000张图片,分为78个类别。每张图像都标注了类别,边界框,目标/实例级别,还有抠图级的标签(应该是指像素级的mask)以及挑战属性。
提出了新的网络——Search Identification Network(SINet)。其结构如下图所示。模型分为两 ...
SAMNet Stereoscopically Attentive Multi-scale Network for Lightweight Salient Object Detection
SAMNet Stereoscopically Attentive Multi-scale Network for Lightweight Salient Object Detection引用格式[1] Liu Y , Zhang X Y , Bian J W , et al. SAMNet: Stereoscopically Attentive Multi-Scale Network for Lightweight Salient Object Detection[J]. IEEE Transactions on Image Processing, 2021, PP(99):1-1.
研究的背景
SOD模型的效果在提升,但是模型越来越大,不易于部署在移动设备上面。
SOD同时需要高维语义信息和低维细节信息,因此直接使用类似MobileNet和ShuffleNet的轻量级网络作为backbone是不合适的。
轻量级SOD模型的关键在于如何在有限的参数下高效地学习多级别、多尺度的的特征,而不是去融合backbone的不同侧链,亦或通过不同尺寸的膨胀卷积来汇总不同尺度的卷积特征。
使 ...
SaliencyGAN Deep Learning Semi-supervised Salient Object Detection in the Fog of IoT
SaliencyGAN Deep Learning Semi-supervised Salient Object Detection in the Fog of IoT引用格式[1] Wang C , Dong S , Zhao X , et al. SaliencyGAN: Deep Learning Semisupervised Salient Object Detection in the Fog of IoT[J]. IEEE Transactions on Industrial Informatics, 2020, 16(4):2667-2676.
研究的背景
IoT中的边缘设备并不是都拥有足够的算力,导致只能在云端进行推理,然后进行传输,时间代价和传输代价都很大。
现有的SOD大多数都是全监督的,需要手动进行像素级的标注,虽然也有一些半监督和弱监督的方法,但是性能表现无法和全监督方法比较,而且需要大量的图像级的标注。
使用的方法(创新点)
提出了半监督对抗学习的方法,只要标签数据量达到全监督学习的30%,便可以获得同样的性能表现,而且对于模式崩溃更为鲁棒。这是SOD领 ...
SalGAN Visual Saliency Prediction with Generative Adversarial Networks
SalGAN Visual Saliency Prediction with Generative Adversarial Networks引用格式[1] Pan J , Canton C , Mcguinness K , et al. SalGAN: Visual Saliency Prediction with Generative Adversarial Networks[J]. 2017.
研究的背景
这个模型是第一篇提出使用基于对抗性方法来进行显著性预测的模型
使用的方法(创新点)
生成器的编码器部分和VGG一样,只是去掉了最后的池化和全连接层。
生成器的解码器部分是倒序的VGG,并使用上采样层代替了池化层。使用ReLU函数作为全部卷积层的激活函数,只有最后的卷积层使用sigmoid进行激活。
判别器部分的卷积层使用ReLU作为激活,全连接层使用tanh作为激活,最后一层使用sigmoid作为激活。
总的生成器loss分为内容loss——BCEloss以及对抗loss——也是BCEloss。总的判别器loss分为判真loss——BCEloss和判假loss——B ...
Salient Object in Clutter
Salient Object in Clutter引用格式[1] Fan D P , Zhang J , Xu G , et al. Salient Objects in Clutter[J]. 2021.
研究的背景
过去的SOD数据集存在一个严重的问题:不切实际地假设每一张图片中都需要包含至少一个清晰且不杂乱的显著性目标,这种设计偏差使得SOTA的模型在现有数据集上测试的时候达到了性能的饱和区——而应用在现实场景中的时候,它们还远不能令人满意。
作者认为提高数据集质量获得的模型的性能提升比设计精巧复杂的解码器获得的模型的性能提升更多,因此作者研究了许多数据集增强策略。
显著性检测任务分类。
2015年来的DL-SOD模型总结。
使用的方法(创新点)
首先贡献了一个全新的高质量数据集——SOC。该数据集有如下特点:首先,包含有显著性目标和无显著性目标两种图片,且显著性目标分为许多常见的种类。其次,除了目标的类别标注和实例级的gt之外,每张包含显著性目标的图片还标注了图片中包含的富有挑战性的属性(AC-外观改变,BO-大目标,CL-杂乱、前景背景相似,HO-目标的 ...