Uncertainty Inspired RGB-D Saliency Detection

引用格式

[1] Zhang J , Fan D P , Dai Y , et al. Uncertainty Inspired RGB-D Saliency Detection[J]. IEEE Transactions on Software Engineering, 2021, PP(99).

研究的背景

  1. 以往的工作都是将RGB-D SOD作为一个点估计问题,也就是找到一个图像的像素到gt中该像素标签的映射函数。作者认为这样的方法是不适定(ill-posed)的,会无法捕捉数据标注过程中的不确定性。
  2. 对人类视觉感知的研究表明,不同人对显著性目标会有偏向(一个人眼中的前景或许是其他人眼中的背景),也就是说,显著性目标检测不应该是一个确定的过程,这跟类别感知的任务是不同的。

使用的方法(创新点)

  1. 提出了一个随机框架,通过学习数据标注过程,将不确定性应用到RGB-D SOD。

  2. 设计了一个基于编码器-解码器架构的网络作为生成模型,将输入图像和隐式变量映射成显著性预测图。

  3. 设计了一个推断模型,通过从真实或者近似后验分布中采样来逐步更新隐式变量。

  4. 推断隐式变量采用了两种方法:使用带有额外编码器的条件变化自编码器来近似隐式变量的后验分布;采用交替反向传播技术,直接从真实后验分布采样隐式变量。

评估方法

  • MAE,F-measure,S-measure,E-measure。

其他

  • 关于不适定(ill-posed):适定问题(well-posed problem)和不适定问题(ill-posed problem)都是数学领域的术语。前者需满足三个条件,若有一个不满足则称为”ill-posed problem”:
    1. 解必须存在
    2. 解必须唯一
    3. 解必须稳定(就是根据初始条件发生连续变化,不会跳变)