Towards High-Resolution Salient Object Detection

引用格式

[1] Zeng Y , Zhang P , Lin Z , et al. Towards High-Resolution Salient Object Detection[J]. arXiv, 2019.

研究的背景

  1. 边界模糊的问题始终没有解决。
  2. 现在拍摄的照片分辨率越来越高。
  3. 高分辨率SOD有三种方法:简单地增加输入图像的大小,但是极耗内存;划分成块,一块一块地进行预测,但是极耗时间且容易被背景噪声影响;使用后处理方法比如CRF或者graph cuts.

使用的方法(创新点)

  1. 设计了第一个高分辨率显著性目标检测模型。在第一条路径中,原始输入图像下采样送入GSN,输出结果在进行上采样,送入GLFN。第二条路径中,原始图像送入APS来生成一组关注不确定区域的子图,这些子图被送入LRN,在GSN的引导下改善细节并将输出送入GLFN。第三条路径中,为了尽可能多地保留细节,直接将原图送入GLFN。

    architecture

  2. 设计了Global Semantic Network,用于提全局语义信息。GSN和LRN都使用VGG作为backbone。为了在不增加参数的前提下扩大感受野,使用空洞卷积来捕捉上下文信息(也可以使用recurrent的方法)。GSN负责容易区分的区域,LRN负责艰难的部分,GSN生成的特征图可以用来引导LRN。

    GSN_LRN

  3. 设计了Local Refinement Network,用于优化目标细节。当输入图像的尺寸很大的时候,想要定位显著目标需要进行多次或者大比例的下采样,这样会丢失太多细节,无法生成准确的边界,而使用局部子图作为输入虽然保留了细节信息,但是无法知道哪里是显著区域,因此LRN要在GSN的引导下进行以综合两者的优点。相比过去基于patch的方法使用类似滑动窗口的手段进行遍历,本模型只关注那些“艰难”的区域,因此并不耗时。

  4. Attended Patch Sampling可以强迫LRN关注不确定的区域。其通过两个阈值找到了那些不确定的像素,生成了一个注意力矩阵。然后使用如下算法生成一组patch。

    APS

  5. 设计了Global-Local Fusion Network,用于融合预测。

    GLFN

评估方法

  • PR曲线,F-measure,MAE.

其他