Pyramidal Feature Shrinking for Salient Object Detection

引用格式

[1] Ma M , Xia C , Li J . Pyramidal Feature Shrinking for Salient Object Detection[C]// National Conference on Artificial Intelligence. 2021.

研究的背景

  1. 各种各样的特征融合策略极大地提高了SOD的性能。但是现有的融合方式大都对高级语义信息和低级细节信息进行了大跨度的融合,这会引入噪音。
  2. 生物进化有两个特点:只有特性相似的生物才能繁衍后代(生殖隔离),自然选择会增强合适的基因,筛除不合适的基因。作者以此为灵感提出了PFSNet。

使用的方法(创新点)

  1. 提出了新的金字塔特征收缩网络(PFSNet)。模型旨在通过逐层收缩的方式将相邻特征结点成对聚合,使聚合后的特征融合有效的细节和语义,并丢弃干扰信息。模型结构图如下所示。

    architecture

  2. 设计了金字塔收缩解码器(pyramidal shrinking decoder,PSD)模块,逐层地收缩相邻特征,拒绝独立特征的融合来防止跳跃特征融合(跳跃连接式的大跨度特征融合)。其整个结构类似一个倒立的金字塔。

  3. 设计了WCAT模块作为工具模块,用于融合特征。该模块中,使用GAP操作获取通道级的注意力,经过卷积作为权值向量,与拼接好的父母特征相乘,这样就可以让孩子特征继承重要的特征,丢弃不重要的特征。

  4. 设计了相邻融合(adjacent fusion module,AFM)模块,用于融合成对的相邻特征。可以实现相邻特征之间互相的空间增强,从而动态的加权特征并自适应地融合合适的信息,抑制不合适的信息。AFM模块主要关注父母特征中共享的特征,通过像素级的相乘,可以很容易地提取出他们,用以增强父母特征。

  5. 设计了尺度感知丰富(scale-aware enrichment module,SEM)模块,是为了获取丰富的尺度信息,并利用膨胀卷积生成多样化的初始特征。

  6. 总的loss是BCEloss和IoUloss之和。

评估方法

  • MAE,F-measure,E-measure