论文笔记

《PraNet Parallel Reverse Attention Network for Polyp Segmentation》

  1. 设计了并行反向注意力网络(parallel reverse attention network,PraNet)。该模型的效果相比UNet家族有很大的提升,提升程度如下图所示。

    progress

  2. 总的来看,目前看到的两个效果最好的PraNet和SINet-V2都是采用了粗糙定位再加精确分割的手段来进行伪装目标检测。PraNet的模型结构如下图所示。

    PraNet

  3. 设计了并行部分解码器(parallel partial decoder,PPD),该模块会聚集高维特征,然后基于组合特征生成一个全局图作为后续组件的初始引导。

    cascaded_partial_decoder

  4. 设计了反向注意力模块(reverse attention,RA)来挖掘边界线索。作者没有聚合来自所有层次的特征,而是在三个并行的高级特征中自适应地学习反向注意力,不断地从高层输出特征中擦除前景对象的方式来逐步挖掘互补区域和细节。具体操作是将深层中输出的特征图上采样激活获得预测图,然后翻转,如第一幅图所示,再通本层特征图相乘,即可擦除目前已知的前景区域。

  5. 模型的loss是weighted Iou loss和BCE loss之和,采用了深度监督的思想,总的loss是三层的loss之和加上最终预测的loss。