HarDNet-MSEG论文笔记

引用格式

[1] HUANG, Chien-Hsiang; WU, Hung-Yu; LIN, Youn-Long. Hardnet-mseg: a simple encoder-decoder polyp segmentation neural network that achieves over 0.9 mean dice and 86 fps. arXiv preprint arXiv:2101.07172, 2021.

研究的背景

  1. 小目标可能漏检,边界分割不清晰,训练成本高,推理时间长。

使用的方法(创新点)

  1. HarDNet-MSEG由一个backbone和一个解码器组成,backbone是HarDNet68,解码器是Cascaded Partial Decoder。

    architecture

  2. HarDNet是DenseNet的改进,它们的区别如下图所示。相比于DenseNet,HarDNet进行了稀疏化链接,如果2^n整除了 k,就让层 k 连接到层 k-2的n次方,其中n是非负整数,且k-2^n≥0。特别的,层0是输入层。在这种连接方案下,一旦第 2^n 层被处理,第 1 层到第 2^n–1 层就可以从内存中清除。此外,HarDNet还加权了关键层:指数被较大的2次方除以的层比指数被较小的2次方除以的层更有影响力。我们通过增加通道来放大这些关键层,这样可以平衡某层的输入和输出之间的通道比。

    HarDNet

  3. 使用RFB模块加强了从轻量级网络中学到的深层特征。不同卷积核尺寸的卷积和空洞卷积被用于产生不同感受野的特征,然后使用1$\times$1卷积来合并所有特征。

    RFB

  4. 使用密集聚合的方式代替了原本HarDNet网络中的decoder。

    Dense_Aggregation

评估方法

  • PR曲线,F-measure,MAE。

其他

  • Zhe Wu, Li Su, and Qingming Huang. Cascaded partial decoder for fast and accurate salient object detection.
  • Fisher Yu, Dequan Wang, Evan Shelhamer, and Trevor Darrell. Deep layer aggregation.
  • Liang-Chieh Chen, Yi Yang, Jiang Wang, Wei Xu, and Alan L Yuille. Attention to scale: Scale-aware semantic image segmentation
  • Jun Fu, Jing Liu, Haijie Tian, Yong Li, Yongjun Bao, Zhiwei Fang, and Hanqing Lu. Dual attention network for scene segmentation
  • Kaiming He, Xiangyu Zhang, Shaoqing Ren, and Jian Sun. Spatial pyramid pooling in deep convolutional networks for visual recognition.
  • Liang-Chieh Chen, Yukun Zhu, George Papandreou, Florian Schroffff, and Hartwig Adam. Encoder-decoder with atrous separable convolution for semantic image segmentation
  • Long Chen, Hanwang Zhang, Jun Xiao, Liqiang Nie, Jian Shao, Wei Liu,and Tat-Seng Chua. Sca-cnn: Spatial and channel-wise attention in convolutional networks for image captioning
  • Songtao Liu, Di Huang, et al. Receptive fifield block net for accurate and fast object detection.
  • ResUNet,ResUNet++,DoubleU-Net,PraNet,ABCNet。