HarDNet-MSEG论文笔记
HarDNet-MSEG论文笔记
引用格式
[1] HUANG, Chien-Hsiang; WU, Hung-Yu; LIN, Youn-Long. Hardnet-mseg: a simple encoder-decoder polyp segmentation neural network that achieves over 0.9 mean dice and 86 fps. arXiv preprint arXiv:2101.07172, 2021.
研究的背景
- 小目标可能漏检,边界分割不清晰,训练成本高,推理时间长。
使用的方法(创新点)
HarDNet-MSEG由一个backbone和一个解码器组成,backbone是HarDNet68,解码器是Cascaded Partial Decoder。
HarDNet是DenseNet的改进,它们的区别如下图所示。相比于DenseNet,HarDNet进行了稀疏化链接,如果2^n整除了 k,就让层 k 连接到层 k-2的n次方,其中n是非负整数,且k-2^n≥0。特别的,层0是输入层。在这种连接方案下,一旦第 2^n 层被处理,第 1 层到第 2^n–1 层就可以从内存中清除。此外,HarDNet还加权了关键层:指数被较大的2次方除以的层比指数被较小的2次方除以的层更有影响力。我们通过增加通道来放大这些关键层,这样可以平衡某层的输入和输出之间的通道比。
使用RFB模块加强了从轻量级网络中学到的深层特征。不同卷积核尺寸的卷积和空洞卷积被用于产生不同感受野的特征,然后使用1$\times$1卷积来合并所有特征。
使用密集聚合的方式代替了原本HarDNet网络中的decoder。
评估方法
- PR曲线,F-measure,MAE。
其他
- Zhe Wu, Li Su, and Qingming Huang. Cascaded partial decoder for fast and accurate salient object detection.
- Fisher Yu, Dequan Wang, Evan Shelhamer, and Trevor Darrell. Deep layer aggregation.
- Liang-Chieh Chen, Yi Yang, Jiang Wang, Wei Xu, and Alan L Yuille. Attention to scale: Scale-aware semantic image segmentation
- Jun Fu, Jing Liu, Haijie Tian, Yong Li, Yongjun Bao, Zhiwei Fang, and Hanqing Lu. Dual attention network for scene segmentation
- Kaiming He, Xiangyu Zhang, Shaoqing Ren, and Jian Sun. Spatial pyramid pooling in deep convolutional networks for visual recognition.
- Liang-Chieh Chen, Yukun Zhu, George Papandreou, Florian Schroffff, and Hartwig Adam. Encoder-decoder with atrous separable convolution for semantic image segmentation
- Long Chen, Hanwang Zhang, Jun Xiao, Liqiang Nie, Jian Shao, Wei Liu,and Tat-Seng Chua. Sca-cnn: Spatial and channel-wise attention in convolutional networks for image captioning
- Songtao Liu, Di Huang, et al. Receptive fifield block net for accurate and fast object detection.
- ResUNet,ResUNet++,DoubleU-Net,PraNet,ABCNet。
本博客所有文章除特别声明外,均采用 CC BY-NC-SA 4.0 许可协议。转载请注明来自 DreamTomb!