EGNet论文笔记
EGNet论文笔记引用格式[1] Zhao J , JJ Liu, Fan D P , et al. EGNet: Edge Guidance Network for Salient Object Detection[C]// 2019 IEEE/CVF International Conference on Computer Vision (ICCV). IEEE, 2020.
研究的背景
人工选取特征有时可以定位最突出的物体,但当前景和背景之间的对比度不充分时,分割方法是不可取和不可靠的,因而产生了不规则形状的显著图。
目前性能较好的解决目标静态检测问题的网络大多是以FCN(全卷积神经网络)为基础的,但是这些方法目前在显著性目标与其边缘的区分方面仍存在问题(例如目标边缘粗糙)。例如有些方法忽略了边缘信息和显著性目标信息的相关性;还有一些方法使用超像素的预处理或条件随机场的后处理解决边缘信息问题但是推理速度很慢。
研究的灵感
基于FCN方法的显著性检测任务(分割也有是类似的)由于是像素级的判别,缺少结构信息,导致显著性目标检测的边界不够精确。这种 ...
PoolNet论文笔记
PoolNet论文笔记引用格式[1] Liu J J , Hou Q , Cheng M M , et al. A Simple Pooling-Based Design for Real-Time Salient Object Detection[C]// IEEE. IEEE, 2019.
研究的背景
CNN在多尺度空间提取高维语义信息和低维细节特征的能力极大地促进了SOD的发展。
CNN有类似金字塔的结构特征,较浅的层有更大的空间尺寸,并且可以保留丰富的细节的低层信息,较深的层则包含更多的高维语义信息,并且在定位显著性目标的时候效果更好。
U型结构由于其可以在分类网络中创建自顶向下的通道,并借此构建出丰富的特征图(捕捉到的语义信息多),而最受人关注。
研究的灵感
U型结构中高维度的语义信息被逐步传输到浅层,因此,被深层捕捉的位置信息会在过程中被逐步稀释。(U型网络中bottom-up阶段产生高级语义信息,再通过top-down阶段上采样,并与bottom-up阶段横向连接,虽然会将粗糙信息和细致信息连接起来,但同样会导致高级语义信息中的位置信息逐渐被稀释 ...
PiCANet论文笔记
PiCANet论文笔记引用格式[1] Liu N , Han J , Yang M H . PiCANet: Learning Pixel-wise Contextual Attention for Saliency Detection[J]. 2017.
研究的背景
上下文信息对显著性目标检测很重要,但是对于一个上下文区域来说,不是所有上下文信息都是对我们的任务有意义的;因此希望可以学会有选择地关注每个像素的上下文位置。
SOD的最终目标是建模人类的视觉注意力机制,并借此检测最突出的区域或目标。
基于FCN的SOD模型中,有两种手段。第一种是从每个输入图像的区域提取上下文特征,第二种是从每个图像位置对应的感受野提取特征。但是这两种手段都会将每个上下文位置的信息整合起来,整体进行利用。
研究的灵感
许多工作将上下文区域的所有位置的视觉信息聚合成一个上下文特征来进行推断对比,但是其中不是所有信息都是有益的,一些相关区域的信息是有用的,其他的一些噪声不应该被提取。
使用的方法(创新点)
PiCANet为每个像素生成一个注意力图,其中每个注意力权重对应于每个上下文位置同该像素的相关 ...
UCF论文笔记
UCF论文笔记引用格式[1] Zhang P , Dong W , Lu H , et al. Learning Uncertain Convolutional Features for Accurate Saliency Detection[C]// 2017 IEEE International Conference on Computer Vision (ICCV). IEEE, 2017.
研究的背景
显著性目标检测是计算机视觉的预处理程序,尽管有了一些进步,但是在现实场景中有许多复杂因素,因此还面临着许多困难。因此作者旨在提高模型的鲁棒性。
最初依靠的是手动制作的视觉特征和启发式的先验知识,后来使用的是基于深度学习的方法。但是DL方法缺乏可解释性,有许多不确定特征,如果不确定特征可以提供诸如显著物体的边界等信息,就可以极大地提升模型的表现。
奇怪的伪影(例如棋盘效应)对深度卷积网络可能是致命的,比如出现在FCN的输出层,训练就会失败,预测会完全错误。
dropout被证明可以提高全连接层的泛化能力,但是缺少对其它类型的层的影响的研究。
研究的灵感
棋盘效 ...
DSS论文笔记
DSS论文笔记引用格式[1] Hou Q , Cheng M M , Hu X , et al. Deeply Supervised Salient Object Detection with Short Connections[C]// 2017 IEEE Conference on Computer Vision and Pattern Recognition (CVPR). IEEE, 2017.
研究的背景
近年的模型都是基于FCNs的,但是都没有特地处理尺度空间的问题。
可以精确处理尺度空间问题的整体嵌套边缘检测器(HED)为边缘检测任务提出了一个具有深度监督的跳层结构,相比通用FCNs实现了较大的提升,但 HED 在显著性检测方面性能提升不明显。
研究的灵感
深层的输出对高级语义特征进行编码,因此能够更好地定位显著物体所在的地方。
较浅层的输出可以捕获丰富的空间信息,保存更多的细节信息。
因此想法与FCNs中的跳跃连接结构相同,都是通过合理地结合多层次,多尺度的特征(既包括深层也包括浅层,既包括大尺寸也包括小尺寸),来更好地改进显著性图。于是就在HED ...
DHSNet论文笔记
DHSNet论文笔记引用格式[1]Liu N, Han J. Dhsnet: Deep hierarchical saliency network for salient object detection[C]//Proceedings of the IEEE conference on computer vision and pattern recognition. 2016: 678-686.
研究的背景
传统SOD模型的缺点是要手动提取特征,来制定对比和各种先验知识,再人工把他们组合,效果好坏全靠人的经验。
传统方法靠显著性线索(文中列举了两类)。以对比为例子,目标是评估每个图片区域或图像像素相对于全局或局部上下文的独特性。其中局部对比法常关注物体边界而忽略了物体内部,全局对比法可以得到物体均匀地内部。但是全局对比法难以保全物体细节,且难以检测大目标和具有复杂纹理的目标,尤其是前景与背景很相似或背景很凌乱的时候。此外,全局对比方法最大的缺点是:通常靠手工提取的特征和人类设计的机制去构造对比,效果的好坏全部取决于人类有限的视觉注意力方面的知识。因此在不同场景表现 ...
FCN论文笔记
FCN论文笔记引用格式[1]Evan Shelhamer,Jonathan Long,Trevor Darrell.Fully Convolutional Networks for Semantic Segmentation[J].IEEE Transactions on Pattern Analysis and Machine Intelligence,2017,39(4):640-651
概述
成就:证明了端到端,像素到像素的训练方式下的卷积神经网络超过了现有语义分割方向最先进的技术
思想:使用全卷积网络,输入任意尺寸图像,输出一样尺寸的图像
方法:将当前分类网络改成全卷积网络,然后进行微调,用跳跃连接结构将全局信息和局部信息结合,互补。
结果:FCN超过了state-of-the-arts
研究的背景
全连接网络固定了输入的尺寸和维度,丢失了二维图片大量的空间信息。
全连接网络的无法输出图像。
全连接网络的参数太多,太耗时间和运算。
以往的方法效率低,而且需要前期或者后期处理。
全局信息解决了”是什么”,局部信息解决了“在哪里”,但是以往的方法语义和位置信息不可兼得。
研究的 ...
Hexo-Theme-LiveMyLife
移植 Hux Blog 的主题,感谢 Huxpro 设计了如此完美的主题。
由 Vincent 创建的 LiveMyLife 的主题修改来源 YenYuHsuan,参考主题 dusign、Utone,感谢 dusign、Utone。
仓库Github 仓库地址:https://github.com/V-Vincen/hexo-theme-livemylifeGitee 仓库地址:https://gitee.com/V_Vincen/hexo-theme-livemylife
预览 LiveMyLife 博客 ➾
快速开始为了方便起见,我发布了整个项目,因此您可以按照下面的说明进行操作,然后就可以轻松自定义您自己的博客!
让我们开始!!!
安装 Node.js 和 Git123#For Macbrew install nodebrew install git
Windows:下载 & 安装 Node.js。-> Node.js
Windows:下载 & 安装 Git。-> Git
安装 Hexo1$ npm install -g hexo-cli
什 ...