论文阅读:SRCNN for SISR

SRCNN: Image Super-Resolution Using Deep Convolutional Networks. ECCV 2014

1 文章摘要

SRCNN是首个使用CNN结构(即基于深度学习)的端到端的图像超分辨率算法。

SRCNN的结构较简单,整个卷积网络包括三个卷积层,甚至没有池化和全连接层。

  • 损失函数:均方误差MSE
  • 激活函数:ReLU
  • 优化器:SGD

2 网络结构

3 一些结论

  • 卷积核数量越多,即特征向量维数越高,实验效果越好,但是会影响算法速度。

  • 卷积核大小越大,实验效果也会略微更好,同样会影响算法速度。

  • 并非网络越深,效果越好,结果恰恰相反。作者也给出了解释:因为SRCNN没有池化层和全连接层,导致网络对初始参数和学习率非常敏感,结果即网络训练的时候非常难以收敛,即使收敛了也可能停在了坏的局部最小值(bad local minimum)处,并且即使训练了足够的时间,学习到的filter参数的分散度也不够好。
  • 高PSNR并不意味着重建结果好。因为SR是病态问题,这就意味着可能解有无穷多个。

  • 以MSE(等价于PSNR)为loss函数得到的解往往是这些可能解的平均,而不是最优解。

  • 这就导致以MSE为loss的SR算法得到的结果有些区域看起来过于模糊,缺乏应有的细节。这也是为什么出现了数值评估低,但肉眼看着效果更好的现象。

  • RGB通道联合训练效果最好;YCbCr通道下,Cb、Cr通道对性能提升基本无帮助,只基于Y通道的训练效果更好。
  • SRCNN提出轻量的端到端网络SRCNN来解决超分问题,的确在当时取得了比传统方法性能更强、速度更快的效果,另外作者将基于SC(稀疏编码)的超分方法理解为卷积神经网络的一种形式,都是非常值得阅读的亮点。