Paper Reading: SalGAN: visual saliency prediction with adversarial networks

60 阅读 0 评论 40 点赞

我是靠谱客的博主迷路期待，最近开发中收集的这篇文章主要介绍Paper Reading: SalGAN: visual saliency prediction with adversarial networks，觉得挺不错的，现在分享给大家，希望可以做个参考。

Paper Reading Note

URL:
https://arxiv.org/pdf/1701.01081.pdf

TL;DR

本文是18年cviu的一篇文章，主要是用GAN作显著点检测的任务，模型很简单，可以参考其利用GAN增强的思想。
在这里插入图片描述
如上图所示，对一副图像的关键点检测，本文的检测方法效果明显优于传统的交叉熵方法。

在这里插入图片描述
模型框架如上图所示，主要由一个generator和discriminator组成。

generator部分采用了去除最后两层的vgg-16，一部分作为encoder(Conv-VGG)一部分作为decoder(Conv-Scratch)。
将生成的feature map和ground truth做pixel-wise的BCE Loss：
一般模型到这一步就结束了，本文提出了在此基础上添加一个discriminator对生成的模型和ground truth进行判别，相当于添加了discriminator传来的loss：
对于discriminator的训练还是跟基本的GAN没有区别：