GAN介绍

187 阅读 0 评论 124 点赞

我是靠谱客的博主虚拟蜜粉，这篇文章主要介绍GAN介绍，现在分享给大家，希望可以做个参考。

GAN(Generative Adversarial Network)

GAN中存在两个网络，分别是生成器G（Generator）和判别器D（Discriminator）。
找到一个Generator，使得判别器D不能分开真实的和生成的数据。

生成器网络在训练过程中，生成网络尽量生成真实的图片去欺骗判别器D。判别器D尽量把生成器G生成的图片和真实的图片区分开。G和D构成一个动态的博弈过程。

找到一个判别器D使得loss最大，同时找到一个生成器G减小这个loss函数。
gan原理
梯度上升（Gradient ascent）用在判别器D中，找最大。
max_d
梯度下降（Gradient descent）用在生成器G中，找到最小。
min_g
判别器D的输出是0，说明判别器能够正确分类，跟真实图片差得远，此时是bad examples。判别器D的输出接近于1，说明以假乱真，说明是good examples。

在这里插入图片描述
但是由于在bad examples上，原有生成器G的loss函数，梯度太小，会存在梯度消失的问题。所以可以替换成下面的形式：
ps://img-blog.csdnimg.cn/20190520161119971.png)
max_g

Deep Convolutional GAN(DCGNN)

DCGNN原理和GAN原理是一样的，就是把G和D换成了卷积神经网络。从左到右的过程叫做转置卷积(transposed convolutional layer)。

将所有的pooling层替换成stride卷积
判别网络D和生成网络G中使用batch normalization
去掉全连接FC层，使网络变为全卷积网络
G网络中使用ReLU作为激活函数，最后一层使用tanh。因为最后一层图像像素值是有界的(0-255)
D网络中使用LeakyReLU作为激活函数

GAN的理论

泛化性：用比较少的数据，能学习出对新样本的适应能力。
均衡性：不均衡。生成器G和判别器D两个模型就不匹配。

Wasserstein GAN(WGAN)

wasserstein 距离用来表示两个分布的相似程度。又叫做Earth Mover’s Distance，推土机距离。它衡量了把数据从一个分布移动到另一个分布所需要的最小平均距离。

两个分布的距离不一样。标准GAN的loss函数可以被替换掉，因为原有的loss存在梯度消失的问题。可以认为所有的深度神经网络都是函数族，使用网络D，参数化Lipchitz函数条件。梯度的范围在（-1，1）之间。实际中，使用权重clip的技巧，使得满足。
dual form wasserstein
wasserstein gan