该网络的主要目的是生成完全类似于原始图像的伪实时图像。
例如:假设你是一名艺术家,并且希望绘制一名士兵的照片。现在,未经他人允许,不能使用地球上任何人的面孔,因为这会给你带来法律问题。
现在,你会怎么做?
你可以绘制一个实际上不存在的人的图像。之所以能够绘制这样的面孔,是因为你每天都在与他人交互并看到很多人的面孔,因此尽管你绘制的图像是伪造的图像,但看起来会和真人十分相似。
我们都知道这些人是真实的存在的
但是你知道这个女孩是否真实存在吗?
这个女孩并不真实存在。这张图片是由GAN根据肖
像分析得出的。
GAN工作原理
GAN的工作目的与此类似。此其架构结合了两个重要的神经网络- • Generator:生成器通过迭代学习一些噪声样本来创建许多伪图像。 • Discriminator:鉴别器总是试图将生成器创建的伪图像与真实图像区分开。 简而言之,生成器和鉴别器相互竞争以发挥其最佳性能。当鉴别器将图像识别为由生成器创建的伪图像时,生成器会自行分析学习并识别出在哪里造成了错误,从而使鉴别器将其图像检测为伪造。 因此,生成器变得更加警惕,并制作出接近真实图像的更完美图像,并传递给鉴别器,并检查其是否可以识别伪造。如果鉴别器将其识别为伪造品,则生成器将增加其学习效果,并再次尝试提高其图像的独创性。 该过程作为一个循环继续进行。最后,能够得到经过精心设计的图像,这些图像实际上是假的,但看起来像原始图像。
一个比喻
这种情况就像是一个盗贼,他生产假币,然后去商店使用这些假币购买东西。 小偷第一次制造假币时,他忘记加了政府的标志。当他去商店时,店主发现他的货币是假的,并拒绝了。 下次,小偷非常警惕,并用徽标和所有其他重要的识别标记更新了货币,然后去了商店。这次,店主注意到所有的东西都是完美的,但是纸张更加透明。因此,他变得有点怀疑,并拒绝了货币。 小偷第三次制造出与原始货币完全一样的假币,然后去了商店。这次,店主无法将其识别为假货接受了。 因此,小偷能够欺骗店主。在这里,小偷就是生成器,店主相当于是鉴别器。
GAN的标准简单体系结构图
GAN的工作过程
步骤1:定义问题 步骤2:选择GAN的架构 步骤2:用真实图像训练鉴别器,以便它可以学习真实图像的所有特征。 步骤4:使用生成器生成伪造图像。 步骤5:使用生成器创建的伪造图像训练鉴别器。以知道它是否能够分别识别伪造的图像。 步骤6:如果辨别器识别出伪造的图像,然后将所有这些图像再次传递给生成器,以使其能够增强图像的独创性,以便在图像下次到达辨别器时,使辨别器无法检测到其伪造。
GAN的缺点
• 生成器和鉴别器之间的平衡 如果鉴别器的功能不如生成器,那么它将无法区分真实图像和更高级的伪图像。 如果鉴别器比生成器先进,那么我们需要很多时间来生成伪图像,有时它会影响算法的性能。 • 空间不变性问题 生成器通常无法识别空间不变性。 例如: 它可能能够生成单个对象的图像,例如树,老虎,房屋等,但是当考虑到100头老虎站在一组树前的图像时,它看起来可能非常复杂,并且生成器会发现很难保持其原创性。 • 不合逻辑的图像 有时,当训练成千上万张图像时,GAN可能会以错误的方式理解这些观点。 例如:假设你使用从动物园拍摄的一些图像训练了GAN。生成器可以创建图像,例如老虎站在河中,鳄鱼站在树枝中,狮子吃草等。这些是逻辑上的谬误,实际上是不可能的。
GAN在现实世界中的用途
目前有许多使用GANS的高级应用正在研究中,例如:
- 通过视频预测未来的发展
- GAN可以从看板球比赛中投球手的保龄球动作来预测击球手将得分多少。
- GAN可以通过仅查看跑道上的运动来预测飞机起飞后是否安全。
- 文字到图像的生成: GAN可以理解文本并据此生成图像。 例如:假设你输入的文本是“一些孩子在花园里玩球”。 复杂的GAN可以创建描述这种情况的图像。
- 增加图像的分辨率 它可以从低质量到高分辨率提高图像质量。
- 交互式图像生成 它可以根据简单图像制作交互式图像。 例如:如果3岁的孩子绘制恐龙的图像。显然不是很好。训练有素的GAN可以识别出该不良图像中的物体,并可以生成该恐龙的高级高质量图像。