眼爆科技

入选MIT十大突破性技术 ,AI版“双手互搏”到底有多牛?

时间:2018-07-31 15:07  编辑:眼爆科技

日前,《麻省理工科技评论》刊文评出了2018年十大突破性技术,对抗性神经网络(GAN)赫然在列。

什么是对抗性神经网络?为什么它能入选MIT十大突破性技术?它的发展脉络如何?与我们此前耳熟能详的神经网络有什么区别?能够应用在人工智能的哪些场景?还有哪些关键问题有待攻克?

中国自动化学会混合智能专委会副主任、中国人工智能学会机器学习专委会常委、复旦大学博士生导师张军平教授在接受记者采访时做了深入浅出的解释。

张军平告诉记者,虽然GAN是科技领域的新贵,但其实在很久以前的中外小说中就能看到这个想法的影子。

GAN网络的原理本质上就是人工智能或机器学习版本。

一个网络中有两个角色,修炼的过程中左手扮演攻方,即生成器(generator),试图生成和自然世界中拟完成任务足够相似的目标;右手扮演守方,即判别器(discriminator),试图把这个假的、生成的目标和真实目标区分开来。经过反复多次双手互搏,左手右手的功力都会倍增,从而达到舍我其谁的目标。

明白这个道理,就不难明白为什么GAN网络一出,就有独孤求败的感觉了。

正是因为GAN网络的机理是双手互搏、一心两用,所以,虽然最初的应用场景是针对图像相关任务,但其机理是普适性的。只要能用这个诀窍的地方,都能把自己的功力提升一个档次。不过,需要注意的是,GAN只把双手互搏用来训练自己双手的功力。在多数实际应用中,它只用了自己千锤百炼出来的生成器,就得到了非常好的结果。

于是,自2014年GAN网络被Ian J. Goodfellow等人提出,至今其演绎出的各种版本就像攻城掠地般在各个领域蔓延。

在今年的人工智能顶级会议IJCAI、机器学习顶级会议ICML和NIPS、深度学习著名会议ICLR上,光读参会论文的标题,就能发现大量GAN网络的工作痕迹。图像处理、计算机视觉、自然语言处理、语音识别、智能驾驶、安全监控似乎GAN已经无所不能了。

张军平用几个比较火的人工智能应用场景举例——

在年龄估计中,GAN能通过攻守互搏,基于给定的人脸图像实现对其人衰老或年轻时的样貌生成。

在多视角人脸识别、跨视角步态识别领域,采用类似的机理,实现对人脸角度和步态角度的自动旋转,从而有效提高了多视角、跨视角人脸和步态识别的精度。

  • 共2页:
  • 上一页
  • 1
  • 2
  • 下一页




  • 上一篇:深圳机械展“惹怒”了机床品牌商!3.29八大欧洲机床品牌齐聚宣 下一篇:《多维解读 云南白药三七创新峰会发布<企业倡议书>共话产