无需调控而胜任不同任务 这种AI更接近人类思考方式

AI人工智能 2019-12-03 16:30127未知admin

  纽约大学心理学与认知科学教授马库斯最近和人工智能企业“深层思维”(DeepMind)杠上了。继前不久在推特(Twitter)上质疑美国通用人工智能研究组织OpenAI的解魔方机械手之后,近日他又对“深层思维”新推出的《星际争霸2》智能体“阿尔法星”(AlphaStar)进化版提出六大质疑。此次,他的质疑点并不是游戏表现本身,而是指向了更高的层面:未来通用智能研究的意义。

  近年最酷成果都来自深度强化学习

  此次OpenAI推出的解魔方机器手,并不是像以往一样使用专业算法来解决某一个特定任务(如果换一个任务,还需要重新编程),而是通过某种学习方法,对机器人进行训练,让机械手具备类人手的解决问题的能力。但马库斯却认为这个成果描述有误导,更恰当的描述应该是“用强化学习操纵魔方”或者是“用灵巧的机器人手操纵物体的进展”。

  “马库斯过于强调‘用强化学习操纵魔方’有点挑剔字眼,其实OpenAI魔方机器手和‘深层思维’发布的《星际争霸2》智能体‘阿尔法星’进化版都使用了深度强化学习技术。深度强化学习是目前公认的在现有技术中最有可能实现通用人工智能的技术。”天津大学智能与计算学部软件学院副教授郝建业解释说,目前机器学习有三大分支,监督学习、非监督学习和强化学习,深度学习属于监督学习里目前最主流的一类技术。深度强化学习是深度学习与强化学习的融合,是将深度神经网络整合到强化学习框架当中。

  “近几年,深度强化学习发展迅猛,它在处理复杂、多方面和决策问题方面显示出巨大的潜力。目前深度强化学习技术主要应用在一些游戏、比赛中。”郝建业介绍,2016年,谷歌的“阿尔法围棋”(AlphaGo)击败了世界顶级围棋选手李世石、柯洁,轰动一时,成为人工智能领域的一个里程碑。“阿尔法围棋”的核心就在于使用了深度强化学习算法,使得计算机能够通过自对弈的方式不断提升棋力。此后又有脸书(Facebook)在DOTA2游戏中打败了顶级职业选手;CMU团队研发的德州扑克AI冷扑大师轻松击败顶级玩家。

  此外,“深层思维”还运用深度强化学习优化了数据中心的耗能;谷歌则利用深度强化学习完成深度神经网络的自动架构搜索,提出了AutoML服务,借此将机器学习作为一种服务推广到千家万户。在我国,对于深度强化学习技术的应用也不少,阿里、腾讯、百度等国内团队将深度强化学习应用到搜索、推荐、营销、派单和路径规划等实际问题的决策中。

  最有可能实现通用人工智能的技术

眼爆科技 Copyright © 2002-2017 深圳眼爆智能科技有限公司 版权所有 备案号:* 本站资源来自互联网,我们转载的目的是用于学习交流与讨论,如果您认为我们的转载侵犯了您的权益,请与我们联系(Email:gm@ybbtb.com),我们将在3个工作日内删除相关内容。

邮箱地址:gm@ybbtb.com