首页新闻辽宁新闻娱乐视频时尚读书健康农业家居家电婚庆乐活亲子E报论坛

首页
你现在的位置:

DeepMind研制阿尔法狗的使命当然不是要下赢围棋

2017-06-01 09:53:00   来源:腾讯   作者:   编辑:徐硕

  这几天我一直在围观人们的反应,最想不明白的一点,其实是人们究竟怎么开始把机器与人类放到对立的两面?

  围棋是艺术,阿尔法狗是技术,它如何就会毁了围棋呢?棋手们自己不是也说“(现在下棋)或多或少都会受到阿老师的影响吧,下棋会让人感到更自由一些,没有什么招法是完全不能下的”(周睿羊,DeepMind博客视频),“阿尔法狗带给我们很多的新东西。现在呢,大家更多地去尝试以前都没有下过的各种下法”(时越,DeepMind博客视频)棋手们的意思难道不是说,AI促使人类棋手更加强大,更乐于创新吗?

  DeepMind创始人哈萨比斯DeepMind创始人哈萨比斯而对于人工智能科学家而言,阿尔法狗的使命,更不是要在围棋赛中打败人类。他们之所以让机器与顶尖的人类棋手互动,意在为“狗”提供一个不能用其他方式替代的学习环境。DeepMind创始人哈萨比斯自己在很多公开场合就不止一次地说过,是为了发现潜藏的通用知识(general knowledge)。“狗”,其实是一个通用智能体。

  把DM的使命说得更冠冕堂皇些,何尝不是人类对自身的进一步探索?

  正如物理学家费曼教授那句留在黑板上的著名遗言,“我所不能创造的,都是我没有真正懂得的”(What I cannot create, I do not understand),如果世界在人们眼里是由外部世界和内心世界两部分组成的话,也许“内心”世界更加根本,因为外部世界的存在状态,根本还是取决于我们大脑对它的解释。这便是人工智能最引人入胜的地方:借助于建造它来更好地了解我们自己,理解这个世界。

  DeepMind所致力建造的这一类AI,有个名字,叫“受神经学启发的AI”(neuralscience-inspired AI)。别忘了哈萨比斯本人就是伦敦大学学院的认知神经学博士,DM对人类身上最感兴趣的部位叫做海马体(Hippocampus)。按维基的说法:海马体是人类及脊椎动物脑中的重要部分,位于大脑皮质下方,担当着关于短期记忆、长期记忆,以及空间定位的作用。在阿兹海默病中,海马体是首先受到损伤的区域:表现症状为记忆力衰退以及方向知觉的丧失。大脑缺氧(缺氧症)以及脑炎等也可导致海马损伤。平常我们开玩笑时爱说的“老痴”或“脑残”都跟这个海马体相关。

  我们需要记住,DM的AI有两个关键词,一是通用,一是学习。他们所有的算法都从元数据开始进行自主学习,从而掌握某项任务,这与预编程的人工智能有本质的不一样。此外,DM还强调,他们希望所有的系统能够通用,也就是说,希望同一个系统,或同一套算法可以有跨领域的广泛应用。公众所熟知的赢了国际象棋的IBM传奇深蓝,以及近年来的沃森系统,它们都仍然属于窄AI范畴,也就是说,它们是为了解决某个特定问题量身打造的AI,因而只能解决那一类问题。

  而阿尔法狗这一类DM的AI,事实上则可以被叫做“通用人工智能”AGI(Artificial General Intelligence),目标既不针对特定任务,也无涉预编程。这就引出了眼下被热议的“强化学习”技术(reinforcement learning)。

  描述强化学习其实非常简单,它有个一目了然的框架,框架内有两个内容:系统和环境。这里的“系统”就是我们说的AI,而它会发现自己处于某个“环境”当中,要达成某项目标。

  “系统”与“环境”之间进行双向交流:首先,它通过其感知仪器来对“环境”进行观察,在DM的学习过程中,通常使用的是视觉,也就是说,“系统”观察到的就是像素。这些观察结果往往有很多“噪音”,并且信息不完整,因为现实世界本身就十分混乱,充满干扰,而且永远不可能对一件事获得真正完整的信息。“系统”的任务,便是要在这样的混乱条件下,创建一个可能的、最好的统计模型;这个最好的模型一旦建立,第二项任务,便是在当前的时间点上可供选择的一系列行为中,选出最好的一个,向目标靠近。而一旦“系统”确定了某一个行为是最佳之后,“系统”随即将这个行为作为输出,并得以执行。其结果,有可能会,也有可能不会,对当前的“环境”带来任何改变。但无论如何,它都成为新一轮观察的驱动。所以这个“系统”尽管表面上看,可以通过这样一个简单的框架图形来描述,但它事实上隐藏了很多的复杂性。

  解决了隐藏其后的复杂性,其实就拥有了足够的智能来进行几乎一切学习。我们认同这个观点,因为我们知道,包括人在内的所有脊椎动物,都是这样来学习的。人类大脑中,完成这一“强化学习”过程的是多巴胺系统。

  了解了创造出阿尔法狗的DM公司的通用智能使命,以及这一通用智能的学习原理之后,不难看出,各类游戏其实都是其算法的绝佳测试平台。一两年前连线杂志 “Wired” 就有过长文报道,DM最初使用经典的80年代雅达利游戏(Atari )来测试他们的算法。当AI在玩雅达利时,它所获得的输入没有别的,就是纯粹的像素,完全就像人在看着屏幕学,屏幕尺寸大概是200*150,所以它所得到的就是每帧3万个点,目的也很简单,一切从头琢磨自学,为了拿高分。

  在基本的学习能力具备后,再通过模拟海马体的工作原理,来为智能体增加能力,例如学习抽象概念,以及增进长期记忆。

  如果说AI是在利用包括棋类在内的游戏来作为测试平台,达到提升功力的目的的话,它真正的目标可能更多地在于帮助人类完成更加关键的工作,例如与预测相关的医疗、气候、能源、宏观经济等应用。这样一来,人工智能技术可以毫无疑问地被认为是眼下最重要的技术之一,更可能正是潜在的“元解决方案”(meta-solution),可以协助人类解决所有的其它问题。

  提到“元解决方案”,不可避免的是与之相伴的伦理讨论。在科幻作品、断章取义的名人演说、鸡毛令箭的媒体报道的共同作用下,AI所获得的伦理关注尤其热闹。但是它与任何强大的新技术无异,技术本身是中立的,决定它是否符合伦理的,永远是掌握技术的人。在此过程中,公众、媒体、研究机构(企业)以及政府几方的透明,对每一步的监管都因此变得至关重要。

  阿尔法狗的创造者的使命是要将世界的信息组织起来,让它更好地为全世界共享,换句话说,就是利用 AI或者AGI 来自动将无序的信息转化为知识,从而利用这些知识使人类更加强大。因此,与世界最优秀的人工智能专家一起,挖掘出暗藏在围棋这一古老游戏后面的智慧,促成技术的进步,这应当是乌镇比武会上所有人的胜利吧。

  原标题:DeepMind的使命不是要下赢围棋

相关阅读:
北国网版权与免责声明:
1、北国网所有内容的版权均属于作者或页面内声明的版权人。未经北国网的书面许可,任何其他个人或组织均不得以任何形式将北国网的各项资源转载、复制、编辑或发布使用于其他任何场合;不得把其中任何形式的资讯散发给其他方,不可把这些信息在其他的服务器或文档中作镜像复制或保存;不得修改或再使用北国网的任何资源。若有意转载本站信息资料,必需取得北国网书面授权。否则将追究其法律责任。
2、已经本网授权使用作品的,应在授权范围内使用,并注明“来源:北国网”。违反上述声明者,本网将追究其相关法律责任。
3、凡本网注明“来源:XXX(非北国网)”的作品,均转载自其它媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责。本网转载其他媒体之稿件,意在为公众提供免费服务。如稿件版权单位或个人不想在本网发布,可与本网联系,本网视情况可立即将其撤除。
首发图片
精彩内容
最新唱片
  • Copyright © 1998 - 2016 www.lnd.com.cn All Rights Reserved.
  • 本网站各类信息未经授权禁止转载 版权所有 北国网
  • 互联网新闻信息服务许可证编号:2112006002
  • 沈网警备案20040201号
  • 北国网官方微信
  • 带你每天
  • “ 动 ”
  • 起来!