购物车
我的足迹

张钹院士:你的工作就将被AI取代,只有满足这五个条件

加入Vip免费下载 立即下载
张钹院士:你的工作就将被AI取代,只有 满足这五个条件 我今天要讲的中心思想就是:我们现在离真正的人工 智能还有一段很长的路。为了讲清这个思想,我必须回答 下面三个问题:第一,什么叫做真正的人工智能?我们的 目标是什么?第二,为什么我们需要真正的人工智能?第 三,我们如何走向真正的人工智能?我现在回答这三个问 题。 首先我们如何评价目前人工智能取得的成果,我们的 评价很简单,针对这 5 件事: 第一是深蓝打败人类国际象棋冠军;第二是 IBM 在电 视知识竞赛中打败了美国的前两个冠军,这两件事是一个 类型,后面的三件事属于另外一个类型,即 2015 年微软 在 ImageNet 上做图象识别,它的误识率略低于人类;百 度、讯飞也都宣布在单句的中文语音识别上,它的误识率 也略低于人类;还有一个是大家非常熟悉的 AlphaGo 打败 了李世石。这 5 件事情都是机器在一定的范围内超过了人 类,我们如何来评价这 5 件事? 大家一致认为这 5 件事之所以成功,是由于前面三个 因素,一是大数据,二是计算能力提高,第三是有非常好 的人工智能算法。这三个因素大家都讨论得非常多了,没 必要我再来说,我现在要说的最后一个因素是被大家所忽 略的,这个因素是说,这所有的成果必须建立在一个合适 的应用场景下。这 5 件事虽然领域很不一样,但是它们都 满足完全一样的条件,或满足下面的 5 个限制,首先你必 须有丰富的数据或者丰富的知识,如果这两件东西没有 ,或者很少,你不用来谈人工智能,因为你无法实现无米 之炊。人工智能仅有的两个资源,一个是数据,一个是知 识。还有确定性信息、完全信息、静态的、单任务和有限 领域。这 5 个条件里面任何一个条件不满足,现在的人工 智能做起来就非常困难了。 大家想想这 5 个限制条件下的应用场景是什么样的应 用场景?就是照章办事,不需要任何灵活性,这显然不是 智能的核心。 我们现在分析一下上述 5 个场景。下象棋是完全信息 博弈,信息完全和确定,没有问题。其次,它遵循着完全 确定的游戏规则演化,我们把这种情况也叫做静态。 Watson 机器人也是这样,Watson 是什么样的对话问题呢 ?它为什么选择知识竞赛呢?我们知道知识竞赛提的问题 都没有二义性,都是明确的,它的答案总是唯一性的。所 以这样的问答对机器人来讲是非常容易的。它涉及的领域 虽然比较宽,但也是有限的,包括大家觉得很玄乎的围棋 ,也完全符合上面 5 个条件,所以对计算机来说也是很容 易的。目前计算机打麻将就不行,因为牌类是不完全信息 博弈,所以比棋类要难。总之,我们对目前人工智能取得 的成果要有一个正确的评价。 目前的人工智能技术在以下领域都可以找到它的应用 ,它们是交通、服务、教育、娱乐等等,但我要强调是这 些领域里面只有满足上述 5 个条件的事情,计算机做起来 才会容易,如果不满足这些条件,计算机就做起来就困难 了。大家常常关心什么样的工作会被机器所替代,我可以 明确告诉大家,满足这 5 个条件的工作,总有一天会被计 算机取代,就是那些照章办事,不需要任何灵活性的工作 ,比如说出纳员、收银员等等。在座的所有工作都不可能 被计算机完全代替,但不排斥你的工作中有一部分会被计 算机取代,老师、企业家等的工作不可能被计算机完全代 替。 为什么有这5个限制?原因在于我们现在的人工智能是 没有理解的人工智能。 我们先看符号模型,理性行为的模型,举 Watson 的 例子,它是个对话系统,我们现在所有做的对话系统都跟 这个差不多,但是 Watson 做得更好些,它里面有知识库 ,有推理机制。沃森除了专家知识之外,还有大量互联网 上大众的知识,还运用了多推理机制。请看,这就是 Watson 系统的体系结构。它里面有哪些知识呢?有很多 ,包括百科全书、有线新闻、文学作品等等。所有的知识 用纸质来表示有 2 亿页,用存储量表示达到了 4TB。它能 回答什么问题呢?用它的例子来说明。第一个问题,1974 年 9 月 8 日谁被总统赦免?这对美国人来讲很好回答 ,同样对计算机来讲也很好回答,你用这几个关键字「 1974 年 9 月 8 日」、「被总统赦免」,就能在文献里头 查出来是谁,他就是尼克松。也就是说根据问题中的关键 字,可以在已有的文献里头直接找到答案,这就是一般的 网络检索方法。 第二个问题,荧光粉受到电子撞击以后,它的电磁能 以什么方式释放出来?我们用「荧光粉」、「电子撞击」 、「释放电磁能」等关键词,也可以找到答案:「光或者 光子」。这种方法就是平时网络搜索的原理,应该说没有 什么智能。 回答下面的问题就需要「智能」了,跟智利陆地边界 最长的是哪个国家?跟智利有陆地边界的国家可以检索到 ,它们是阿根廷和玻利维亚,但是谁的边境长?通常查不 到。Watson 具备一定的推理能力,它从边界间发生的事件 、边界的地理位置等等,经过分析推理以后就可以找出答 案,它就是阿根廷。下一个问题也属于这种性质,跟美国 没有外交关系的国家中哪个最靠北,跟美国没有外交关系 的国家有 4 个,只要检索就行了,但是哪个国家最靠北 ,没有直接答案,但可以从其它信息中推导出来,比如各 个国家所处的纬度、气候寒冷的程度等等分析出来,答案 是北朝鲜。 智能体现在推理能力上。但是很不幸,现在的对话系 统推理能力都很差。Watson 系统好一些,但也很有限。换 句话说,我们现在的对话系统离真正的智能还很远。 我们通过索菲亚机器人就可以看出来,索菲亚的对话 是面向开放领域,你可以随便提问,问题就暴露出来了。 大家在电视上看到索菲亚侃侃而谈,问什么问题都能答得 很好,这里面有玄机,如果你的问题是预先提出来的,因 为里头有答案,因此回答得非常好,在电视上给大家演示 的都是这种情况。 如果我们临时提问题,问题就出来了。这是一个中国 记者给索菲亚提的 4 个问题,它只答对了一个。「你几岁 了」,这个问题很简单,它答不上来,它的回答是「你好 ,你看起来不错」,答非所问,因为它不理解你所问的问 题。只有第二个问题它是有准备的,里面有答案,所以答 得很好。「你的老板是谁」,这个肯定它有准备。第三个 问题,「你能回答多少问题呢」?它说「请继续」,没听 懂!。再问第四个问题,「你希望我问你什么问题呢」 ?它说「你经常在北京做户外活动吗」?这就告诉我们说 ,现代的问答系统基本上没有理解,只有少数有少量的理 解,像 Watson 这样算是比较好的。 为什么会这样?也就是说我们现在的人工智能基本方 法有缺陷,我们必须走向具有理解的 AI,这才是真正的人 工智能。我这里提出的概念跟强人工智能有什么区别?首 先我们说它在这点上是相同的,我们都试图去准确地描述 人类的智能行为,希望人工智能跟人类的智能相近,这也 是强人工智能的一个目标,但是强人工智能只是从概念上 提出来,并没有从方法上提出怎么解决。大家知道强人工 智能提出了一个最主要的概念,就是通用人工智能。怎么 个通用法?它没有回答。我们现在提出来的有理解的人工 智能是可操作的,不只是概念,这是我们跟强人工智能的 区别。 人机对话的时候,机器为什么不能理解人们提的问题 ?我们看一个例子就知道了,我们在知识库里把「特朗普 是美国总统」这个事实,用「特朗普-总统-美国」这三元 组存在计算机里面,如果你提的问题是「谁是美国总统」 ?机器马上回答出来:「特朗普」。但是你如果问其它有 关的问题,如「特朗普是一个人吗」?「特朗普是一个美 国人吗」?「美国有没有总统」?它都回答不了。它太傻 了,任何一个小学生,你只要告诉他特朗普是美国总统 ,后面这几个问题他们绝对回答得出来。机器为什么回答 不了后面的三个问题呢?就是这个系统太笨了,没有常识 ,也没有常识推理。既然特朗普是美国的总统,美国当然 有总统,但是它连这一点常识的推理能力都没有。所以要 解决这个问题,必须在系统中加上常识库、常识推理,没 有做到这一步,人机对话系统中机器不可能具有理解能力 。但是大家知道,建立常识库是一项「AI 的曼哈顿工程」 。大家想想常识库多么不好建,怎么告诉计算机,什么叫 吃饭,怎么告诉计算机,什么叫睡觉,什么叫做睡不着觉 ,什么叫做梦,这些对人工智能来说都非常难,美国在 1984 年就搞了这样一个常识库的工程,做到现在还没完全 做出来。可见,要走向真正的人工智能,有理解的人工智 能,是一条很漫长的路。 这里介绍一点我们现在做的工作,加入常识以后,对 话的性能会不会有所改善。我们的基本做法是建立一个常 识图谱,用这个图谱帮助理解提出的「问题」,同时利用 常识图谱帮助产生合适的答案。 下面就涉及到具体怎么做了,我不详细说了,我就说 结果,结果是有了常识以后,性能有了显著的改善,对话 的质量提高了。这篇文章已经发表,有兴趣可以去阅读。 另外是准符号模型,深度学习、神经网络主要用来模 拟感性行为,感性行为是一般很难采用符号模型,因为感 性(感觉)没法精确描述。比如「马」,怎么告诉计算机 什么叫做马?你说马有四条腿,什么叫做腿?你说细长的 叫做腿,什么叫细?什么叫做长?没法告诉机器,因此不 能用符号模型。目前用的办法就是我们现在说的神经网络 或者准符号模型,也就是用人类同样的办法,学习、训练 。我不告诉机器什么叫做马,只是给