首页 > 资讯 > 热线聚焦 > 正文

谢耘:永不能实行人工智能 但计算速度可越来越快

2014年07月05日    来源:     
1043

  7月4日,由中关村(000931,股吧)科技园区管理委员会、中国科学院国家科学图书馆主办,北京长风信息技术产业联盟、神州数码“发现城市”创新论坛承办,中关村社会组织联合会协办中关村创业论坛第108期在国家科学图书馆举办,结合“大数据时代,中美IT产业是否将‘分道扬镳’”等话题,知名大数据专家涂子沛、神州数码首席科学家谢耘分别发表了精彩演讲,并展开对话。谢耘表示,探讨数据与主体的关系将成为未来IT应用发展的一个最为重要的课题。

  以下为谢耘发言主要内容:

  今年年初我参加了一个年轻朋友的读书会,咱们中组部的一个朋友就问了我一个问题,“谢老师,现在都大数据时代了,你能不能帮我们设计一个系统,我把一个局长的材料等等的信息全放在系统里,然后你就能告诉我这个人能不能当副部长,以后能不能当部长?”大数据确实引发了我们对智能的这种无限的遐想。当时我给他的回答,如果一件事情没有人知道该怎么做的话,其实计算机也不会替你做。大家听懂这句话了吗?在座的朋友可能很奇怪,计算机做的很多事我就不知道该怎么做啊,不是还替我做了嘛。但是一定有某个人知道这件事该怎么做,计算机才会来做。

  为什么讲这个题目?也就是因为大数据引发了很多对智能的议论,所以我今天就想围绕这个话题讲一下,看看能不能讲清楚。这也是我个人的观点,不一定对,供大家参考。

  其实人类创造的工具分成两大类,一类是辅助体能的工具,计算机其实是作为一个计算的工具辅助人的智能活动。能不能以后代替智能活动,这是很多人梦寐以求的活动,下面我会做一些分析。

  因为计算机是辅助智能的一种工具,而且计算本身其实是人的智能活动的一部分。上个世纪四十年代计算机诞生之后,整个的产业很快把兴趣从制造能计算的机器,而转向了制造有智能的机器。这件事情的一个标志性的时间,就是在1956年的时候一群来自于神经学、逻辑学、数学计算机等等的牛人,在美国开了两轮会提出了人工智能的概念。当时人类对造智能的机器还是非常乐观的,这是两个典型的牛人。一个是已经不在世了,叫做hebert,他获得过诺贝尔将来学将,1965年讲20年内机器能完成人能做的一切工作。另外一个牛人还在世,叫做Minsky,1970年时讲在三到八年的时间里将得到一台具有人类平均智能的机器,他们在说什么?大家知道前一段美国一台机器在答问题的时候还赢了,还有一台机器通过了图灵测试,他们说的是不是这样的机器?不是,当年讨论人工智能的时候讲的不是我们现在看到的事情。

  当机器能完成人能做的一切工作的时候意味着什么?意味着当年科学家想造一台机器,这台机器就和人一样在开始的时候内置了一些机制,但是是很蒙昧状态,什么也不知道。让这台机器和外界的交互能够学习,能够拥有智慧,能够获得知识,这是当年讨论智能时候最原始的想法。当年认为这种机器花一二十年能造出来,结果是什么?在九十年代的时候这个努力遭到了重大的挫折。底下那台是日本造的第五代计算机,1981年开始的,当时引起了全世界的轰动。这台计算机当时日本倾全国之力来造,他们认为从九十年代开始人类在人工智能领域已经积累了大量的经验,再经过十年的时间我就能够造出这么一台机器来。这台机器只需要内置基本的机制和人工接口,它就会自己获得智慧和知识,不需要你去编程。到1990年的时候这个项目彻底失败了。

  八十年代人工神经网络,号称模拟人的大脑神经做一个网络就有智能,当年我做博士就是研究这个问题,在九零年前后冷下去了,事实证明并不能达到我们的期望。所以IT整个产业其实是在九零年发生了一次历史性的转折,就是从对智能的追求回归到了对计算能力的追求。发现造一台和人大脑一样的计算机不靠谱,什么靠谱吗?让计算机越算越快比较靠谱。IT产业今天我们看到的格局是在1990年的时候发生了根本的转折才变成这样的,在那之前对智能的追求是非常热的。

  这就是我们看到的今天IT产业在做什么?就是让机器越算越快,把机器越做越小,机器可以把所有的设备都连起来,为什么?就是因为计算机越做越小。计算机核心还是在做计算,但凡能变成计算的问题,计算机都可以解决。如果一个人没有本事把一个问题变成计算问题的话,计算机就解决不了。刚才中组部的人问我,一个局长能不能当副部长,如果没有人能够把这个问题当作计算问题的话,对不起解决不了,给计算机灌多少数据都没有用,一定有人懂这个事情怎么做计算机才能算。

  随着让计算机越算越快,做到今天整个IT产业迎来了第二个关键性的转变,就是在让计算机越算越快的道路上又出现了一个重大的转折,什么转折呢?就是今天基础技术平台在绝大多数的情况下足够富裕了,不再成为应用的瓶颈。所以IT产业从现在开始往未来看,基础技术平台主宰整个产业发展的阶段已经结束了。在九十年代买PC会问主频多少,主频不够有的销售商说可以给你升频,为什么?因为计算能力不够。但是到今天买手机或Pad的时候知道主频是多少吗?没有人关心了,为什么?基础技术平台的能力在绝大多数的情况下已经足够的富裕,不成为应用的限制瓶颈。从今天开始在IT产业里面基础技术平台将不再主宰未来产业的发展,真正主宰未来产业发展的将会是应用。为什么发生这件事情?就是因为集成电路技术的发展导致这个样子。

  现在集成电路线宽做到最小22纳米,就是在一个大头针的针头上可以放一亿个晶体管,为什么做这么小已经做成了立体的。原来的晶体管是平面二维的,现在已经是立体的了。

  再往下做,集成电路还能做到多小?我和英特尔的人谈过,他们说最小做到2纳米,也是可以在未来十年里再降低一个数量级,十年里硅走到头了,可以再用别的。

  IT产业之所以发生第二个转折就是因为集成电路走到了这个程度,在今天开始IT产业真正进入了青年时期,也就是真正开始了黄金时代。在此之前无论IT产业创造了什么样的不可思议的奇迹,那都是序幕。真正的奇迹将会在未来发展,整个IT产业波澜壮阔的前景还刚刚掀开一角。现在好多人在谈产业替代的问题,就是IT之后谁来驱动社会的发展,我觉得谈论这个话题还太早了,IT产业对于整个社会整个颠覆性的影响刚刚开始。

  举一个很简单的例子,《阿凡达》都看过对吧?IT在颠覆一个很传统的产业,就是咱们的电影,可以不用演员了。以前做不到,为什么?因为需要超级计算能力,原来的基础计算能力做不到,它会非常昂贵。现在基础计算能力以后足够富裕,我可以完全用电脑把片子做出来,不需要演员了,以后演员可能会事业,这是完全典型的例子。未来IT将会在各个领域里产生今天可能想不到的现象。

  下面就讲一下人在实现智能的这条路上有几个基本的方法,实际上有三个。第一个是形式上的模仿,刚才我说的是人工神经网络,什么意思呢?我们发现人的神经原是有巨量的神经原,他们之间有大量的连接。从五十年代开始搞人工智能的有一批人认为,我也造一些很简单的处理单元,然后把大量的处理单元连接在一起,我觉得就可能会有智能。这句话听起来有点像开玩笑,大家不要惊喜,科学家经常也搞不靠谱的事情。如果你们仔细读科学史的话,其实科学发展历史上有很多不靠谱的事情,包括很有名的科学家也干很不靠谱的事情,所以大家要记住不要把科学变成一种宗教迷信。

  这个事情形式模仿到今天为止别没有产生很了不起的结果,所谓结果就是非线性函数,非线性函数对样本集合按照最小差来拟合的过程,这个几百年就有了,所以形式模仿并没有成果。

  真正成功的是后两个,分别是机制模仿和机制替代。什么是机制模仿?我们做一件事情完全是按照人的大脑做事的方式做,比如下棋,比如计算机可以挑战世界冠军,赢了当年俄罗斯的世界冠军,机器怎么下棋?也会推演,因为计算快比人推演的过程很要多,最后把世界冠军赢了。这是通过机制模仿实现特定的活动,前提是要理解这个机制。

  第二个是机制代替。这个事情人是怎么做的,我可能不知道。比如说人的视觉,人的视觉过程还是非常复杂的,搞不太清楚视觉过程最后是什么过程。没有关系,我可以用另外一套机制来实现同样的效果,所以手写识别的过程和我们识别汉字是不一样的,我们识别汉字是拿一个汉字来识别。手写识别会把整个写字过程记录下来,利用写字过程的信息和笔划的信息来识别,所以整个机制和我们不太一样,但是效果可以是一饮的。

  这三个是核心的三个实现智能的方式,来两个是最重要的。

  下面是用机制实现智能走了什么样的路,这个和大数据就有关系了。最开始实现智能,人们希望发明一些基本的机制,用这些基本的机制就能使得机器和人一样通过与外界的交互变得聪明,可以来学习,这就是日本第五代计算机典型的思路,但是这种思路后来碰的头破血流,事实证明是不可以。到了上个世纪七八十年代在对智能追求上,人就退了一步。看来我们没有办法理解人的智能过程最底层的机制是什么,靠这个实现不了。退了一步是什么?就是把人的知识灌到机器里,加上一些机制来实现智能,这就是一种混合的方式。机器其实是预制了人的知识在里面的,这叫什么?这就叫专家系统,这是在上个世纪八十年代非常火的。这个时候我们会发现机制和信息结合了,和数据开始结合了,知识也是一种数据、一种信息。

  到了今天我们在谈大数据的应用等等,其实是第三步,我们会有一些机制,加上知识,再加上大量的数据去实现目标。这就是人类在追求智能化过程上,用机制来实现智能化过程的演变过程。最开始仅仅希望找到一些智能的机制,后来发现不行,所以把这些机制加上知识、数据来做。在整个的过程中,对于智能概念在不断的放松、放宽,所以我们今天谈的智能和五六十年代谈的智能其实不完全一样。因为我们碰壁了,所以把智能放宽了。今天当我们在谈很多智能应用等等东西的时候,其实很多东西在历史上都是有的,比如这些算法或机制,而且在历史上并不把这些东西当作智能的东西,因为那时候对智能的东西要求比较高。只是说后来实现不了,所以这些东西慢慢都变成了智能的东西,融进了智能的概念。

  今天我们谈智能的概念还是非常宽泛的概念,容纳了很多传统的东西,也包括现在的东西在里面,这就是整个智能机制实现演变的过程。

  我们看一下人脑是不是这样?人脑不是这样。我们脑袋里存储的信息是什么样的?是整体。我们脑袋里并不是说这个信息是为这件事用的,那个信息是为另一个应用用的。带人脑底下有一层统一的信息管理层,所有的信息在人脑是做整体的结构存在在一起的,从人脑的角度看和计算机最大的区别。当今天的计算机系统也发生了变化,进入了所谓大时代之后,我们要到底怎么管理信息?还是按照原来的方式把数据按照应用管起来,或者它就是一个块,咱们先堆起来再说,用的时候再挖。

  我在这儿的建议,后面讲的会是另外一个我提出的思路。大数据在这里想讲一下未来到底有什么样的技术、有什么样的应用模式。我想的也是非常庞杂,会有很多不同的做法,我下面讲的可能只是其中的一个,而不是全部。但是我认为这个做法可能是非常重要的一点,甚至这个做法颠覆整个IT产业,但是它不是万能的,不是一个包治百病的药,有人卖这种药,但是我不卖。

  在大数据时代信息到底应该怎么管理?咱们先不谈应用,先谈信息到底应该怎么管理。传统的管理是按照一个一个应用把数据管起来,在大数据时代大量的数据产生的时候是没有明确应用的,或者说也明确的应用,但是这个数据的价值绝不仅仅在于这一点的应用。到底我们应该怎么管这个数据?因为管好数据才能有好数据,如果连管都管不好,谈大数据的应用就有点瞎扯了,或者只能在很浅的层次上用。我个人一个基本的观点,在这个时代我们应该按照主体、按照人、按照企业、按照城市,按照一个一个主体界定的范围把这些数据起来。怎么管?按照数据之间、信息之间反应的逻辑,而不是像逻辑一样堆起来。

  这是刚才看到的图,对于一个个人这个信息应该怎样管?人脑中的信息不是杂乱无章的,信息在脑里也不是一堆垃圾,是有内在逻辑,也是相关的。当我们个人信息要管的时候应该怎么管?我们应该按照这些信息具有的人所感知的么在逻辑,把它组织在一起,最后形成一个什么?形成人脑这一部分的虚拟映像,在计算机里构造出了人脑信息集合的映像,它不是一个仓库,更不是一个垃圾堆。

  反过来如果按照一个城市主体把信息管起来,整个的系统就会变成这样子,最底层是所有的信息采集设备,包括摄像头、传感器,以及包括在网络上的虚拟传感器去监测整个网络的活动。所有的数据采集起来并不是灌到应用让应用去使用数据,而是按照数据所反应的城市各个部分的内在逻辑关系,把他们组织在一起。组织在一起成为了什么?成为了这个城市在虚拟世界里的一个映像。这个数据不是一个垃圾堆,这个数据有了内在整体的含义。在这个基础上可以对这个数据做更充分的利用,可以做各种各样的分析、各种各样的模拟。然后上面的应用可以到映像里去获取需要的各种各样的信息,而不是像原来仅仅局限在自己的系统里。

  信息的价值用这种方式会被更加充分的挖掘出来,而应用也能获得更加完整丰富的信息,而且上层应用的变化不影响底层。所以这种方式是和传统IT系统建设完全不同的一个方式,我个人认为未来很多IT系统可能会用这种方式来构建,当然不是所有的,也不是所有的信息都用来构建虚拟映像。但是这会成为一个非常核心的,或者非常重要的一种应用构建的模式,而且这种模式将会对IT产业、IT应用产生重大的影响。它不仅仅会改变应用,而且会产生核心的一些基础的技术、基础的产品、基础的平台,整个IT产业未来的变化可能远远超出我们的想象。

  回到个人的例子,如果把个人的应用也按照这种方式来建,底层就是一个个人的虚拟映像,中间是在这个映像基础上融合的服务,界面层可以人更加自然的交互。这个不是解决大脑低层看不到的智能过程,而是用来和我能够感受到、看到大脑的部分想办法无缝的结起来。这就是用这种方式构建应用未来出现的场景,计算机和你不仅仅在人机交互界面上,你会觉得计算机用起来很顺手,而且计算机的应用,特别是计算机对信息的存储、管理的方式和你的思维习惯、生活方式,将会很自然的融合在一起。因为这些信息就是按照你的习惯和思维方式组织和管理起来的,这样信息系统和人的接缝更小,最终形成无缝的连接。

  放到整个网络的世界里是什么景象?在整个网络世界里可能有不同的意义,有不同主体构造出来的核心应用系统,这些应用系统都是以主体的虚拟映像为基础,最后网络世界把他们联结在一起。所以网络世界也将更加变得有序,更加像真实世界的映像,而不是像今天这样杂乱无章。

  未来的发展如果总结成一句话,就是让辅助人类体能的工具和辅助人类智能的工具,都和人逐步无缝接起来,这就是我认为智能的未来。而不是说我们造一台机器,让它和我一样,和我同样的智能,最后来挑战我。我认为这个目标也许几百年有可能能够实现,但是在现在来看未来几十年、上百年的历程往后看的话,我认为智能更多的会按照这个方向去走,而不是造出有独立人格和人完全有同样能力的机器。无论数据有多大,我想这个目标在目前看都很难实现。

[责任编辑:Robot]
转载申明:中国智能化产业与产品网独家专稿,转载请注明出处,违者必究!

官方微信

联系我们

010-57188978
投稿:zgznhcy@ciiip.com
地址:北京市朝阳区劲松南路1号
网址:www.ciiip.com
关于我们
加为微信好友