首页 > 论坛 > 前沿探索 > 正文

人工智能探索-由一个具体问题想到的

2014年04月03日    来源:搜狐博客     
1193

  我认为,理解智能包括理解:知识如何获取、表达和存储;智能行为如何产生和学习;动机、情感和优先权如何发展和运用;传感器信号如何转换成各种符号;怎样利用各种符号执行逻辑运算、对过去进行推理及对未来进行规划;智能机制如何产生幻觉、信念、希望、畏惧、梦幻甚至善良和爱情等现象。我相信,对上述内容有一个根本的理解将会成为与拥有原子物理、相对论和分子遗传学等级相当的科学成就。

  — James Albus—

  问题

  我们提出这样的问题:将一个具有视频传感器,姿态传感器,碰撞传感器,触觉传感器的移动机器人放在在一个封闭的房间里,房间里有一个可以移动的斜面,天花板上吊一个香蕉,我们的目标是让机器人抅到天花板上的香蕉。要抅到香蕉,对移动机器人来说一种可行的方法是将斜面移动到香蕉的正下方,然后沿斜面走上去。如果我们不是编写程序明确地告诉机器人该怎样做而只是让机器人具备最基本的技能,如电机控制,视觉传感器姿态控制等;基本的倾向(或本能),如好奇,对香蕉颜色的强烈喜爱等;有限的指导,如对发生碰撞进行惩罚,对即将引起机器人倾覆的姿态惩罚等,那么机器人能否通过在环境中的反复尝试完成这个任务呢?

  首先要说明的是:机器人喜爱香蕉颜色并不是机器人的本能,而只是出于简化问题的需要。如果使机器人喜爱香蕉的颜色,便可以使机器人产生主动接近香蕉的动机。机器人应该具备哪些更基本的本能是一个值得深入讨论的问题,对这个问题的探索将对人类了解自身产生积极的影响。另外有限的指导也是出于简化问题的需要,如果机器人具有避免伤害这样的更基本的本能的话,就能产生避免伤害自身的行为,如碰撞和倾覆。(展开进一步研究)

  好奇的本能会使机器人以一定的概率活动自己的身体和探索自己所处的环境。通过活动自己所具有的执行元件和在环境中漫游建立执行元件和传感器之间的关联(sensor-motor map),了解自己的动作和引起的反应之间的因果关系。(开展研究)

  方法

  如果机器人要从当前位置移动到期望位置,那么它必须事先学会了如何使用自己的轮子,避碰和路径规划。这些技能是从更基本的技能,如电机控制,摄像头控制发展来的,而且是在机器人启动以后的最初阶段学会的。学会如何使用自己的轮子:在机器人启动以后,机器人尝试在所处的环境中漫游,在漫游的过程中建立执行(对驱动元件的控制)和执行结果(传感器的输出)之间的映射关系,在后来的漫游中将这种关系进一步巩固和加强。(more work to do here)在建立了正确的执行和结果的映射后,机器人便能控制自己的各个驱动元件达到期望的姿态或移动到期望的位置。

  避碰的建立过程是:每次发生碰撞就受到一次惩罚,机器人将受到的惩罚与先前做过的动作、传感器的输入进行关联。在经历多次碰撞和惩罚后,正确的关联得到了加强,错误的关联被削弱,最终可能得到与碰撞相关的正确联系。这是知识归纳的过程,归纳的输出产生知识。下一个问题是:机器人怎样知道斜面是可以移动的;知道将斜面移动到香蕉的下方并走上斜面以后就能抅到香蕉?

  如果不是通过编写程序指定这样做或者不是用在有限几个状态下搜索的方法来实现,而是让机器人根据以前的经验自己得到问题的解,这个问题是复杂的。首先机器人必须能够从环境中区分出斜面,要做到这点必须建立经验知识。在机器人探索世界的过程中,能够顺利通过的地方或者胳膊不会发生碰撞的地方认为是空的,而胳膊碰到的地方则不是。斜面在形状上与周围的环境是不同的,这足以一起机器人的好奇。机器人会主动地接触斜面甚至移动斜面,从而能够将斜面与周围的环境区分开来。在这个过程中机器人可以得到斜面的印象和这个斜面是可移动的知识。目前已经有学者在这方面进行了很多尝试,如需要强调的是,每当机器人获得了某个知识,他会已非常大的概率应用刚刚获得的知识在环境中进行重复试验。例如如果机器人建立了斜面时可以推动的的知识,他会从不同的方向尝试推动斜面。假如机器人在漫游的过程中,有一次走上了斜面,在这个过程中会有很多新的体验,这些新的体验都会引起机器人的兴趣。机器人的视野增大了,与天花板的距离减小了等等,这些体验有选择的保存。当机器人看到天花板上的香蕉时,机器人会想办法接近香蕉。怎样才能接近香蕉呢?可以想办法降低香蕉的高度,也可以想办法接近天花板。只要有必要的联想机制(difficult),机器人便会联想到走上斜面并接近天花板的经验。即使对于智能程度比较高的灵长类动物,这种联想也是比较难做到的。怎样才能简化问题的寻找过程呢?可通过启发式的学习,每次只需要掌握一点点知识:首先将香蕉挂在斜面的上方,机器人会走上斜面。然后将斜面移开,机器人只要会将斜面移动回来并继续走上斜面。最后是将斜面放到任意位置,看机器人是否会将斜面移动到香蕉下放并走上斜面。在这个过程里,机器人必须具备在旧知识的基础上积累新的知识的能力。

  AI新要素

  提出人工智能的四个新的基本要素:可发展(development);社会交互(social interaction);实体(embodiment);集成(integration)

  1,能够适应自然环境的智能系统应该是可发展的,从简单到复杂,智能成都从低级到高级,知识从少到多。可发展降低了对系统运算能力的要求,因为新的知识是建立在原有知识的基础上的,对新信息的处理之需要有限的资源。可发展从实现的角度要求系统是可发展的,可动态扩充的(scalable),如处理器的速度可以提高,数目可以增加;内存的容量可以动态增加而不影响原系统的正常工作。进一步,系统结构应该是可变的,调整单元之间的连接和结构不影响系统的正常运行。可发展的另一要求是智能体内部的程序是可变的,不是单一的数据结构和程序结构。数据结构、算法和程序以统一形式表示,动态的产生新的数据结构、算法和程序。

  2,社会交互:社会交互是必要的,只有在社会交往中才能了解他人的动机与自己的不同,才能够正确的认识和调整自己,才能和他人正确的交互。人工智能生物的最终目的是为了和人类和谐相处并为人类服务,因此在社会交往中理解人类的意图是非常必要的。

  3,实体化:智能系统只有实体化才能实现与环境和人的交互,主动地获取知识。

  4,集成的:所有传感器获得信息不是孤立的,而是作为一个整体被处理和存储的。我认为,各传感器的没有过滤的原始信息有些还会暂时性保留,因为有时人会想到一些不经意中感受到的信息。

  系统结构

  如图表 1,传感器得到原始信息首先经过预处理,得到更加抽象的信息。有些预处理通道是天生的,如眼睛得到的视频信息进行边缘提取构成一个信息通道,根据颜色及连通性构成一个通道,根据运动检测构成另一个通道等。有一些是经过训练而后天获得的,例如品酒员对味道的分辨能力,调琴师对声音的辨别能力。在进化过程中,有新的预处理通道产生,原有的预处理通道的处理能力和方式不断改变或得到加强。预处理后得到的抽象信息经过综合得到各种类型的更为抽象的信息,这些信息代表了系统执行的结果。在执行器的控制和执行的结果之间进行关联,可以得到控制和结果之间的映射关系,这种关系作为知识存储。另外传感器观察到的结果和以前检测到的现象进行关联,正确的关联形成知识存储。机器人的本能和外界输入的任务产生对完成任务情况的一种评价指导机器人的行为。

  结论

  如果我们建立起这样的可发展的,可进化的,具有本能和一些基本能力的机器人系统,并使其与环境接触,与人类社会接触。机器人主动地认知,自动地建立知识,他能否产生比目前已有的智能系统更高的智能呢?这个问题值得研究和讨论。

[责任编辑:]
转载申明:中国智能化产业与产品网独家专稿,转载请注明出处,违者必究!

官方微信

联系我们

010-57188978
投稿:zgznhcy@ciiip.com
地址:北京市朝阳区劲松南路1号
网址:www.ciiip.com
关于我们
加为微信好友