李飞飞现为斯坦福大学人工智能实验室和视觉实验室主任,多年来致力于解决人工智能的棘手问题——包括图像识别,学习能力和语言处理等功能。她和她的团队在2007年通过网络众包技术,建立起了一个含有1500万张照片的数据库Imagenet,它提供的信息财富可以用来训练计算机识别、理解图像内容的算法。

在人工智能的年度竞赛项目结束之后,李飞飞教授发表了主题演讲,并欢迎企业家、创始人等各种与会人员一起深入讨论人工智能的问题。
视觉智能和机器学习
人工智能的问题是一个很大的问题,它涉及的范围很广。本次演讲,李飞飞教授从计算机视觉的重要性来讨论人工智能。她表示,和5亿年以前相比,没有什么东西比人类的眼睛得以更快速的扩张。
如果把人的眼睛看作一对生物相机,它们大约每 200 毫秒就能拍一张照片(这是眼睛运动的平均时间),那么3岁小孩看到的图像是数以亿计的。人类大脑通过观看无数张图像后才对物体有了概念。
她解释道,“寒武纪(Cambrian)爆炸是由视觉的进化而引发的。视觉智能是一般人工智能的一个关键部分。” 经过 5.4亿年,人类才形成对世界的认识,其中大部分努力用在了大脑视觉处理机制的开发,而不是眼睛本身。也就是说视觉始于眼睛,却发生于大脑。追溯到几万年之前,李飞飞教授谈到了技术如何努力跟上人类大脑、学习人们做事的方式。在李飞飞教授看来,创建一台像我们一样聪明的计算机的关键是学习。
“学习是人类智慧最重要的一部分。这是我们需要让电脑去做的。学习是视觉智能的必经之路。”
正如我们许多人都知道的,还有李飞飞教授所强调的那样,最近几年,人工智能已经成为一个主要的技术。短时间内,面部识别软件技术的创新使生活变得如此简单,这些东西在我们普通人、Facebook的使用者、网站的创造者看来都是那么的理所当然。不可否认,机器学习是人工智能、面部识别技术发展的驱动力。
李飞飞教授表示“机器学习有助于解决人工智能最重要和最基本的问题”。
一个问题:现实世界的变化
李飞飞教授表示,问题是现实世界中变量的数量可以给人工智能创造很多的问题。她巧妙地通过一只可爱的猫,还有一些独特的构成证明了这一点。她解释说,虽然人工智能可以很简单地辨识一只猫是坐着、走路还是跳跃,但是要辨别一只有如下姿势的猫肯定是困难的。

估计是这只猫姿势太过销魂了吧,哈哈哈!!!

像家庭宠物这样简单的物种,在模型上都千差万别,大千世界更是千姿百态。李飞飞和她的团队在生物识别方面投入了大量心血,也没能找到一个好的算法让计算机准确识别出一个物种。
于是他们不再专心寻找优秀的识别算法,而是把注意力放在了人类视觉的形成上。
李飞飞教授一直在前线战斗来解决这些问题。为了让计算机视觉智能比以往更全面、更高效,她和她的斯坦福大学团队每天都在不知疲倦地工作。他们创造了ImageNet数据库,通过记住大量的图片来教计算机认识物体。这种技术不仅可以识别面孔,还可以十分准确地辨别一个场景。所以,这些使电脑看起来可以像人们一样做任何事情。
“该算法可以看到图片,还可以用人类的语言说话。我们看到电脑开始像人类一样思考。”
李飞飞教授承认,该项技术还远远没有达到完美的地步。现实当中会有很多滑稽的例子,比如,有时候算法会把一把牙刷当成棒球的棒子,会把一个大胡子的男人当成一只泰迪熊。她强调,我们还有很长的路要走,但是在这条路上,我们的速度要比我们想象的要快得多。
“计算机视觉将会导致技术性的寒武纪爆炸,我们并没有远离它,也远离不了它。”
我们正在教计算机如何去“看”世界,我们的世界将有更多双眼睛一起去探索。