2018中国人工智能产业年会主旨演讲——
温浩:《打造A.I.闭环 引领产业变革》
2018年12月26日    来源:中国人工智能学会

  云从科技联合创始人温浩做了题为《打造AI闭环,引领产业变革》的主旨演讲,详细介绍了云从科技的核心能力与应用情况。温浩表示,云从科技从自身实践出发,聚焦核心技术的突破并构成闭环,将核心技术加速应用在关键行业,并努力建设行业平台和智能生态。

2018年12月9日,温浩副总裁在2018中国人工智能产业年会作了题为《打造AI闭环,引领产业变革》的主旨演讲。

  以下为温浩演讲内容实录

  温浩:谢谢组委会,谢谢专家评委对我们云从科技厚爱,很荣幸获得了吴文俊人工智能科技进步奖一等奖。刚才听了王总和肖总的精彩报告,对AI技术多样性和探索非常值得我们敬佩,云从相对来说没有这么大的体量,我们是从产业垂直行业的落地去探索,今天我跟大家分享的是“打造AI闭环,引领产业变革”。

  先给大家介绍一下云从科技,云从从中科院走出来一个人工智能产业化国家队,2006年开始,我们的创始人周曦博士,就在UIUC师从黄希涛院士,他是美国工程院和中科院的外籍院士。同时在UIUC团队也拿了多次的世界冠军。到2011年之后,以中科院百人计划这样一个身份回到中科院重庆研究院。

  于是我们的核心团队在重庆成立了,当时致力于把计算机视觉技术落地,产业化,到2014年的时候,我们已经承继了中科院的战略向导专项,还包括重大一些边境通关的相等,产业化做得比较好云从,2015年正式成立云从科技,所以我们核心技术前前后后做了差不多十年。

  中科院体系我们受到领导的高度重视,包括像白院长也是对我们多次视察聆听我们的报告,我们也参与人脸识别相关的,像国家标准,行业标准这样一个制定,2017年我们承接发改委国家的人工智能基础资源公共服务平台,这个是和当时全国也就只有4家企业,包括百度,包括腾讯,还有讯飞。云从是唯一一家西部的,而且体量相对比较小的中科院背景的企业。

  我们到2018年继续承接这样一个高准确度人脸识别的应用系统,然后在我们今年也拿工信部这样核心SOC芯片的人脸识别应用项目,我们是从基础资源平台到应用系统,再到核心芯片整个的产业链打通垂直的行业整合,这是我们一个国家承担的重任这方面。

  另外一方面我们在全国已经发展比较迅速,三年多以来我们已经建立了5个研发中心,除了重庆还有广州,上海,成都,包括今天的苏州。苏州大概一百多名我们的工程师团队,全国大概七百人的研发队伍。这是在苏州新的办公室,超过一万平方,也在建设中,也欢迎有兴趣的可以加入我们。

  包括在国际上权威的比赛,我们拿了七次世界冠军,在施展的行业PK里面我们拿了一百多次的KP第一名。现在云从主要是在三各行业有这样一个大的突破,一个是在银行,我们现在有四百多家合作银行,包括像农行、建行、招商银行,这个市场占有率接近80%,每天调用服务次数超过2亿次。

  还有公安我们有32个省级行政区这样上线实战,包括五个公安的部级平台,然拥有一万五千多路视频监控的接入。在机场我们做到全国六十个机场,包括像上海浦东机场、虹桥机场、广州白云机场、西安机场、重庆机场、郑州机场,这些都是我们的客户,每天服务六千万人次的服务,包括安检口,包括登机口。

  这是我们主要的三大行业,那么现在云从从这三个行业开始慢慢渗透到其他的,比如像商业、教育社区,这些比较大的行业里面,希望通过技术逐渐改变行业的这些痛点。云从的愿景就是通过我们的国家平台和从感知到认知,再到决策,这样一个闭环能力,再到资源,数据资源和智力资源,然后来打造定义的设备,标准化的设备,标准化的场景,去改造我们的行业的方案,这是我们的一些简单长期规划。

  我们的愿景就是定义智慧生活。这个愿景看起来比较大,但是我们希望一步一步把它做。

  我今天讲的主题,AI的技术闭环,为什么提闭环这个东西?AI这两年非常火,大家在生活中已经初步在各种场景下使用,但是实际大家使用过程中和在这个行业的解决过程中,你会发现它其实有有些时候并不是那么智能。

  这个是我们在机场做的智慧航显的例子,是比较简单的应用,如果过了安检口,然后去航显的大屏上,就可以把你要登机的航班,信息,登机口在哪里?你需要多久什么时候登机,包括目的地的天气情况,都会把这些信息告诉,所以这是一个简单的应用。这个简单应用还好,,还可以方便我们的旅客,但是有一些应用不是这么智能了。比如说前段时间有一个例子,宁波的公路上行人闯红灯的识别,它识别到董明珠女士闯红灯。

  事实上是什么呢?事实上是公交车的一个广告是董明珠的画像,最后把她识别成闯红灯的行人了,还把她违法信息公布了,而且放在网上。这个例子不是让人觉得非常智能,还有一个连交警自己都会闯红灯拍下来。当然,并不是在闯红灯是在指挥交通,这种情况不好识别。

  我们觉得如果感知技术只是一个点的话,没有做深入的技术闭环,没有做深入分析,其实这个人工智能技术并不是那么智能,有些时候变成了人工智障,要和人类智能协作,这个时候就要更深一步。AI企业不能说我只做一个点,想靠这个点去解决行业的问题。我们要做很多的东西,我们要做什么?云从认为应该首先要做眼睛。

  眼睛是什么呢?就是我们的计算机视觉,包括人脸识别,然后五官,五官要做什么?除了人脸以外还有语音、文字,包括体感,各种各样的智能感知技术,最后要做大脑,大脑包括大数据、语义识别、知识图谱、机器学习智能分析技术。只有把这一套都做了以后,我们才能实现一个比较智能的解决方案。

  当然,不是说任何一个技术钻研得非常深,而且面铺的非常开,对于初创企业来说其实它是比较困难的,没有必要,也没有这个能力。我们应该做什么呢?我们应该在一些点上做到世界领先,尽量把它补齐,短板补齐了以后可以打造一个比较好的解决方案。

  我们人脸识别用得最多,它是目前来说最成熟的人工智能技术,而且它是一个入口,以前互联网谈入口,为什么它是入口呢?它是人机交互的第一步骤,首先机器要知道你是谁,人脸识别就是这样的入口,它是打通各个行业的信息关键技术。

  人脸识别之后我们下一步效果做的就是人体识别、跨镜追踪,哪怕在没有人脸的识别情况下,尽可能在一个场景内通过你的穿着、步态、行为特征一样可以把你分析出来,这个就是我们说的行人再识别。这个技术未来两三年内肯定是会逐步落地,而且会看到很多产品的技术,这个是我们现在也在做。

  这个是我们在重庆建的光环境模拟实验室,我们从中科院的时候建结构化的数据,从各种各样的光源和摄像机来采集动态的人脸,可以保证人脸数据比较完整,比较结构化,误识别达到亿分之一,跨镜追踪同时,跨镜追踪技术刷新世界纪录,达到96.6%的商用水平。

  另外跨镜追踪的演示,通过多个的相机,比如说在学校场景里面,然后去跟踪检测行人,通过他身上的衣着,包括他行走的步态来识别他的身份,这个里面红色和蓝色就是不同人的行走轨迹,中间断线就代表他们没有拍到人,已经消失在摄像头的范围内,但是通过后续的摄像头把它拍到之后仍然定位出来,就会有一个这样的轨迹信息。

  第二步就是我们说的感知,我们回顾一下,大家以前为什么在PC之前没有被普及?就是因为我们的输入方式非常的原始,要靠键盘的输入,甚至是磁带,这样是非常慢的,有了鼠标和图形化界面,这个PC一下就普及了,所以才有我们的互联网。同样像这个最近一次2007年iPhone,它把这个触控的这样一个方式带到大家面前,所以说这个智能手机和移动互联网改变了我们的生活。下一个十年,我们肯定会有新的以人工智能为基础的人机交互技术,代表什么呢?包括人脸,包括语音,包括文字,包括NLP语意理解,包括AR。这样的一个更自然,更流畅的交互方式,很可能会改变我们的交互方式,很可能给我们代理新一轮的技术革命。

  我们现在点餐还要打开手机,点开APP,然后再慢慢选,选商家,选口味,选菜品。以后我们完全可以语音唤醒,然后再进行个人的交互,甚至它可以把你想要吃的东西,通过AR方式给你投影出来,还会帮你自动打电话订餐,这样的交流方式,最后通过人脸支付,这个方式非常流畅,就像跟你的管家或者助手在通信的情况一样。

  你可以想象以后APP的入口可能也有它的一个问题,以后可能就不存在了。我们现在也在跟各个研究机构包括中科院,包括上海交大,包括我们一起合作拿了一等奖的重庆大学,我们成立联合实验室,分别研究这些交互技术,包括NLP,包括车辆的视觉,包括人机交互的。

  我们在今年的语音识别上也做到一些突破,当然我们不是为了秀这个技术,我们是为了在解决方案里面把这个技术整合进来。包括OCR的文字识别,我们也是创造比较好世界记录的层级。

  最后一个是通过一个闭环,通过用户行为分析,收集大数据,然后从数据里面建模,机器学习,自动学习,最后形成用户画像,画像完了之后再进行产品推介,产品推介这个是在这种场景下,有些场景下可能是另外一种动作和决策,这个可以看具体的应用。

  最后这个产品推介完了之后,再看用户的反馈,这就是我们线下要做的事情。以前这个事情可以在线上做,互联网上去网上商店,电商,你去做的事情都可以做这一套动作,这是互联网上做的,这个是比较简单的,因为收集数据很方便,但是我们在线下做这个事情就没有这么方便的,通过各种各样的传感器,各种各样的触控方式,把这个行为收集到,然后再把信息传达到你想要传达的对象,所以这个过程就要复杂一点,但是我们希望构建线下的人工智能闭环。

  我们也在一些神经网络上,包括做决策分析的,做了一些突破,包括我们的双打,包括我们LSTM,这些都比传统的机械学习网络会提升一定比例的效率。我们也参与了国家的脑科学建设计划,是上海的首批科学家团队。

  第二方面,我们看一下用我们的技术怎么样引领产业的变革?我们怎么样打造这个产品?怎么样提出解决方案,最后这个行业的平台,我们提出了人工智能企业需要五步走发展周期,这是我们的想法。

  我们现在刚开始说的在金融、安防、商业、交通,这是我们标准产品,标准模组,解决方案是针对行业里面具体的应用,比如说在银行里面,最早是远程人脸认证,后来我们越做越多,就发现银行里面的需求,远远不止这些除了人脸以外,还有更多更多智慧化的要求,比如说信用卡,做信用卡的分期推荐,做电子银行,做网点的智慧化改造。

  广东的建设银行,都有高效的校园银行,就是一个无人银行,所有的一百多个网点改造建设方案都是我们提的。包括ATM机的备付金,这个就是比如说上海建设银行在全上海有1000多个网点,2000多个ATM机,它每个月产生的现金需要10个亿。如果这个现金过多的话会产生利息,但是如果过少会达不到服务的要求,必须要有一个机器学习,对现金流水进行预测,我们可以预测最合适放多少现金是合适的。

  我们通过做下来一个月可以为建行节省上百万的利息,这个就是在网点运营商机器学习的例子,还包括机房服务器的故障、检测、预测也是保障服务的。我这里再举一个更相信的例子,譬如说在商业里面是怎么样打造闭环的。

  比如说线下门店,我刚才说了线上是很容易的,互联网电商都是非常容易的,但是线下店外有多少人,什么样的人,什么人会进来,有多少人进来,来过多少次,应该为他提供什么样的服务,他看了什么东西,买了什么东西,最后他是不是以后对这个还会比较满意,还会再来,这个东西传统的门店是一问三不知的。

  我们的AI技术就是要去帮他们打造线下的闭环,像线下的电商一样,帮他们收集用户的行为和数据,帮他们做一个画像,再帮他们做推荐,就是一个闭环的思路。简单说就是重构门店的人、货、场,我们做新零售大家觉得新零售就是无人超市,就是无人货架,今年会发现好多无人超市、无人货架最后都没有声音了,这个形势是一个蛮不错的形势,我不否认这个东西以后肯定会在某一个时间卷土重来的。

  但是我们在现在这个阶段没有太多的心意或者太大的价值,因为节省的人工成本带来更多技术的成本,最后没有对业务产生更大的推动。我们这个时候就应该用其他的办法解决人、货、场,这里不去详讲了。我们就讲一下譬如说做两个方向,一个方向就是做一大一小,做大就是做大数据,就是通过打造云家大脑,帮他分析线上线下的数据打通。小的就是通过小的传感器,摄像头也好,语音也好或者是交互也好,帮他去精准的识别客户,帮他了解个体的消费偏好、精准营销,然后去提高门店的效益,这个就是两个方向。

  然后我们做到具体的闭环,比如说进门口的时候就有门店的智能抓拍机,可以识别到所有进来的人性别、年龄,还有衣着,还有包括是不是会员,甚至他是不是熟客,这个人来过几次,这个熟客定义是可以自定义的。这个信息都会推到后台,推到店员掌上APP或者手机上,再接下来是广告机,广告机会根据来的人,推送感兴趣的广告,跟店里面相关的广告。

  再下来是什么?就是我们的货架,货架是可以搜集到浏览信息,到底拿了什么东西起来看,看了多久,这些都是可以产生价值的。这个货架通过这个技术来感应,再接下来是什么?终端,我们的信息会推到营销人员他的手上,这个终端形式是一个软件,可以取决于各种各样的硬件。

  还有一个支付端,明年大家一定会看到刷脸支付,会大面积推广,因为刷脸支付不光是让你把卡扔掉,最重要收集到支付信息。谁买了东西,然后跟你的人脸是可以对应起来的。这个东西非常重要,下次只要你一来,我就知道你上次买过东西。这个人脸信息和支付是肯定会连在一起的,不光是为了消费的方便。

  这个终端不光是可以支付,还可以推广,比如说在支付的时候可以告诉你我和银行有合作,可以给你做信用卡的分期,你可以用分期来买这个西,或者你可以用银行的什么支付得到一个什么优惠,这些东西都是会打通的。这就是一个闭环的方案,多店的闭环一样的,跨门店,他还可以把社区大脑,你住在哪里,你的消费能力,然后还有你的银行,比如说信用分期能力和你还贷的风险能力都会评估出来,然后一其推到这里面去。

  最后这个这样话,从业绩上来讲不光是提高商家的业绩,还提高了银行消费贷的业绩,所以这就是跨行业和技术闭环形成了价值形。我们最后总结一下它的特点是,我们线上有一个模型叫做漏斗模型,什么叫漏斗模型呢?刚才我说的店外人员、进店人员,关注的区域。线上应该是浏览商品,然后放入购物车,然后再生成定单,然后再支付定单,这样整个过程是一个漏斗的,就是不同比例的。

  这个比例会逐步的降低,因为最后支付了定单的人肯定是少数,肯定是一个比例。我们线下没有这样的模型,我们的AI技术就是打造线下版的漏斗模型,从进店到关注,再到商品的具体关注,再到最后定单支付,这就是线下的漏斗模型。

  这是我们在去做的一个事情,我们现在日产4S店、国美、小米都在做试点,这个是我们比较重要的一个。这是在小米门店里面做的热力图分析,包括达到100个人以上都没有问题。除了这个人体以外,识别关注点,走的路线。通过人脸和人体的识别技术,这只是感知。

  然后通过各种设备,包括推荐,广告推荐,这是在国美,包括在这些互动娱乐,包括一些广告查询,这样一些设备,来进行交互,进行推介,这是门店里面做的一些设备。

  我们回过头来,除了解决方案要做到完整闭环以外,我们的行业里面要做关键的人工智能平台,刚才说了云从是承接国家三大平台,但是云从在最早之前,还做了行业的关键性人工智能平台,比如说在银行里面做了IBIS平台,这个平台的意义重要性在于什么?它的技术并不是说多么的领先或者AI技术并不是多少复杂,其实最重要的是什么?生物识别跟银行所有的业务都会发生关联,银行有两百多个业务系统,只要它用到生物识别,一定会用于云从的生物识别平台,而且是总行。

  比如说在农业银行的总行,它从柜台到超级柜台,再到刷脸取款,ATM机,再到手机银行,只要是用到人脸识别,生物识别都会用到我们这个平体,所以这就是重要性,现在连接到一百多个银行总行,然后机场大脑,安检口,登机口,航线,候机楼,停机坪,只要是用到这些关于大数据,关于AI的技术都会用到我们的大脑。包括公安部刚才说五个平台,然后商业的300多家4S店的平台都是我们提供,这是行业的平台。

  最后一个,我们要做行业的顶层设计,刚才说了我们和四大行和公安部,包括民行总局成立联合实验室,合理合法使用大数据,定义标准。这就是三步的,从标准模组到行业平台,再到顶层设计,三步的步骤。

  最后总结一下,我们认为AI企业要落地,必须在五个阶段:

  1.学术研究,学术是权威的,技术是领先的,这是没有问题的,大家可以看到AI企业创始团队都是高学历,高背景,技术背景的团队,都没有问题。

  2.行业验证,你这个技术是不是一定能在行业里面得到可行性,能不能在实战中经受检验?

  3.商业落地,技术是不是能转换成产品?能不能形成解决方案?这个就是商业落地的过程。

  4.行业平台,做到商业落地公司肯定是活下来了,但是到后面我们要做行业平台。因为如果你各设备、产品,它其实很容易被替代,你今天做一个人脸抓拍机,我相信很多公司都会做,替代性是非常大的,但是你做了平台,它就像一个手机的操作系统一样,你会轻易的把操作系统换掉吗?不可能的,特别是它连接了你银行两百多个业务系统,这个时候是没有可替代的功能,这是行业的关键平台,关键入口。

  5.智能生态,不管是云从一家来做,只要是上下游产业链,合作伙伴,通过这个关键平台,我们一起来打造云从可以提供技术平台和资源,一起打造行业的解决方案。这样的行业智能化解决方案,才是完整的,才是丰富的,这是我们希望做到智能生态的地步。

  最后我用卡斯帕罗夫的一句话,20年前输给了深蓝,但是他现在认为人工智能是一定会代替我们,但人工智能也能帮我们改善和提升,让我们专注更高级别的事务,这是一个比较良性的结果,人类不应该害怕人工智能,我们应该和它协作,达到一个新高度,人和人工智能能够共同创造未来美好的生活,这个是我们想分享给大家的,谢谢大家。

  

版权所有 © 中国人工智能学会
ICP备案号:京ICP备13016090号-5 | 技术支持:智能君博科技