>>返回主页
工业互联网产业联盟工业智能特设组联席主席、阿里云ET工业大脑总经理、阿里云人工智能解决方案专家 王峰 :工业因知而智,互联智领升级

2018-02-01 15:30

  咱们这个组叫工业智能组,我今天的演讲主题也会给大家从笼统的角度也好,从细节的实践角度来讲讲阿里云在工业智能做的一些实践,以及本身我们在工业智能这个产品,工业大脑设计的一些理念和模式。

  我们分为四块。第一,简单介绍一下工业智能,包括数据智能的一个定义。第二,在推进过程当中我们看到的一些难点。从工程师、算法、产品、运营,下车间的这个过程我们找出了一些问题。第三,阿里云工业大脑是什么?第四,提炼在推进过程当中的复杂矛盾。

  其实讲到消费互联网,大家都很关心。今天站在市值比较高的这一方,阿里云、淘宝、天猫的角度讲讲,其实我们在这里沉淀的是哪些东西?第一,十亿商品的类目库和体系库,这个本身的类目库和体系库翻新了至少6个版本。第二,今天我们对人货所构建的标签数据体系涉及到3000左右的这么一套数据标签体系。第三,在整个过程当中,我们设计了对商家、对供应链、对后台运营的这一系列的体系所构建出来的数据关联和数据的理解。今天通过阿里云的平台,把我们对数据的技术的理解在平台输出到整个的产业界。

  而当我们投射到工业这个领域来的时候,我们盯住的第一点是什么?先看数据,樵夫难为无米之炊,在工业领域数据是什么?今天我们回到工业领域,传统制造业看这些问题的时候,我看到的是全链路、全流程。在此背后我们考虑的是数据产生的供应链的数据,产生的采购的数据,设备的、仪器的、质检的这些数据如何来反哺我的支撑和应用。数据是什么先看到,然后背后的关联关系能够看见和理解,然后构建出的模型,支撑哪些应用。企业设计的逻辑,是怎么将数据来反哺。

  什么是数据智能?其实脱离数据谈人工智能,这个可能就没有了基础。我对这件事情的理解很简单,最终它是一套商业化、产品化和服务化。这“三化”很关键,因为今天我不是做一篇报告,不是发一篇论文,我也不是做咨询,或者我也不是做分析报告,它的频次是什么?每年一次,这不是人工智能,这可能只是小儿科做做研究,我们都说研究这个事情是小儿科,这是不负责任的表现。我们这些工业领域里面需要的稳态的、可控的、可解释性的产品化的服务和输出,这是一个商业性质的合作,是需要用订单和合同来约束的,今天我的产能效率提升不到1%,可能一分钱都收不到,背后的意义和价值在这里。

  而这里,是这样一个四位一体,云计算、大数据、人工智能和产品化,最后通过联网来串接。大家可以看一下最左边和最右边的小括号,我对我们阿里这个LoGo的设计很喜欢,因为它把所有的东西都放在计算的框架之内。我们在计算的框架下形成一套产品化和服务化对业界进行输出,这才是数据智能。这里有我们的新能源是数据,新材料是人工智能,而生产关系是互联网和物联网,而算力就是我们的生产力,谁算得快,算得好,跑的就快,跑的就轻松,背后我们的新模式,要产品化、商业化,形成了数据智能,我们的理念。

  我们看一下有几个问题。从原来的我们做商品,大家理解做商务,再回到工业上。我们获取数据非常困难,因为原来我们对数据的定义是外部是什么,圈一块地,我们需要做这个事情,你们就需要按照我对商品、图书构建的一套标准,这个标准是我定的,而且在我可控的区域,我来驰名。但是,工业里面这事情就不一样了,十大自动化公司,像SAP这样的ERP公司,还有若干做数据集成和数据采集的公司,还有若干做仿真的公司,松散的风控,并且封闭的技术掌控。很多时候你的数据的获取这是一件非常痛苦的事情,你获取完了之后还得打通,对不起,今天采购部分的数据和生产部分的数据都不能关联,连关联这个数据我都要建模,都要做一些算法把这些数据打通。也就是我花3个月的时间才打通数据,而且这个背后尴尬的事情是说,也许你还不能做一点什么事情。所以,我们今天在推进这个数据智能业务的时候,有句话叫做什么?“世界上没有完美的数据”,这已经是对世界的一种妥协,妥协不意味着退让,而是在妥协的情况下,在不确定性中,找出我帮助企业挖掘数据价值确定性的那一部分。

  第二,在数据分析来看。这里面数据有几个特点,来源于种类多,又是高频,价值密度低,它的高频。像国家仪器采购的数据,他们要找好的方法,挖掘其的价值,数据不用那是什么?成本,我们今天要把这些成为你原来可能很尴尬的存在的这些成本的数据变成价值中心,从成本中心到价值中心,这也是从IT到DT的一个核心转变所在。

  第三,建模比较痛苦。我们不是在工业领域所有点都能做。比如很有意思的,叫桥梁的故障,大桥维修的预测。大桥这个事情要损坏,大型检修、大型故障,十年一次已经算是高频了,一般我们建桥的时候都是50年、100年、1000年,你做这个事情等五年,十年,也许公司都不在了,所以这是不合适的场景。我们需要找到一些在产线上,设备上,高频高发的,快速验证我这些设备的公司,难找。

  第四,人才和技术的短缺。原来技术开发的人,我不是针对谁,技术水平稍微有点弱,某种层面上抵触互联网技术的一些推广和应用。今天我们通过这些新技术,通过DT植入进去,快速把原来落后的技术提高一点,这也是今天我们的愿景所在。

  事实很骨感,愿景很丰满。事实是什么?有些谈到工业大数据,小公司、小企业,先忽悠起来,风投一下,先炫一下。数据的实时和在线,这就叫做工业大数据,这也是一部分,但是源源不仅仅是这些。坦白来讲,某种场景下,对于很多企业我们只能做到第一步。第二步,从中期的木来看,还是需要把激励模型和数据模型相结合,因为现在确实数据模型的不可解释性非常多,很难的是说给到专家先解释,为什么?我们只能说,我也不知道,我看到的就是这么一个结果,数据推出来就是说这两个之间有关联,为什么有关联?这个沟通上有成本,需要跨越和解决。

  从长远来看,我们不是要取代谁,其实今天的专家、工人是最好的,我们学习的最好的老师。我们是人机协同,是人机结合,不是我们取代了谁,今天人做不好的,机器也不一定做得好,我们是一个融合的过程。但是,背后有几个阶段,这张图不是我的,是李文老师的,我拿来用一下。分为几个阶段。第一个阶段,或者整个数据上云的过程。第二,从数据角度关联和打通业务。第三,基于业务的打通之后,形成我的工业智能化的一些场景,供需智能、产线智能、设备智能和营销智能。第四,这些知识沉淀需要跟数据模型相结合,再结合一些微服务也好,或者端的能力,形成云端的联动,并且把这部分的能力对外进行输出,最后形成第五阶段十万工业APP就有了,生态就有了。因为今天没有微服务也好,或者云端联动的这些数据架构出来以后,所谓的这些生态,这些APP工业的场景,使我们的工业APP弯道超车仅仅是一个梦想。所以,这五个阶段,一个阶段都不可以少。

  阿里云做了一些实践,这些实践都是我们上车间做的。基本上前期都是大项目,就是那种坐在客户现场做外包,就是说的接地气一点,我们做算法的外包。但是,我们不能把这个项目做成一个说,做完了就拉倒,从第一个项目开始做一年,我从前年初,大前年底开始做了一年的时间。然后到中策这个项目做了半年,再到天合光能,整个产品的服务化、产品化就出来了。有些人问我们先谈哪些行业,当然我们有选择,我们的选择来源于客户的诉求,这是我们的价值体现。我们今天看一下深度学习的LSTM模型的时候是一环套一环,当它投射到工业领域的时候,我们要把我们的数据模型沉淀出来,变成一个躺平的服务支撑一个不同的行业,这才是今天站在科技公司、数据公司、互联网公司需要做的事情。阿里云工业大脑提供什么,先解决数据,这些数据不仅仅来自于设备,还来自于在座的各位找的那些外包公司,无论是东软、中软,他们做的信息系统,来自于SAP的ERP系统,还有可能是很多定制的MAS(音译)。这些系统和套件使得他快速的上云,做一些调度,让他们躺在该躺的地方,这一点非常关键。刚才讲到数据,数据体系工业数据“总线”,因为原来在场景下,原来做工控开发的时候都有现场的这些“总线”,我们今天也有是大数据“总线”,我构建出这些表的关系和关联是为了方便我更好的构建出我的模型,这才是体系化和系统化做这件事情,这是为工业单独定制和服务的,不同于我在任何一个新零售也好,不同于原来我们在供应链,B2B的场景也好,这是我在制造业这一块新做的。

  第二部分就很关键了,大家都是同行,做这个的时候都会知道,今天你做的模型和我做的模型到底差多少,大家心里都有点数的。就拿图像识别而言,大家都大差不差,也许我标注的好就好。说我一定比你强多少,可能是个问号。但是,今天有一点不一样在哪里?你的算法,你的模型有没有产品化,产品化意味着什么?意味着你的合作伙伴能不能拿你的模型配置和更改,快速服务于另外一个京东,这就是对我们数据模型算法进行产品化能力的一种考验,这些事情很不好做,做的事情以至于我自己用起来都会觉得很困难,为什么原来我只需要很快的写出来一段代码的时候,今天为什么让我来配?是我们要把这部分能力进行普惠化,让原来工业领域的工程师也能够快速的用上这部分能力,这才是普惠。而且在这个过程当中,还是得把我们的一些理解对标原来的POM和PHM,我们做一些轻量级的设备智能运行的产品化,我要把单点的算法能够进行系统化、场景化的串接在一起,帮他们能够用起来的新的SaaS。

  如果我需要定制怎么办?在座的如果说咱们做过工控协议的开发,或者工业APP的开发,都知道一个产品,拖拖拉拉是不是很好,或者说是很方便。而背后我们有没有可能在人工智能这个角度也做出类似的工具,能够让我拖出一些组件,拖出一些让原来工程师能够理解的组件,试完安装进行分析,分析完再做良品率的预测,良品率达到90%再计算一下参数是多少,再之后有一个业务编排的感觉在那里。

  我们画架构图,我现在是越画越简单了,现在堆出来的是我们核心的几个体现,底下三层接入数据,构建数据工厂,构建算法工厂,这是我的底座。统统往上走,形成业务编排,再往上走形成工业APP,SaaS层的支撑的这些技术,最后是赋能。

  当传统的科学实验遇到工业大脑,总会有一些碰撞的地方。原来的机理模型从前往后,现在数据同后往前。比如我们发现了导轮的问题,导轮十块钱以下很便宜,因为便宜,所以潜意识会做很多假设,不重要,涉及不到良品率,或者安装的时候不小心。但是,往往我们通过数据梳理这些关键字的时候发现你的导轮虽然很便宜,但是因素的等级也很高,甚至进行安装的时候都需要假装一些特定的震动器测测当时安装时候的数据表现,来看它安装是否到位,甚至不要觉得它便宜。我们有一个“幸存者的偏差”,等等这些都是挑战原有惯有的思维,这才是数据的价值所在。

  我发现几个矛盾。

  第一,传统行业日益增长的诉求和基础数据之间的薄弱。我的理想很丰满,现实很骨感。虽然制造业转型迫在眉睫,你想快真的快不了,今天坦白来讲,属于那部分在信息化和系统化做的比较好的这些人,虽然很多时候我们讲弯道,或者换道超车,但是先发优势就是优势,已经有优势的那些企业,如果跟下来,继续保持优势。

  第二,企业诉求与服务能力之间的矛盾。企业诉求也不是单点的,是要帮我解决问题,所以你解决问题的时候用到了什么手段,需要你来帮我回答。

  第三,智能的渴求和价值安全的不确定性之间的矛盾。一方面都知道这个事情是好事,一定可以帮到我的,潜意识里,领导人也好,企业负责人也好,都有这么个意思。但是,真正做的时候,先签保密合同,先罚一百万,只要数据发生泄露,要给我先拿出一百万,这些合同上就这样写出来。我说我要你数据干什么,你脱敏也好,该怎么处理就怎么处理,他们很担心我们这个是国家级的,或者我们这样一泄露就会怎么怎么样。这个数据泄露这种数据非常敏感,我们也会进行交涉,他目前担心这样的问题,说不见兔子不撒鹰。说你们先投入3个月做这个事情,3个多月下去了,效果达到了吗?是不是另外一个厂区也有效应,不断在摩。很多时候我们需要为这些风险也好,不确定性也好勇敢的做出尝试。

  第四,传统工业理念与互联网思维之间的矛盾。我们一直讲的确定性,做事情最大的是控制确定性。互联网企业是小步快跑,不断的迭代,而工业领域是不一样的,他们开弓没有回头箭。我们需要这两个融合起来,尝试迭代,新创新。

  第五,定制化诉求很多。每家企业哪怕是40多个大行业,和500多个小行业,哪怕是同一个行业里面的两家企业,他都会说,我们跟他们不一样,强调自己的独特性,这个我懂,我知道,我也没说我就理解你了。我只是说,因为我做过类似的,我想跟你一起谈谈新的场景,我怎么帮你更好的做好。

  这样的过程当中需要对我们服务性的公司有考量,你的技术和产品能不能具备那样的兼容性和稳定性,产品化,这样才能不断的、持续的、快速的、高质量的交付,才能保证我们服务于先进制造业的这么一套效率。

  所以说,数据本身如果不动,那就是成本。我们要把原来的沉睡的这些数据动一动,挖一挖,把它们扔在云计算的熔炉里面,用人工智能的催化剂催化化学反应,形成新的能源、新的价值反哺给我们的工业。

  原来我们做制造是用什么?是用物体跟材料的这些能力来制造功能。一个水杯,一只笔,制造一些功能、工具。我们希望明天的制造是用智能科技来重塑价值和体验,谢谢大家!

0