>>返回主页
思科中国研发中心首席技术官、思科全球卓越工程师 苗凯翔 : 大数据与雾计算:端到端工业互联网的重要趋势

2018-02-01 16:20

  大家好,大数据是需要平台的,大数据平台好像是云端的,但是还不够,有一些新的想法。主要是几个想法,一个是大数据平台的演进。第二,雾计算产生了。什么概念?第三,把雾跟云放在一起,端到端的工业互联网平台,这样里面有一些特点。

  大家知道工业互联网可以说是第四次工业革命,很多人都这么看,它有什么特点呢?因为已经有一次信息革命了,这是第二次信息革命。但是,是完全不一样的,因为它是一个新的潮流,从信息进入到智能,这是一个关键点,信息可以处理数据,一些简单的融合。但是,往前走,智能化是很重要的一个方面,落到这一点,一定要全面的融合。目前下一步往前走,工业互联网到底是什么状态,到底具备什么?

  总体来讲,从技术来讲,因为工业互联网可以从两方面看,一方面是IT技术演进,另一方面是传统的工业里面的自动化、OT方面。从技术方面看,基本上这些技术绝对是需要的,云计算、雾计算、大数据、人工智能、安全、网络、连接都是需要的,它们一块在一起形成的技术能够做工业互联网。

  工业互联网的核心还是围绕数据,因为数据代表真正的场景,真正要解决的问题,怎么样体现价值。所以,我今天讲的话题是平台怎么支撑,平台到底长什么样,跟过去的大数据平台到底有什么区别,难点在哪儿?所以,数据、价值,最后变成真正有意义的各种商务上的东西,或者是收益,我们看到了效率提高,所以都是为了各种价值的产生。所以,这是核心了。

  这样就牵扯到数据稳定,因为今天的话题是大数据,所以我从大数据开始讲,因为我个人也是从大数据出身的,我过去一直在大数据公司做了几年的VP,非常了解大数据整个的生态环境、生态系统到底意味着什么东西?

  总体来讲,这页总结一下大数据,可以说从现在往回看几年演进到今天,里面有各种各样的东西。Hadoop本身,几年前是一个革命性的东西,因为它是把计算跟存储融合到一体了,分布式的,哪些有存储,哪儿就有计算,同时也覆盖了各种功能,性能跟功能和能力,比如说数据的导入导出,数据的预处理,数据的预处理、分析,存储和分析成为一体这么一个架构,完全一个全新的概念,全新的架构。前几年大数据非常重要,现在大数据冷下来了,因为大数据本身作为话题来讲,确实老了很多,但是大数据作为一个平台来讲,没有停滞,还在往前演进,已经开始发生了。

  我的理解,大数据平台也是“摇身一变”,变成一个AI的平台,人工智能的平台了。为什么呢?因为AI取决于数据量,比如左下角这个图,没有大数据就没有今天AI的效果,大数据实际上起了一个关键作用。第一,数据量大了,才能真正做AI,否则做不了真正的AI。第二,Better Hardware。因为系统便宜了,价钱下来了。第三,算法改进。大数据还是非常非常重要的,大数据是一块,然后你往前看,什么算法、AI都可以做了,所以不能把它分开来看。

  举个例子,我在英特尔做了16年,所以对英特尔非常了解,英特尔最近推出一个新的东西BigDL,搞出一套技术来,不用GPU,这是典型的代表,Standard Spart,是基于过去的Hadoop搞出来的,机器学习,现在又加入了深度学习,这是非常典型的例子,怎么做AI,在传统的Hadoop上面做AI。这是一个很好的例子,拿出来讲讲。我离开英特尔公司三年多了,但是现在还是很看好这个方向。因为GPU还是蛮贵的,如果性能要求不是特别高,完全能够满足,所以它有一定的空间。大数据的演进这是一个话题。大数据从大约四五年前到今天,已经是工业互联网准备好了,可以入网。所以,你要基于它去干很多东西,分析也好,我觉得是很重要的平台的一部分,但是主要还是一个后端云的平台。但是,去年IDC跟Gartner都发话了,说云是不够的,往前走,IDC去年说40%的大量数据将被存储、处理、分析。Gartner去年说是50%。雾计算我觉得相当于刚刚开始,还没有真正发生。还有像石油勘探,在很远的地方勘探石油,像风能,这些东西数据量太大,没有网络。所以,各种各样大约有六七个原因,为什么说今天被认可了,现在开始发生了,这是原因。现在有很多大家都在关注,甚至很多客户都觉得这个东西好,但是各方面还没说,特别是架构方面。

  现在思科也是第一个有平台了,把雾部署到现场,部署到工厂里面,这么一个平台,可以支撑很多很多节点,这是一个很重要的方向。所以,雾意味着什么?接地气,不是说数据中心,几百公里以外的事了,几千公里以外的,它是一个我哪儿需要这个计算,现场就有了,工厂里面,很明显,工厂里面,大街上。你这个采集数据,视频监控,但是还没有正式化,架构还没有到位。下一步可能会有一个大的发展。

  还有一个概念就是边缘计算,这两个是连在一块的。看你跟谁谈这个问题,从思科来讲,边缘计算就是传感器,然后是雾计算,雾计算是各种平台,可能是成千上万个节点一块干一些事情,每个节点可能是一台服务器,几台服务器,一个网络设备,现在网络设备也有处理器,刚才提到规模会很大,可能从几个节点到几千个节点,上万个节点,是一个分布式的,怎么真正的管起来,安全各方面还是一个很大的事。所以,雾在发生。刚才提到“霾计算”,那个就算了。

  所以,总结一下它的一些特征,都串起来,根源、雾、云,这样整体的端到端的架构,这样才能真正的满足工业互联网的要求。而且架构是一个比较灵活的,不一定非得有,直接部署云也可以,是一个可以灵活性部署的架构。但是,给你场景需求,我就得要。我觉得从现在开始,五年之内的演进应该是很快的。分布不同,各式各样看你怎么用,达到一个最优的架构,这肯定是方向。应用场景很多,这一块做了很多案例了,思科现在第一个是真正有一套全套的方案,已经开始有案例在做了。

  所以,有了这个,再看一看它的挑战。就是说,第一比较复杂,数据中心、多台服务器端出来,虚拟机怎么管,这是分布的,网络很重要,网络安全,网络性能各方面,自动管理,这都是系列问题了,所以还有很多挑战,不细讲了,所以还是一个刚刚起步的状态。

  然后,思科的产品叫CISCO Kinetic,就是雾。需要把数据拿过来,数据里面进行分流,怎么样管理数据流,他们之间怎么处理,雾里面也会干很多数据相关的东西,比如说可以把一个月的数据存到雾里面,所以这个数据量也很大。所以,大数据最终来讲不光是数据中心,大数据平台的事,雾里面也会有相当一部分数据,看你的场景和需求。

  根据我们现在做的很多项目,所以目前要做工业大数据有端到端的架构了,某个应用场景,特别是目前来讲看到工业界的状态,挑战一就是数据怎么进来。因为各种设备,各个企业,它的千差万别。所以说,有多少不同的协议需要,第一个能把数据弄进来,看不见的数据,能看得懂,然后还是挖掘,价值的挖掘,那是下一步了。所以,工业界的状态,现在来讲,最近我们做了很多项目,还在第一个阶段,把数据弄进来,把数据弄懂,这是现在不变的状态。然后智能化想出这些点子来,这是下一步,现在还没到这一步。所以,这个关键点在哪儿?因为现在有两大块,一个是IT,一个是OT,相当于是两个非常不同的时期,非常不一样,他们的语言不一样,东西也不一样。他们共同的点就是数据,数据是他们连接的纽带,数据也恰恰是工业互联网的核心。所以,数据怎么进来,这个是能够看,能够听,然后怎么分析。

  所以,思科有很多可以在这方面帮助客户解决问题的方面,比如我们跟伙伴一块,也能支持很多协议,几千个协议,基本上市场重要的需求都能支持,否则花几个月就把数据弄懂,这个划不来。然后数据的预处理,数据格式各方面,然后进行分析,可以帮助这方面走的更快一点,这个是我们这个平台能带来的好处。

  这也是一些思科的硬件,它里面跑的一些软件,有这个大数据平台都可以用,把各种算法用起来,否则数据没有到位,干着急,这个也发挥不了作用。

  所以,串起来之后是一个端到端的,这就是具体架构了,雾是Kinetic,然后云,后面有传统的Docker,然后AI,各种各样的硬件,全面解决工业互联网企业内部具体的问题,第一就是把数据用到位,进行一些具体的分析,写一些应用,进行数据探索。

  刚才提到可预测运维非常重要,特别是之中线的运维,各种设备的运维,这都是很普遍的场景,这个我们也做了很多。还有就是化工厂里面的气体泄露,因为大的化工厂有很多气体,这些气体可能会发生危险的状态,要用监测系统感知出来,传感器判出来浓度是多少,然后进行分析、建模,到某种程度临界点了要停,这也是很重要的一个场景,这是我们在新加坡还是泰国的一个项目,具体项目。这个图片上面是实时数据可以看到它的变化。

  大家知道Zeepelin,可以跟数据直接交互,写代码,通过大数据做文章。谢谢大家!

0