>>返回主页
优云数智CTO王璞:业务场景驱动,Iaas与PaaS融合成常态

2018-08-15 10:15

1534313304937.jpg

  大家好,我是王璞,优云数智是我们UMcloud新的名字,今天主要讲一下IaaS和PaaS的融合。

  最近Gartner的前瞻性还是不错的,据去年的报告显示,IaaS、PaaS包括SaaS融合,它们从两个维度来讲,一个是横向的维度、业务的维度,上面的前头指的,不同的业务领域,机器学习、电商包括游戏、社交网络等等,不同的领域跨了很多领域现在都对云有很大的需求。

  另外一个维度纵向的维度,英文写的是up the stack,因为最早IaaS用的是openstack,中间画了一个PaaS层的叫software  infrastruture,软件基础设施这一块,它用的非常准确。到2020年,只有提供IaaS、PaaS和SaaS整体解决方案的厂商才能占据云市场领导地位。我个人是非常认同这个趋势的,那么这个趋势怎么理解?因为讲的还是很抽象的东西。这里我看一个真实客户需求的图,真实客户需求不仅要IaaS还要PaaS,而且PaaS层的东西客户要的是非常多的,除了通用的管理类的东西,租户管理、运维管理等等,还需要安全,安全是强需求,另外客户还要很多很多新的东西,微服务的东西、大数据的东西、AI的东西,客户都通通归到了PaaS层。

  再接下来一些开源的技术主页,mySQL、数据库等等开源的组件,接下来都是对PaaS里面的应用,比如资源管理、调度等等,整个这张PaaS就是Gartner刚才画的,全是软件,PaaS层没有任何的硬件,PaaS层这些东西包括PaaS层自己解决不完善,比如数据库mySQL一定是以来存储的,存储这些东西存储层自己解决不了,需要底层IaaS来提供。还有大数据框架,有技术层也有存储层的需求,存储层的能力PaaS层解决不了,还需要IaaS解决。再比如现在比较热的AI的应用,不仅是计算密集型,对于很多IO也是密集型,比如对于网络、对于存储又有很高的需求,网络的需求PaaS层解决不了,还需要IaaS层解决。什么叫IaaS层和PaaS的融合?本质上我个人得理解就是又是另外一个维度的计算网络存储这三层的融合。

  首先计算层的很多东西更多是软件层的、更多是不同的应用场景,现在PaaS层会管理越来越多的应用场景,很丰富的应用场景。计算的场景可能不局限于虚拟机了,可能虚拟机仅仅是IaaS提供的一种计算场景,更多的计算场景会在PaaS层展现,像大数据、AI、开源组件等等这些东西包括微服务这是更加丰富的计算场景,PaaS会来管理和提供这些计算场景的支持,但是光这些计算场景PaaS去管理,管理不完,因为还有存储和网络的问题,存储和网络先天就是IaaS做的比较成熟的部分,这样的话,IaaS、PaaS深度融合,从企业客户来讲,更多从应用场景看,比如客户提出来,AI的场景、大数据场景、每个应用场景的计算服务网络要深度整合,彻底解决每个计算场景的计算存储网络的问题。如图这是一个真实客户需求,他怎么要求IaaS和PaaS的深度融合。

  接下来讲一点点在构建IaaS、PaaS深度融合方面的一些实践。

  目前我们还没有做到IaaS、PaaS加上SaaS的深度融合,目前还没有触碰客户业务场景,这是一个优云数智的产品层级,最上面是给客户提供云的产品服务培训,下面的支撑有基于容器的解决方案,有基于openstack的解决方案,有行业的解决方案,还有存储的解决方案,基本上优云数智想解决的问题是从客户的应用开始往下,所有的计算存储网络的问题都要解决,所以是一站式的私有云的解决方案。我们之前做了一大堆的客户如图。

  简单讲一下我们的产品是怎么搭起来的?首先IaaS的东西是基于openstack,这个技术基础平台,起了一个名字UMOS,容器的东西也很简单,叫DMOS。再一个是存储,因为现在很多应用,之前我们和很多企业客户沟通,企业客户很多应用做不到无状态,不能像很多互联网公司一样,很多应用是无状态的,无状态的应用上容器上云很简单,有状态的应用上云上容器比较复杂,有状态的应用需要存储的东西,很重要的存储的工作是要场景化的支持各种各样的应用对存储的需求,大数据的应用对存储的需求有什么特点、AI的应用对存储的需求有什么特点,其他的数据库、缓存对于存储化的应用有哪些需求?性能比较高的场景下我们利用一种是快的方式,另外一种,对于不同的应用之间有简单的数据共享,但是对于IO要求不高的,我们提供一个NFS,文件共享的方式。更复杂的场景,大数据场景需要对HDFS支持,我们直接对存储提供HDFS的能力。

  再有多云的管理,云管平台,因为目前企业内部云的基础设施越来越多,怎么做到统一的管理?比如有openstack等等怎么统一管理。这个IaaS和PaaS深度融合的平台,它给客户要带来什么样的实用上的体验,最根本的就是三条首先要部署很简单;因为这些IaaS、PaaS里面东西太多了,开源的组件非常多,一不小心开源组件上百个,部署上必须非常简单,上百个组件的部署,不能纯脚本的刷,必须有系统性的部署方案。接下来要稳定,因为openstack和kubernete软件太多了,适应性要强。很多传统的东西上云不是容易的,怎样让云适用性更强,这是落地IaaS、PaaS最主要的一点,要支持主流的虚拟化架构、主流的商业存储、SDN方案、支持大数据、AI深度学习场景等等这些,其实一句话讲就是让IaaS、PaaS的平台更加简单好用这是最根本的一点。

  刚才简单的讲了一下IaaS、PaaS产品层面的东西,更重要的一点,这些产品层面的东西落地下来怎么实现IaaS、PaaS深度融合的解决方案解决客户的问题,我简单列举几个:

  第一个方案是存储的方案,目前很多企业内部对存储都是很头疼的需求,因为数据太多存不下,总有想存的东西,比如我跟很多金融行业的客户交流,他们的IT系统的日志存的时间都不太长,短的话就存一天三天,长的话也不过存一个月,顶多一个季度,超过一年的日志保存很少,为什么?其实因为存储的价格下不来,比如很多业务系统的数据还都不见得有地方存,平台的IT系统的日志更没比较存了,怎么实现一个廉价海量的存储?这个业内现在有很多方案,主流方案可能是软件定义存储,但是这时候又有一个悖论,我们发现定义存储,从存储空间上来讲,不见得比传统的硬件存储有优势,这是现在软件定义存储面临的很大的问题,成本没下来。成本没下来归根到底是规模性,举个例子,比如现在软件定义存储跟磁带价格还是高了很多的,当然磁带唯一的优势就是便宜,磁带的维护成本非常高,定期要检查、要倒带。软件定义存储最大的好处是可扩展性,它的架构可以做到很大的横向扩展,比如我们之前帮一个客户做30PB的存储,快存储的方式实现起来就非常痛苦了,很难做到这么大规模的横向扩展。

  刚才讲的价格是一个因素,另外一个因素,软件定义存储目前要解决的很大的问题叫统一存储,统一存储怎么理解?企业客户内部有各种各样的数据从各种各样的接口需要读写,比如很常见的NFS的接口,再接下来大数据的接口、HDFS的接口,比较流行的对向接口S3的场景,还有RTMP流媒体的场景等等,这些场景客户目前企业客户内部都是不同的协议,各自读写各自的定义,比如大数据的场景NFS的场景,能不能做到不同协议之间,NFS写进来的数据被S3和NFS读走,NFS写进来的数据能够被HDFS读走,我们现在做的就是能够跨接够解决异构接口之间数据共享的问题。

  有了数据湖的共享方案,上层再提供大数据的能力,这个大数据的平台叫安全屋,为什么叫安全屋?因为很多大数据的场景目前在企业客户内部跟安全的结合太弱了,我们把安全能力和大数据处理能力结合起来,大数据的处理能力都是通过容器化的方式提供的,底下的存储是通过软件定义存储,结合各种接口的数据,NFS接口写进来,或者S3、流媒体、大数据接口写到统一的平台,再统一交给HDFS把所有接口写进来的数据读走交给大数据处理,处理完再写回去。这样不同的各种各样的场景留灌的数据都能处理。

  再一个,AI的场景,目前来讲很多企业客户内部都希望落地一些AI的应用,AI的应用有两个场景,一个是训练场景,一个是AI模型推断的场景,目前很多企业客户内部不见得有大量的AI训练的能力,因为AI训练对于计算是非常密集型的,需要很多GPU的资源,很多客户内部希望有AI推断的能力,简单讲就是人脸识别、语音识别、自然语言处理等等,可能是模型训练好之后应用到实际的业务场景,这都是AI推断的,AI推断的时候怎么管理AI的模型?比如定期的模型有更新,模型之间怎么校验、怎么灰度,对AI应用有一个灰度管理的能力。

  再一个AI训练的能力,有些比较大的客户,它内部AI的集群具体讲就是GPU的服务器数量也不少,少的几十台、多的上百台,目前深度学习GPU应用怎么做到云化的管理是很大的挑战,GPU目前绝大部分的训练方式还是独占甚至很多场景下的GPU深度学习的训练还做不到分布式训练,这时候我们怎么提供一个按照云的方式管理这些GPU应用,比如利用容器的方式调动深度学习应用实行云化的管理,更合理的使用训练资源。再利用容器的能力提供一个AI推断的服务,让不同的AI推断的模型能够在线上做灰度。这样一个能力对于企业客户提供过去之后能够很方便的,首先帮助企业客户落地人脸识别、语音识别的应用,因为现在人脸识别、语音识别已经比较成熟了,可以应用到工业化的领域了。像训练的领域,对于绝大部分企业客户来讲,它没有相应的能力,但是对于一些大的客户,内部有些GPU服务的,有不少GPU服务器的话,这些GPU服务器的管理需求其实是目前要解决的刚需的问题。

  这样的话我们搭建一个云的平台,把这些能力赋能给客户,客户很方便利用AI解决它的业务场景的问题。

  基本上我简单介绍这么多,一句话讲,IaaS和PaaS的深度融合,本质上就是要按照不同的应用场景,比如大数据场景、AI场景、微服务场景,不同的场景一揽子解决所有场景里面计算存储和网络的问题。

  谢谢大家!

0