>>返回主页
百度副总裁侯震宇:面向AI+5G的DC基础架构升级

2019-09-03 10:35

侯震宇.jpg

  各位领导、各位嘉宾,大家上午好!今天,我想跟大家分享在AI、5G这两个大的浪潮下百度的一些看法,以及我们在将来的一些投入和布局。

  过去十年、二十年互联网和移动互联网的发展,逐渐改变了我们的生活,改变了我们获取信息的方式,也改变了我们消费和娱乐的方式。用户的流量习惯已经养成,并在场景上不断进行拓展。从全球来看,中国互联网在终端娱乐层面发生了非常大的变化。在PC互联网时代,我们这一代人更多玩的是一些偏单机类的游戏和一些局域网类的游戏,比如像CS;而进入移动互联网时代,大家开始会在手机上玩连连看这样的简单游戏,以及各种类型的复杂游戏;4G后期又发展出来的众多短视频、小视频之类的流行应用,比如“好看视频”就是百度推出的一个广受欢迎的短视频应用。

  相信在5G万物互联的时代,5G手机、5G终端会给大家的生活带来更大的变化,它将成为一个更加智能的载体,承载高密度、高交互的内容,通过VR/AR等类似的技术,能给我们的娱乐带来非常大的变化。流量需求会变得无处不在。

  以视频为例,大家都知道4G激发了视频爆炸性的增长,特别是在小视频或短视频领域。大量的直播业务,包含很多的效果加成,很多都是用AI来做的,比如加一些特殊的衣服道具。在安防领域、娱乐领域,百度持续给大家提供视频的解决方案,既包含视频的AI处理,也包含视频处理所需要的各种非常重要的资源。5G让整个信息的内容变得更高密度化:清晰度更高、流畅度更好、帧数更多,交互方式更加灵活。这一切都会给我们的基础设施,包括CDN网络带宽上都带来非常大的挑战。

  基于在用户层面上一些变化的分析,在新一代数据中心领域,在整个流量层面上,在用户侧的流量层面上,以及客户侧带宽的需求上,都在发生爆炸性的增长。这就需要我们的数据中心在多元化的场景下,能够覆盖这种应用,所以它还要有更好的、更强大的算力。当规模变得更大的时候,我们需要更多的关注资源协同和整体效率。这一切都是数据中心领域面临的非常大的难题。

  面向未来,百度会把数据中心做一个全面的升级,包括在数据中心计算侧的布局层面上,比如我们用传统的IDC,云端这一侧,我们会有一个从分散到集中,再从集中到分散的统筹布局,同时,我们也会在边缘节点上进行更大的投入。

  随着百度云的快速发展,业务的需求变化变得非常快,IDC的交付模式也需要有一个非常大的升级,比如说我们必须要做到能够更加快速的交付,以前数据中心从建设到交付的时间可能动辄要一年多到两年,我们希望把它压缩到一年以内,甚至压缩到十个月,这对数据中心的设计,包括建筑、机电的设计,都将带来非常大的挑战。

  在数据中心内部的基础设施层面,比如网络层面上,我们需要把基础物理网络和虚拟网络做到真正的融合打通。这对我们来说需要一个混合部署解决方案,部署我们的整机柜,部署我们的标准机,这些变化都发生在数据中心侧。

  另外,针对AI业务,AI加速器GPU功率非常高,非常耗电,这要求数据中心的功率密度比以前要有大幅度的提升,现在市面上数据中心大部分机架都是20A左右的,百度的数据中心用的标准则是40A的,后面我们要逐步把它拉到80A甚至到120A,这样能使我们机柜的利用率、功率密度变得更高,实现数据中心系统架构升级。

  我们相信这是技术发展的必然趋势。我们也希望业界的朋友们能够联手起来,把IDC侧功率密度真正做上去。我们需要更加高效的供电,包括从之前的高压直流,发展到现在的48V BBU供电,供电架构在逐步升级。另外,有了高功率计算就会产生更多的热量,所以需要更加高效的冷却方式,包括从传统的风冷发展到液冷。我们会在数据中心领域,在内部做更好的一体化监控,并应用AI技术实现智能控制,让我们服务的质量更高,让我们的服务变得更加智能,变得更加绿色环保。

  这就是我们新一代数据中心基础架构的全面升级,未来的计算,在5G和边缘大发展的时候,核心应用和核心计算会发生在诸如智能设备上,比如5G手机,IoT设备,也会发生在距离用户侧相对更近的边缘端,而更大型的计算仍然会发生在Cloud上,因此百度在进行基于Device、Edge和Cloud全方位的布局。百度有自研芯片,板卡技术,以及我们支持到更多更先进的芯片层面上、系统层面上互联的技术,让我们的计算能够运行得更好。

  谈到计算,我们有为弹性而生的智能计算架构,云计算一个基本特性就是弹性,而5G和AI会触发更多新的应用诞生,这些新的应用会有更多的高功率、高密度的特点,将带来和以前的传统互联网的很大不同要求,其中一个非常重要的要求就是弹性。

  同时,在基础设施上为了应对这些新的挑战,百度自研了新一代硬件X-Man3.0,还有面向新型的存储介质和高效互联的架构,再往上,各层面上的优化,包括性能优化,包括集群调度优化,也包括面向开发的编程框架层面上的优化和设计,比如PaddlePaddle。

  有了计算,就一定会有计算的流动,不可避免的是我们需要发展更加先进的互联技术。百度现在IDC内部的网络技术已经从小规模发展到大规模,到面向敏捷网络的第三代,第三代里面有很多新特性,比如智能网卡,我们自研的交换机,支持RDMA,这些都会給我们的应用侧带来非常大的变化和优势,在基础设施和应用层面上都会有更好的协同。

  在节点更细粒度的芯片层面上,我们做了多层次的快速互联,以实现不同类型的计算,比如纯粹的高密度计算,或者高密度存储之间的通信,以及高密度计算之间的通信,这些都给我们的架构带来很大的挑战。

  最后,跟大家分享5G以及伴随着5G的边缘计算,这些会引领计算侧和互联侧的革命,以云数据中心为核心的边缘节点,边缘节点所使用的网络技术和Device节点使用的网络技术,算力、带宽、延时都有不同,这一切都給我们的基础设施带来了非常大的挑战。因此,我们要把这些基础设施建设好,就能更好的支持在5G时代的应用,让我们的生活、世界变得更加美好。

  我的分享就到这里,谢谢大家!

0