>>返回主页
北京忆恒创源科技有限公司产品副总张泰乐:NVMe SSD在数据中心的应用

2018-10-16 15:40

张泰乐.jpg

 大家好,非常高兴在这里给大家介绍一下Memblaze公司和我们的一些产品和我们在数据中心的一些想法。

 介绍一下我们这家公司的背景情况,Memblaze是一个北京的企业,我们叫北京忆恒创源。我们是2011年成立的,到今天已经有7年时间了,我们7年只做了一件事情,做PCIe-SSD,我们前后交付了六代产品。我们这家公司是国内最早开发SSD的企业,也是国内最早发布NVMe SSD的企业。现在有些更新的创新,包括边缘计算型的SSD,Memblaze2015年在中国率先首发了NVMe SSD。Memblaze在海外已经销售了10万片NVMe SSD,Memblaze也是一个本土型的企业。

 我们立足在中国,我们中国市场的销售量这么多年积累下来也有10万片量级的规模,我后面会介绍一下我们在中国市场上现在已经差不多有600家企业级客户。我们在中国大概有两个大的研发团队,一个在北京,一个在上海,还有分布全国各个城市的销售,我们完全是中国自我研发、自己成长起来的土生土长的企业,但是我们的产品不仅在中国销售,也通过我们的合作伙伴向全球销售。

 我们为什么要做这个产品,或者说我们在七年以前或者2011年的时候我们为什么要创造这么一家公司,来创造这么一个产品,我们到底想要做什么,这要看一看我们所处的时代,我们现在处在一种数据极度快速膨胀的时代,第一个叫做计算机时代,我指的是2001年QQ普及起来的时代,当时一年全球大概产生2500亿GB的数据。

 大概是在十年以前,苹果公司非常天马行空的推出了iPhone,把整个人类带入了移动互联时代。在那个时代,数据从2500亿GB瞬间成长到了7万亿GB/年,但是今天我们进入了大数据时代,我们在谈的不仅仅是移动互联了,我们在谈的是IoT,在谈5G,在谈AI,在谈很多新的信息,使得我们现在一年产生的数据到达了22万亿GB,到2021年我们称为万物互联时代,相信那个时间点5G、IoT、AI、自动驾驶,很多我们现在谈的技术那时可能已经落地了,大概62万亿GB/年,这个数字太大了,大到我们已经没有办法想象了。全球差不多70亿人,每一个人一年要产生差不多1万GB的数据。

 我们要怎么研发我们的产品,社会的需求是什么样,用户的需求什么样,我们怎么研发我们的产品。我们自始至终就立足两个点去研发我们的产品,第一个是性能,Memblaze从第一代,大概七年以前我们的第一代产品有35万IOPS,非常高的性能,那时候是超过全球所有的友商的产品。到今天已经突破了100万IOPS,做硬盘经常讲的数据,一秒钟可以访问硬盘多少次,现在可以一秒钟访问硬盘100万次。性能大有什么好处,因为我们的硬盘变得越来越大,U盘过去可能16M,现在U盘已经1T的U盘,数据增长非常快,每GB的性能要求非常高,每个硬盘上承载的业务、承载的数据量越来越大,所以现在需要很高的性能。

 另外一个,功耗与能耗比,我们现在生活在一个万物互联,我们的数据中心极度扩张,很难用传统的集中式的方式,这时候能源效率变得至关重要。基于这个方向,Memblaze最近有两款产品推向市场,今年6月份刚刚推出两款产品,一个是910/916系列,它是面向高性能优化的,它有100万的IOPS,有6GB/s的读写带宽,4KB写延时11微秒。另外一个是PBlaze5 510/516系列,希望能更省电的推动高性能,3.0GB/s的读带宽,只有10W,这就达到了传统的2.5寸硬盘的功耗,对于服务器设计人员来讲,你不需要为SSD做特殊的散热设计,只需要用传统的标准的SAS的散热设计就可以,这是我们未来能够广泛超大规模部署的前提。通过上面的9系列产品,现在达到了10万级的部署能力,希望未来通过PBlaze5系列产品在未来三年达到百万级的部署能力。

 给大家看一下我们在至高性能上测出来的能源效率比,6GB/s读的时候大概14W,3.8GB/s写的时候大概18W,这是世界上目前已知最高效率的SSD硬盘。除去我们说的性能、能源效率外,我们做企业级SSD,企业级有很多企业级特殊的应用,举个例子,第一个,双端口,左边这个图是双端口的特性,传统来讲,分布式存储一般是一个服务器上或者服务器存储,服务器直接插SSD,但是在很多使用中还会到全闪存阵列、闪存阵列、集中式存储,对于这样的使用环境需要硬盘本身具有高可用性,一个硬盘可以同时被两个主控访问,任何一个主控失败,另外一个主控都可以承载这个业务。

 对于这个业务,(Memblaze)所有的硬盘都支持双端口特性,我们可以让两个主机同时连到硬盘上,任何一个主机出现故障,另外一个主机都可以接管硬盘,保证用户的访问是不间断的。我们这边开发了一个多命名空间的技术,使得我们存储的数据-多个不同的应用可以部署在同一张盘上,大家使用不同的命名空间,多个命名空间可以做QoS隔离和控制。

 最后一个是极速TRIM,传统的硬盘或传统的存储,当你删除一个文件的时候,它其实并没有向硬盘发出一个命令说把这个文件删掉,只是把指向文件的这个指针删掉了,数据还在硬盘上,当把硬盘删除之后,把硬盘扔掉,数据还在上面。有两个问题,一个是数据不安全,另外,数据还在上面,还占据着宝贵的空间,大家想了一个主意,TRIM,我们在删除掉文件的时候,我们同时告诉硬盘哪一部分数据我不要了,你帮我真正从介质上把它删除掉。对应的英特尔公司、三星公司都有这个技术,但是在企业级,我们经常要创建虚拟机、删除虚拟机,我肯定不希望我虚拟机里的数据被另外一个虚拟机访问到,所以我需要把这个数据从硬盘真正去掉,但去掉需要多长时间,传统的硬盘每秒钟可以TRIM掉300GB的数据,Memblaze可以一秒钟TRIM 8TB的数据,非常高效、极速、安全,用户体验非常好,这个应用对于企业级用户是非常关键的应用,我们开发了很多应用是专门面向数据中心面向企业级用户需求的。

 这三个只是我们所有能够实现的功能中的很小的一部分。我们另外还有些产品的功能,它是特别为某些大型客户定制的,因为某一些用户每个人有自己的需要,可能有的客户他不用主机驱动的,他直接用用户态访问裸设备,有些用户可能通过虚拟层访问设备,有的用户他可能有32个独立的虚拟机,每一个访问很慢。我们面向大规模数据中心的定制化服务,举三个例子,第一个是IO-D,不知道大家多少人有实际使用SSD的经验,当你在写的时候,发现在写的同时去读这个盘的时候,发现这个盘IO的延时抖得非常厉害,IO-D是把大的硬盘分成了小的块,对于大型数据中心的三拷贝或者多拷贝情况下,可以让一个拷贝进行读,另外两个拷贝进行写,等等这样一些特色的处理方式使用这样的技术,这个是IO-D,可以通过上层和底层硬件的配合,实现可控的延时特性。

 另外是多流特性,如果我有一个性有三个应用程序同时写一个硬盘,每一个硬盘都是在顺序写,其实我的硬盘会感觉你在随机写,因为我并不知道谁在写,我看到发的地址信息是乱的。用过SSD的人知道,顺序写和随机写对硬盘的伤害完全不一样,大概差3-10倍左右,如何让多个用户同时访问你的时候,如果每个人都顺序写能达到顺序写的要求,要检测,我们称为多流技术。最后是原子写,对于数据库访问会加快,会减少数据库访问50%的写入量,提升25%的性能,这种也是我们现在为客户做的一个应用场景。所有这些应用场景我这边只是举一些例子,这些例子说明我们其实可以为我们的用户提供定制化的开发。

 我们的产品不光是在大规模数据中心有部署,我们现在也在开始进行高密度存储,现在随着电力在每个数据中心的增加,我们刚才也看到,我也学了很多,液体冷却、电源封装技术,使得我们的服务器密度可以做得越来越高,SSD可以做到越来越小可以做到高密度的存储,还有双端口可以做到外部存储,我们的产品都可以有应用场景的。在过去五年时间,我们陆陆续续积累了差不多600家企业客户,这里面特别感谢大家,包括超大规模数据中心像阿里巴巴、京东这样的客户,也包括移动、电信这样的客户,以及一些行业和OEM的合作伙伴。非常感谢大家,也希望在未来Memblaze的发展中能够继续得到大家的支持!

0