>>返回主页
希捷科技中国区云及新兴产业总监农天使:人工智能和边缘计算时代数据生命周期的思考

2019-09-03 15:00

农天使.png

  尊敬的各位来宾,大家下午好。非常高兴与大家相聚在ODCC五周年,与大家分享我们在新时期对数据生命周期的思考。

  首先请大家想一下智慧农场是怎么样的,相信大家都对智慧城市有过很多思考,为什么我们要关心智慧农场这个问题?根据世界银行的报告,从现在起,按照世界人口的增长,到2050年,全球的食物需求比现在要增长50%。

  随着城市化的进程、耕地的面积以及农业人口的减少,都给食物的增长带来很大的挑战,更多是需要依靠新技术的发展。我们知道庄稼的成长是需要阳光、土壤、养分、水分还有病虫害的防治,在一个智慧农场里会部署很多自动化机械设备,部署很多传感器,以及监控摄像头。这些自动化的设备、传感器能根据庄稼的实际需要来监测土壤的酸碱度,土壤养分的含量水平,水分的含量水平。

  理想情况下,智慧的农场可以对庄稼进行按需灌溉、施肥以及病虫害的防治与干预。还可以根据庄稼实际的生长情况决定采收的日子,比如到底是25天以后采收还是30天以后采收。大家可以想象到这样一个智慧农场会产生很多数据,因为有很多的传感器和设备产生这些数据,而且这些数据又是实时发生,需要及时去分析和处理的。

  我国幅员辽阔,而且很多农场和农业基地都是远离北京、上海、广州的数据中心,如果把这些智慧农场的数据传回到数据中心,再把结果传回到农场,从成本和效率的角度考量显然是不划算的,因此更多是依赖于边缘计算。

  我们再来看一个无人车的场景,无人车一上路就会产生很多数据,包括GPS数据、激光雷达数据,还有在行车过程中动力系统的参数以及控制系统的参数,平均下来一辆无人车每小时可以产生超过3TB的数据。

  我们也知道很多无人车在研发和测试阶段选用的都是充电型的车,这些车在充电的时候,这根充电线能否也跟数据线合二为一,我的看法是:只有想不到,没有做不到。将来这些无人车完成测试任务以后,回到车库进行充电,同时把这些数据传给工程师进行必要的分析和处理,比如把紧急刹车的数据进行分析,进行一些必要的调校,让它下次继续上路,这也是边缘计算的场景。

  我们讨论了这两个场景,大家很好理解边缘计算是非常有必要而且是非常重要的。今年ODCC在春天也成立了边缘计算工作组,这也正是好雨知时节,当春乃发生。边缘会不会像有些分析师说的,会吞噬掉云呢?我们看一下IDC的报告,三条实线代表了端点、边缘和核心产生的数据的百分比,虚线代表了存储数据的百分比,橙色的是在端点产生的数据,浅蓝色的是在边缘产生的数据,深蓝色是在核心产生的数据,2018年在边缘产生的数据占了大概12%,边缘存储的数据大概占5%。

  到了2025年,边缘产生的数据能达到20%多,但是实际存储的数据也就10%。在核心,也就是现在很多的云和数据中心领域,它产生的数据可能不是特别多,但是存储下来的数据是非常多的。在2025年超过50%的数据会存在核心这一侧。因此我们可以看到边缘并不会吞噬核心,边缘和核心是相辅相成、相得益彰的。

  面向未来,业界是否已经对在端点、边缘、核心这些数据的产生、采集、传输、分析、存储、归档有了一个完整的解决方案?我们正在与行业合作伙伴共同努力去开发这样的一个解决方案。我们希捷在数据中心侧有关很好的解决方案,在边缘侧和端点侧,我们希望和ODCC的各位同仁一起,跟我们的客户一起,不断的研发和打磨新的方案和产品,来解决这些新兴的需求。

  如果高度概括,我们对数据的挑战可以总结为三大类。第一,不断增长的数据存储的需求。在2018年的时候,全球的数据量大概是33个ZB,到2025年,IDC预测会达到175个ZB。对于希捷来说,我们在此就会推出热辅助磁记录技术HAMR。第二,高可用性和低延时的挑战,在这里我们希捷有推出多读写臂技术,来保证我们的IOPS和每个TB的增长是线性增长的。第三个挑战,降低总体拥有成本TCO的需求,希捷推出充氦的硬盘,能够降很多功耗。同时有些客户也会用到我们的叠瓦式技术--SMR, SMR是锦上添花的技术, HAMR更是突破性的技术。

  整个数据圈在数据中心和云这一端会存储超过50%以上的数据。跟大家分享一下希捷在数据中心和企业级硬盘的战略。下面的蓝线是代表我们传统的高转速SAS硬盘的战略,,我们会持续供应高转速的硬盘。对于近线级这部分,业界对这块出货量的预估,年复合增长率百分之三十几。

  中间这条黑线是传统的大容量硬盘增长的路线图,我们现在已经到了用了TDMR+SMR这个技术的阶段,今年我们已经推出了16TBCMR的希捷银河企业级大容量硬盘,而且在很多客户的测试都有很好的反馈,性能非常好,现在已经开始大量出货了,在今天的ODCC颁奖典礼上,我们这个产品也很荣幸获得了企业级硬盘产品性能奖。同时我们也会有18TB的SMR硬盘。在上面性能优化这条线里,刚才提到的双磁臂技术,能够让单个磁盘的性能翻倍。

  回顾一下热辅助磁记录技术的领先性,其实是在物理学的层面有很多的创新。举个简单的例子,它是让磁介质在纳秒时间的量级里能够很快加热,让介质活跃起来,从而完成从1变成0或者从0到1的数据写入。然后在纳秒级的时间范围内让它迅速冷却,让数据处在一个很稳定的状态,我们已经解决了这个挑战,这个技术的能量密度是太阳表面能量密度的6000多倍,这也是未来机械硬盘每年磁密度不断增长并且保证年复合增长率30%的关键技术。

  这是我们的双磁臂技术MACH.2,一马赫是1倍音速,我们是MACH.2是双磁臂,可以让每个硬盘的IOPS跟它的TB有线性的增长。。我们的双磁臂产品已经得到客户的青睐与推崇。像微软这样的公司,它的市值已经达到1万亿美金,非常推崇在数据中心里用双磁臂的技术。今年的OCP上微软的展台也展了我们双磁臂技术的硬盘。

  大家可能知道我们希捷机械硬盘出货比较多,我们在固态硬盘SSD方面也有技术布局,虽然还没做到跟我们的机械硬盘业务一样大,但是我们也有很好的技术和积累。我们企业级SATA的SSD有DuraWrite技术,可以压缩数据量,减少数据实际写入的量,提高性能和耐写度。

  说到数据生命周期,还有一个数据安全的问题,希捷有全面的数据安全特性,左边第一列基本上是初级的安全性我们都有,如果需要更高级的安全性,右边这些选项可以实现。我们还有专门的数据恢复实验室,有很好的客户满意度。我们的数据恢复,第一恢复成功率是业界最高的,第二是恢复出来才收费,而且有几个选项,一个是有保险模式:数据挽救计划,还有一个事后模式:在实验室进行恢复这种方式。

  数据安全有硬盘上的安全特性,还有管理的安全,以及最后恢复的可能性,都是非常重要的。在这也跟大家分享一个数据安全的三原则,3-2-1,3是一份数据存三份,2是存在两种介质上,1是有一份数据存放在远端,遵循个规则下,基本上99%的情况数据都不会丢。

  ODCC公布了边缘计算白皮书,在此之外我这边也推荐两个白皮书给大家阅读下,一个是IDC白皮书《数据时代2025》的扩展,《世界的数字化,从边缘到核心》。另外一个是边缘计算有一个行业组织,也发表了《边缘的数据》白皮书。

  回顾过去,希捷40年时间,在全球范围内守护个人和企业用户的宝贵数据资产;展望未来,我们希望和ODCC的各位同仁一道,不断去打磨打造新兴场景的数据方案和产品,开放、创新、合作、共赢,谢谢。

0