>>返回主页
中国信息通信研究院云计算与大数据研究所副所长魏凯:深度观察报告:大数据与人工智能领域

2019-12-26 15:35

XXX_5669.jpg

  各位专家大家下午好!我们这个领域这几年一直是在风口浪尖上,为什么这么说呢?因为我们覆盖的范围连续三年被中央作为集体学习的题目,前年是大数据、去年是人工智能,今年是区块链,再次的证明我院领导的英明,选择的领域非常准。但是我们去年没有预测准,今年总书记集体学习会选这个话题,这是我们预测的能力有待提升。

  这个领域的发展,持谨慎的态度,经过了前几年高速增长,现在往下掉,人工智能的产业规模的增速,最高的时候在2018年增速75%,现在有所降低,但是仍然很高,我们还是很幸运的,不管是人工智能、大数据还是云计算产业规模的增长都在30%以上,仍然维持在比较高的增速上,只是回归正常理性了,这是今年我们总体的感知。

  平台化已经成为各个人工智能公司主要的策略,平台化策略的方向上,方向有几个特点,首先是平台覆盖的领域在不断的拓展,包括智慧城市的智慧大脑的平台、物流、办公、金融的平台,每个平台的功能也在不断的丰富完善,工程的软件平台、人工智能平台工程化的能力在持续的提升,这是软件平台发展整体的趋势,总体为两个方向,一个平台可以支持很多种垂直的应用,更多的公司是做垂直的平台,聚焦单一的领域去深耕。在平台的发展趋势下,生态也在不断的成熟,自动驾驶、智能音箱的平台,可以构建越来越丰富人工智能的生态,这是平台化进入新阶段的感觉。

  支撑人工智能底层算力的发展,随着场景的不断深化,算力正在进入定制化的时代,因为芯片的开发、设计、制造的能力正在普及。很多公司都拥有了在人工智能领域进入到芯片的能力,包括IOT、移动终端、语音、自动驾驶在今年出现了众多的支持AI算力的定制化的芯片,同时在云端也看到了很多面向训练的定制化的芯片,很多软件公司也都加入到定制人工智能芯片的行列中,包括阿里、英特尔、传统芯片的公司,应用的牵引正在引导不管是云端还是端侧这些芯片深入的发展,逐渐推动两边云和端的协同,来更好的做推断、训练和预测。

  总的来看,国内外芯片厂商发布了30多款AI的芯片,其中8月份就发了9款,数量增长非常明显。总的来说,软件因为上层应用的聚焦,下压的这些芯片需要做垂直化的定制。人工智能在这几年的发展靠的是底层数据的支撑,靠深度学习来基于大量的数据训练才能够取得今天的效果,基本上是算力和数据推动了这一波人工智能浪潮的崛起。

  今年对于数据议题也是非常亮眼,数据正在资产化,在中国党的十九届四中全会首次把数据作为生产要素纳入党的文件中,这反应了我们正在为数字经济的发展做好底层的准备,把数据资源规范起来,让其参与到生产分配和流通的环节中。不光是中国在关注这件事,美国国会也在讨论如何将数据视为财产来加以保护、加以确权,来推动相关制度的完善,这就是为什么在2019年把数据资产化提到这么高的位置,是解决数字经济发展中很重要的问题,如何让数据的确权、流通、交易更加合规、规范,能够给数字经济提供源源不断的生产要素,这是今年一个非常明显的变化。

  随着变化上层政策的清晰,数据的治理意识也在深入人心,治理的力度也在不断的加强,在国家、法律层面,出台了一系列的关于数据安全、治理方面的法律法规,在实施层面,今年政府机构改革中,有14个省级部门设立专门大数据主管机构,来治理当地政务公共数据资源,企业数据治理进程也在加速,国家电网、建设银行等,以及大型国有企业、央企为代表空前的重视数据的治理,这是把数据作为资产、作为生产要素做准备的信号。

  从云优先到云效能的转变,前几年更关注云计算的发展,关注的是让大家都要上云,今年大家更关注把云用好,进一步提升使用云的效率,产业侧更加注重上云产生的实效,大型云服务商,不断的整合企业内部的资源,输出整体的解决方案,单个环节中小企业在整合上下游,云计算的公司不再比拼云服务的产品的数量,而是更加注重产品的质量、用户体验。

  技术供给侧来看,这几年发展很多的技术,包括微服务这些云原生的技术和管理的思路,就是帮助用户更好的上云、更好的用云,今年发布的中国云计算开源发展报告中显示,六成企业正在测试微服务的框架,也反应了大家更关注把云用在信息化升级改造上,促使今年云效能成了关注的焦点。

  人工智能、数据、云,这三个技术是密不可分的,在今年看到了它们的融合、交汇更加的密切,从云和人工智能的发展来看,现在看到了智能云,每家公司都在开始提供不同的智能云的解决方案,智能云的含义是把人工智能作为一种含义对外提供,包括语音、图像、自然语言理解等等,国内外公司都特别重视AI、云服务的发展,这是云智融合典型的信号。

  云和数的融合也很明显,这几年AWS和国内公司推出了云原生的数据库,云上处理大数据成了基本上的标配,所以云数在深度的融合,本身它们也是很难分开的嘛。

  数、智也在融合,一个维度是数据分析平台和人工智能平台也在融合,企业不希望有两个平台,一个做数据挖掘、一个做深度学习,而希望一套平台做传统BI也做深度的机器学习,所以都在通过一个平台,同时支持传统数据挖掘也支持深度学习的服务,人工智能也正在反补数据管理,以前数据出现很多的质量问题、可靠性问题,可以靠人工智能辅助解决,必须靠智能化推动数据治理水平的提升,我们看到它们在深度融合的发展,未来会构造一个完整生态的体系。

  今年热点很多,我们选择了三个,第一人工智能的发展正在回归,回归理性,同时以人为本成为人工智能未来发展的新导向,今年热点新闻上会看到很多与人工智能相关的负面消息,人工智能的双刃剑的特性展现的淋漓尽致,包括隐私保护、算法的安全,这些都成为今年大家讨论人工智能发展不可回避的话题,全球都在关注人工智能是否应该嵌入伦理的要求,这就包括人权的信息伦理、偏见伦理、责任伦理,人工智能发展要符合社会常规的道德,因为人工智能越来越聪明,所以人工智能技术自由裁量权会比较大,裁量权也要受到道德和伦理的约束,这就是为什么今年会出现这么多的问题,大家也在反思人工智能的治理如何开展。

  全球主要国家政府都在开始讨论,包括新加坡、美国、欧盟和OECD政府间的组织也在讨论人工智能到底如何才能做到以人为本,以什么样的路线去推动人工智能更加符合人类的福祉。行业组织方面,ISO也发布了人工智能伦理设计的导则,ITU也在举办会议,是在引导人工智能内置道德准则,国内的腾讯、国外的谷歌他们也在积极研究倡导要遵守基本的社会道德和伦理。

  如何把以人为本的理念变成现实,像欧盟这些国家率先推出了“可信AI”的理念,包括欧盟委员会、OECD、新加坡、他们倡导的以人为本的理念,有几个核心的要素,首先是以人类主体性原则,避免伤害原则、公平、透明、可追责,这是可信AI核心的要义,国际上高度关注也在制定相关规则,推动各方的自律,中国也人工智能发展非常快,我们也在高度关注人工智能的可信和以人为本。人工智能的回归对行业是非常好的发展,回归意味着未来有更大的跳跃。

  第二个热点是区块链应用在加速,发展方向日益的明朗。首先政策导向上,今年不管是国外的政府还是国内讨论区块链、出台区块链的,政策的敲定从产品获批,明确转向区块链促进服务实体经济、提升政府治理能力方向去引导,这已经成绩国际的共识,9月份德国发布了联邦的区块链战略,美国在抑制虚拟货币的发展,促进实体经济应用区块链的发展,国内除了中央以外,地方的各地也出台了30多个指导性的文件、产业区域布局也在快速的展向,要把区块链应用于实体经济,大的导向下行业巨头,用户有国家投资集团、中国政府掌握的投资机构,国投、中国工商银行,南方航空、国家电网,他们在认真思考他们的业务如何用区块链来优化、加速、转型,他们不是追热点,他们已经前半年做了很多的工作。

  说到区块链不能回避一个热点,就是国际上的最大的热点,就是Libra白皮书,引起了全球各界的高度关注,首先他们要建设一个基于区块链的全球金融信息基础设施,这是革命性的基础设施,有三个要件,第一是发行货币,第二建设联盟链、第三要成立新组织,这些是对未来金融基础设施重大的创新,只不过他们还在白皮书上没有实现,虽然只是白皮书也已经引起国际社会巨大的反响,表现在美国开了三次听证会,欧洲的几个老牌的工业化国家公开的反对,明确的反对,焦点一是对数据安全、二是金融稳定和金融的风险,这些是全球金融基础设施发展面临的现实情况,理想很蒙满但是现实很严峻,但是Libra不是最后一个后面会很多不同的方案会出来,这带给我们一个思考,我们的信息基础设施在各个行业会不会被区块链所改造和颠覆,特别是金融信息基础设施,有很多启发,它是全新从货币的创造到支付一系列的都是全新的。

  第三个热点是开源,开源正在主导信息技术创新生态构建的事情,成为核心最重要的发展模式,它已经吞噬世界,今年开源风险正在引起重视,尤其是在中国,今年开源很亮眼,代码开发者贡献量占了三分之一,对开发代码使用量也是位列第一,开源风险进入了应用部门的视野,原来的软件有商业化被迫有责任承担风险,现在这些风险有数据安全风险,比如SSL的漏洞,比如知识产权的风险、法律的风险、管理的风险、运维的风险,已经发生了安全漏洞、开源里面安全漏洞、专业的诉讼、法律规范的协调都在暴露开源风险日益加剧的信号。今年不管国内外正在谈一个话题,就是对开源有了新的认识,开源需要治理,包括治理的标准,开源组织下对开源软件供应链做管理来确保交付到用户手里的软件,即便有开源模块也不会有太大的风险。

  国外有一个金融科技开源基金会,2006年成立,现在有30家成员,国内金融机构几十家银行和IT公司开始组团探讨如何规避开源应用中的风险,现在已经24家成员,包括农行、中国、浦发银行也在参与开源治理社区的建设,开源是个很好的游戏规则,但是这个规则需要治理,需要关注其风险。

  展望趋势,未来这个领域仍然面临很多机会,机会存在在问题中,问题最突出的是数据的合规的流通与安全的冲突,我们希望别人把数据给我,而不希望把数据给别人,就产生了一个矛盾,数据要安全也要跨机构流转,否则数据只是信息不能有价值的资产。在制度不断加强的情况下,用户的权益保护不断的加强的情况下,如何去弥合这个矛盾,我们看到一个趋势,必须靠技术手段突围。包括多方安全计算技术,数据不离开原始主体仍然可以挖掘,包括数据脱敏和现在的区块链都是可以用来解决数据隐私计算的问题。未来很多场景下都会使用,包括金融场景、安全场景、政府场景、跨境数据流动的场景,现在全球是一体的数据,不可能不跨境,通过技术赋能,技术为数据安全困境打开一条新的空间,必将为这个领域带来非常深远的影响。

  第二个趋势是人工智能的算法将进入后深度学习时代,工程化的红利会延续一段时间,基于深度学习的算法还有优化的空间,但是更应该看到未来的空间在新的算法的路径开拓上,有两条路线正在逐渐的清晰,一是深度学习+神经科学+脑科学,另外一个路线是深度学习+知识工程,具备结构化的知识,有高起点学习的过程。未来随着后深度学习时代路径不断的清晰,人工智能将能够听得见、看得见,到能够听得懂、看得懂,甚至可以交互做深度智能化的应用。

  云已经真真正正成为了信息化构建的最基础的一种方式,大家不再置疑云的发展方向,但是云进入了深耕细作的阶段,首先有三个看法:一是云从中心走向边缘、这是随着5G、工业互联网的发展、云必须回归边缘,离用户太远的云性能是不高的,所以云必须和边缘计算协同。

  云从粗放走向精细,管理的效能也会越来越高、云应用从消费互联网、公有云是游戏、电商、互联网的网站,未来将走向工业互联网、走向金融和生产的核心,未来会重新走向风口浪尖,就是这个领域的数据中心,风、火、水、电和机器,随着人工智能、大数据的发展,这些年硬件的改进越来越受到软件的驱动,软件的步伐在这几年发展非常快,但是硬件创新也没有停止,预估未来可能会产生新的数据中心一系列的技术变革,这些变革主要有几个方面,部署形态会出现很多边缘数据,之前中国有多个超大型数据中心,未来在5G基站上、很多城市的部署有实时性的要求,包括数据中心的智能技术跟不上算力的增长,单芯片的功耗已经很高了,但是智能就跟不上了,风扇吹是无法解决问题的,所以必须浸泡在液体里,这是制冷技术的变化。网络原来是三网分离的对外服务的一张网、内网计算一张网,存储是一张网,未来数据网络将会发生变化会走向三网合一。随着新的技术的创新,未来几年底层的基础设施会重新时髦起来,为未来上层的应用创造更大的厚利。

  区块链未来还有很多不确定性,到底能够发展到什么样子也很去准确的预测,但是我们可以看到一个趋势是很明显的,现在区块链正在成为连接可信数据的网络,这些问题解决了都会成为技术结构的架构,在供应链、司法、票据、数字身份有大量的场景等待挖掘,应用方向拓展也前景广阔的,区块链的治理,包括内部的参与链节点之间的协同、权责的协调,另外是适应社会大的安全合规的要求。区块链的完善、区块链大规模应用取决于这三个方面的发展,技术应用和治理的完善,有朝一日可能会成为跟其他信息技术协同能够成为信息时代数字经济时代重要的信息基础设施,能够成为价值互联网的主要的承载的基础。

  谢谢大家!

0