返回首页
科大讯飞股份有限公司高级副总裁江涛:AI:从能听会说到能理解会思考

2018-01-12 16:50

  感谢给予我们这个机会。讲起人工智能,科大讯飞2013年正式启动一个项目叫讯飞超脑,1999年创业起重点聚焦语音,能听会说,大家看到两边屏幕上的讯飞听见,就是讯飞听见系统。2013年讯飞启动的项目叫讯飞超脑,解决的是让计算机或者AI从能听会说到能理解会思考,从感知智能到认知智能,我们看一下这些技术的进步跟我们的信息消费会有什么关系。

  人工智能这几年技术发展非常快,大家关注度也很高,媒体老百姓关于人工智能有很多担忧,未来的发展会不会产生机器的自主意识,会不会产生不可控的东西。现在主流的工业界学术界人工智能这两条大的技术路线,一条是脑科学神经科学为主的类脑计算的路径,这条路径研究人脑的高级神经活动的底层规律是什么,我们的创意灵感想象力,我们举一反三的能力是怎么来的。这条路径过去几年投入很大,确实还没有显著突破的地方,我们把它叫做强人工智能,强人工智能现在还处在很弱的阶段,处在很初级的阶段。

  另外一条技术路线除了科大讯飞以外,全球无论是谷歌还是中国的BAT都有大量的投入,也取得了一系列的成果,它的基础理论是概率论统计学贝叶斯定律,机器学习取得了突飞猛进的进展。它不能解决机器自主意识,不能解决机器创意灵感想象力的问题,但是能够通过凝聚在各种海量数据中的人类知识和经验的学习,使得我们的机器能够解决很多实实在在的问题,我们把它叫弱人工智能。现在的特点是强人工智能很弱,弱人工智能越来越强。

  从这个图可以看出人工智能是怎么推进的,一方面是传统深度学习的基础算法在不断进步,2006年深度学习的理论框架在2012年进一步延伸出了卷积神经网络,2014年递归神经网络、对抗神经网络,到现在进一步强化学习等等。各家厂商的理论框架都差不多,解决的无非是这么几个关键环节。首先原始数据,比如我今天要发出的声音通过我们这套系统变成了一些有效的信息,大家在屏幕上可以看到文字,这是一个感知智能的过程。感知智能形成的有效数据进一步通过机器的理解能力变成结构化的信息,结构化的信息就可以进一步做很多事情。结构化的信息再加上机器的推理能力就可以做很多的决策和呈现的工作,人类的很多脑力劳动就是通过这么一步一步完成的。

  我们看看机器在这些环节都能做到什么程度。语音识别方面,科大讯飞2010年全球第一个基于深度学习的框架做出的语音识别,当时在实验室里有80%几的准确率,我们把它上线以后才60%几,这几年不断提升到了98%。这么大的进步一半是靠算法,另外一半靠数据的驱动,高数据算法的持续迭代。在发言的兼容性方面不断提升。刚才有些领导有比较重的口音,比较庆幸的是我们机器能很好的兼容这些口音。科大讯飞是迄今为止全球唯一能支持20多种中国方言的,从东北话到云南话到闽南话客家话。能听会说还有另外一个方面就是语音合成,让机器能够开口说话这项技术,我们已经连续12年在这个领域拿到了全球最好的成绩。

  我们听一段语音合成的典型效果,未来我们信息消费中每一个设备都像人一样能听会说的时候,你可以指定你感兴趣的明星来代言,他可以用你最亲切人的声音来跟你交互,这些技术都是非常有价值的。

  除了感知以外还有理解,对于图像的理解也是非常重要的一个环节,去年底由奔驰发起的CITYSCAPES的比赛,由普通摄像头拍摄的照片机器能不能理解这些照片,这个是车,这个是路桩,这个是红绿灯,这些是行人,机器能理解到多少,科大讯飞拿到了81.4%的全球最高精度。

  机器更南理解的是人类的自然语言,人类的语言太复杂了,人类语言的阅读理解方面,斯坦福大学发起的机器阅读理解挑战赛,让机器读各种文章,读完文章以后要回答关于这篇文章的各种问题。科大讯飞在这项挑战赛中不断刷新全球的最好成绩,参加比赛的包括谷歌、Facebook、微软、IBM。

  这些技术下一步对我们的生活、我们的信息消费会带来什么变化?这些技术可以用在推理方面的一个简单例子就是医疗推理,去年11月份国家卫计委公布了医师资格考试,人类历史上第一次机器超过这次考试,超过90%的普通考生拿到456分,机器通过对题目的理解、对知识的运用推理和呈现,机器在医疗这个领域已经具备当全科医生的潜质。

  下面具体看一下在信息消费领域,人工智能怎么落地。智能硬件方面,解决人机交互问题,很多厂商已经讲了,我们的很多友商也讲到了,我举几个例子。比如信息消费中大家比较关心的教育,每个人都有孩子,教育是大家很关心的方向,过去教育是离信息消费比较远的领域,但是这个领域正在深刻地被人工智能改变。现在做到什么程度?去年已经有14名高考状元是我们自学网的用户,人工智能通过分析孩子的过程化学习数据,帮助老师批改作业批改卷子,在这个过程中能够给孩子精准化的学习诊断和学习分析。目前这套平台已经在全国1万多所学校用,人大附中在内的全国百强校已经超过2/3在用,用这个平台的学校至少有一点大家可以马上感觉到不一样,就是布置作业,每个孩子做的作业不一样,机器通过分析孩子的过程化学习数据,不是让孩子在pad、手机上学习,孩子还是原来的纸笔学习,学完以后通过家长的手机或扫描仪把学习数据扫描进去,就能建立起传统的学习过程和大数据人工智能的对接。通过这个分析可以给每个孩子布置不一样的作业,你这个孩子的知识图谱是什么样,你这道题不会做是因为哪些知识点不扎实,你现在该复习什么,通过这套系统,作业量下降了30-50%,每个孩子做他最需要做的作业,大量减少无效学习,人工智能改变教育最重要的就是这一点,应该说在不断的深入。

  医疗领域,极其已经具备当全科医生的潜质,是怎么做到的?我们去年上半年跟协和医科大学、白求恩医科大学建立联合实验室,在中国最一流的专家指引下,机器已经学了几十万份电子医疗病例、几十万份医疗文献,现在已经开通了中国第一个人工智能医院,把病例的情况数据上传到云端,机器可以帮助基层医生进行分析,给予基层医生更好的指导。

  司法领域,现在还是to B的,未来一定会延伸到面向很多人的信息消费领域。机器除了在法庭内当书记员,现在已经有1400个法庭在用,机器还可以辅助法官来庭审,这个项目已经取得了非常成功的试点效果,全国现在已经有很多法庭准备上,辅助法官进行庭审。现在已经有杀人案、盗窃案、非法集资案等已经完成了数据信用,一个案子过来把数据输到人工智能系统里,能自动判断出这个案子的证据链是不是完整,证据链中有没有自相矛盾的内容,这个案子最类似的案件是怎么判的,这个案子涉及的法条有多少,最重要的是给法官建议,这个案子该判什么罪名、该判多少年、该判多少钱,给出建议区间,极大减少了法官的文书卷宗的各种工作,未来进一步延伸到消费者领域,我想每个人都会低成本的个人法律咨询的律师。这个信息消费将随着人工智能的进步浮现出巨大的市场。现在我们平台的开发团队数已经接近50万,每天请求已经突破40多亿次,很好的支撑了我们国家在信息消费、双创方面的发展。

  我今天分享了科大讯飞人工智能最新进展以及未来跟信息消费结合的领域和机会,谢谢大家。

0