>>返回主页
北京融汇金信信息技术有限公司CEO罗彤:智能助手赋能金融服务

2019-10-31 15:55

罗彤.JPG

    谢谢各位,今天非常荣幸和大家在这里分享我们在金融行业使用的金融服务,我们的名字叫智能助手。

    第一个就是这方面的需求或者这方面的一个迫切需要是最近几年随着科学技术的需要,应该说我们管它叫涌现的一个需求。传统来说,我们说不管是自动化还是智能化,主要赋能在工具上,比如我们要做一个特定的任务。我们经常做的一件事情就是把这个任务做好一个工具,要写作我们就使用Word使用WPS,使用特定的工具完成特定的任务。但是工具赋能往往是为一个任务解决问题,现在随着产业的发展,我们经常需要做的一个事情就是我们解决的一件事情不是在特定的任务清单里面,没有一个特定的软件正好帮我完成这个任务,所以我们管现在叫知识赋能,核心叫能赋能给人。

    以金融产业为例,赋能给人就是怎么提高人在工作中的各类的效率,我们主要通过产业支持来进行服务。从产业内外来看,我们金融机构内部包括金融机构的一些对外的客户,整个的问题就是一个代服务群体非常大,第二这里面的产业知识源非常多,金融产业特别是这样,金融产业分为互联网金融、区块链,传统的像医药、制造很难一个人对所有的产业知识非常理解,即便是各个证券公司有很多的分析师,他们也不能对所有的产业都了解,但是往往在工作中解决客户问题的时候就涉及到各个行业。第三个我们需要个性化服务,赋能于人遇到了这三个关键问题,我们怎么解决它呢?

    我们先说赋能人的方式应该是怎么样就能够帮助人们做一些非任务型,不只特定任务的创造性工作。第一要做知识获取,也就是说我们必须有能力大规模地学习我们的产业,比如金融产业里面相关的知识,而且自动地学习。我们学习到知识以后使用到知识服务人或者服务这个世界,我们认为两个比较自然的交织方式,一种就是对话,第二个方式就是我们能够给用户展示更丰满的知识,类似一种报告的形式。

    我们说产业知识发展,就是知识服务发展上我们分成目前的阶段,我们可以回顾一下历史,90年代末期,那个时候的企业很多倒掉了,我们大家知道留到最后的谷歌的企业,提供的主要是关键词知识服务,这几年来看逐渐的趋势就是我们不再满足于很多文本中的关键词来获得信息了,我们期望能够把很多的文本获取到,把它凝结为知识。2007年的时候我自己曾经参与过,那时候世界范围中有一个很大的热潮,希望通过机器学习的方法,现在叫人工智能的方法能够从文本中获取不少知识,那时候我们有十个非常著名的分析引擎,像PowersetOpen-Calais还有我自己的Uptake团队,我们希望用知识服务客户,我们希望用这个能够把谷歌打败。不幸的是到了2012年我们也没有打败,这几家企业都被像微软公司、路透社等电子商务的企业收购掉了,这可能跟当时企业的成熟度有关。2012年谷歌自己提出了知识图谱的概念,谷歌提出来说我应该从我所有的文本知识中建立知识,通过知识回答用户的问题,从这里开始以后,国内大概是最近几年大家听到很多知识图谱的概念,它的核心点就是我们不再满足于很多文本和词了,我们希望能获得知识,知识做我们服务的基础。

    第二个趋势就是我们不再满足通过搜索来获取信息了。2015年的谷歌Asistant、微软Crotana、苹果Siri希望通过对话的方式来提供服务,我们希望对话解决一切。

    2016年国外最著名的金融机构Bloomberg退出的方法是通过已有的金融股票数据写出一个报告,2017年对外面市场开始使用,2018年他们从谷歌公司挖了一个副总裁做技术的头,他们一再地宣称,说Bloomberg很大的成就在于我们把企业分析报告自动化了,节约大量的人力,带来了很大的价值。2018年以后我们可以通过预训练来完成,这是一篇学术。服务形式走向了对话,这是大势所趋。

    怎么走向知识服务,具有服务和学习能力的智能助手应该满足这三点:第一能够大规模学习产业知识,不是简单的问答机器人,人把知识输入进去回答用户的问题,那样我们的知识永远穷尽不了。到现在为止,今天很多金融产业论坛有很多金融机构的同学们,智力密集型、资金密集型还没有谁靠人工手段建立一套金融体系覆盖的一套知识体系。第二个问题就是随着知识服务形式,第一要满足对话、第二满足更丰满的报告,对话总是一轮一轮的,报告是我对产业有了解给我一个报告让我能够把知识体系总结起来,这是新一代智能助手或者知识服务的一个关键的要素。

    另外一个技术上让它也基本上准备得差不多了,2008年我们带团队做旅游领域的语音分析或者叫知识获取,当时美国情况就是很多特别热爱旅游的达人,愿意分享很多旅游知识,特意飞到加州跟你讨论他认为比较重要的问题,他都愿意。那时候很多行业的专家参与,而且大量的手工特征以及传统机器学习模型,我们花了一年的时间只做了一个旅游产业。

    今天是财经领域,财经是一个很多产业的领域,现在这个时候通过弱监督学习和深度学习,我们大概建立产业图谱只需要四个月的时间,只有两个编辑,这个图谱可以扩张,但是从建立的速度来讲这是科学技术带给我们很大的飞跃。

    第一个看一下怎么通过一个机器阅读建立知识体系,这是一个示范的例子,在这个例子里面可以看到锂电池,从这段文本中知道锂电池上游是谁,锂电池可以应用在哪个领域,锂电池上下位关系,也就是锂电池包括了哪些子类,文本中描述的这个企业锂电池的产业包括了哪些企业。下面就是这些公司,公司里面有哪些客户群体,这个是我们这个公司大概生产哪些产品,最后我们不太愿意只说这是广义的知识图谱,就是我们能够对这里面的知识观点,这里面就说锂电池的行业趋势是什么样的,它不但是一个点,而是一个整体的描述、一个观点,我们通过这个机器阅读的方法能够建立整个产业的分析这么一个知识和图谱。

    给大家看一个例子,当你通过机器学习这么多的知识以后很大的困难是怎么维护它,就是没有人了解所有的产业,扔给很多专业机构维护起来也非常困难,所以我们用了一个方法,我们不是说钛白粉下游产业是塑料,你说对不对?这个很多人判断不了。我们做的很多方法就是我们把来自于哪段文本列出来,一般运营人员看了这段文本还是能对你这个信息获取知识的关系作出判断,我们通过这个方法。你可以看产业细分为什么有凤香型是因为来自于这个文本,通过这个方法保证了或者我们不适用所有行业的专业人员而维护一个产业的知识体系。可以看到这里面所有的东西都是来自于文本中的自动的阅读和提取。

    现在通过建设的知识体系覆盖了130多万个关系,很多老数据现在120多万个关系,细分的产业产品六、七万个,公司覆盖上万个。

    我觉得有一个可以对比的就是现在业界的一个情况,现在目前的业界情况就是一般我们国内的业界知识图谱大半都是手工做的,目前情况是这样,或者是做一个垂直领域的,很少有覆盖全体的,我觉得这是一个比较好的突破。

    第二国外非百科类的图谱建立,主要是卡耐基梅隆大学有这样的体系,有200多万个实例关系。百科类的知识来自于维基百科和百度百科,数据相对比较规整,获取比较容易,但是一般产业知识相对来说非常稀少。

    当你建立了一个知识体系,我们把这个知识体系再加上我们拥有的结构化数据结合在一起,我觉得这个构成了非常大的知识服务的能力,通过它可以通过对话解决用户很多问题。我们看一下这个视频。

    (播放视频)你可以在手机上做一个APP,让用户跟你不停的对话,你反复问我指示的问题,或者结构化数据里面有的数据,把结构化数据和知识连在一起了,所以可以解决大量的问题。第二你可以做很多的简报,我们通过你对知识体系的定义,人们对产业分析需要哪些元素,把知识体系连在一起可以构成这样的报告。

    我们可以看一下我们做的对话助手主要是一个叫知识型,就是我获取知识能够服务你,第二任务型,在我做一些比如说金融产品的特定营销产品或者是某一些特定意义的某种特定提醒的场景,我只是完成一个任务,而不只是告诉你,你问我的问题是什么,我们能做这两个场景,不一定是社交机器人,比如说微软小冰就是能够陪你聊下去。所以我们认为知识型、任务型是金融助手的一个关键。

    现在我们译图水平大概达到97%。比如这是对话机器人的一个场景,大家可以看,可以随便问。(视频演示)这些知识都来自于各种观点的提取,包括这个关系来自于这段文本。这是个结构化数据的查询,连在知识里面直接做一个查询。当然你也可以接到电话上就可以完成一些任务。

    第二我们可以做出一种自动的报告,比如知识体系含有所有的数据,根据这些数据和我抽取的知识能够自动做一个机器学习的智能写作,就可以写出客观数据和现实的报告,这就是白酒行业的报告,就能自动生成这么一个图文的报告。

    这是抽取式报告,任何一个产业都可以把各地方的观点分析拉在一起产生这么一个简报。

    对比一下Bloomberg做的公司的报告,比如说Starbucks,根据它的客观数据、行情变化和所在的产业,这是整个靠自动写作出来的,可以对比的是这个报告,当然它没有图表,我们国内很多人要写还是需要图表,Bloomberg写的报告没有任何图表信息。

    这方面产业发展的前沿,世界上的水平就是一般直接做数据生成的现在效果都不是特别好,一般来说我觉得在产业上还是要做基于知识图谱的抽取同时基于信息压缩的机器生成,而且在报告这块有很多工业化的程度在,它的成熟度要有很多产业化的诀窍才能做,统计学习和人工参与在智能报告里面还是起很大的作用,不只是中国可能全世界都是这个情况。

    金融助手应用的效果就是我们在一些金融机构使用一个例子就是人工处理服务,原来三万个,下降到300个,顾问减少了95%,用户活跃度上升了5倍,随着服务能力的提高而且这个形式也比较有意思。

    整个流程是这样的,我们其实要想做一个真正知识的助手或者智能助手或者知识的赋能,我们核心要有一个数字化,要有一个数字化、PDF文档和内容抽取的流程,要有知识化的流程,要能做应用,有了这些知识你要能服务于人,比如问答机器人、智能报告,还可以做一些电话服务。

    最后就是简单分享一下,因为我们落地人工智能产品也许有一些企业想做这个,我反复被各个企业的CEO反复问的就是这样一些问题,希望和大家分享。第一,我们应用的原则,大部分的场景不是说我们只要一个低准确率,我们往往要要求95%以上的准确率,90%的准确率不好用,意味着一万篇文章有一千篇是错误的。第二大部分问题是小数据,很少标注数据,要大量的人工解决数据未标注的问题。另外人才的情况特别重要,很多金融机构落地很多人工智能应用,落地比较慢的原因就是我们这个产业特别需要的就是特别了解金融业务,就是金融场景需要什么,另外还特别理解人工智能或者机器学习能够给我们带来什么,这样的人特别少,不管是什么机构,我自己亲身打交道很多机构能获取这样的人其实是我们能够推动产业升级的挺重要的一个点,人才到最后是制约了,我说这几个是现实情况。

    第二个就是落地关键,反复要有业务场景专家还有人工智能的专家,两个人要反复地聊,定义好确定的场景,光人工智能的人不太懂业务,想的都是想当然,业务人员不理解你能干什么。

    另外就是反复培训。剩下的就是我们经常常见的一些问题,被各个企业问的比较多的问题,就是说工具都开源了是不是大家做的都一样,其实不是。怎么应用知识解决问题这是很大的工业上应用的方法和技能,这个还是不一样。另外你用不用人工智能的技术,核心的判问点是你做的方法是不是规则,你的准确率为什么不高,就是因为人工智能的产品都不到百分之百,核心是在你的产品里面有设置让你能够使用不到百分之百预测准确率的人工智能的产品在你的场景上产生作用。最后为什么预测效果只有80%,往往来看就是因为这个问题太难,要不然就换个团队提出更高的要求。

    我的分享就到这里结束,谢谢大家。

0