>>返回主页
北京阿尔山金融科技有限公司副总经理 李平:商业银行在基于区块链的客户信息共享(KYC)上的探索

2018-01-17 11:55

  大家好,我是北京阿尔山金融科技公司的李平,感谢峰会给这次机会能够跟大家分享一下我们在商业银行在区块链应用上的一些探索。

  前面几位嘉宾讲得已经很深了,有的讲的范围已经很全了,我们在金融科技方面的探索主要集中在以下四个方面,区块链、云计算、大数据、人工智能,我们认为这几个可能是在金融科技能够跟应用产生比较好的结合的科技方向。

  我们公司推进金融科技和应用的结合通过三个方向上的工作来开展,第一个是阿尔山金融科技有限公司,这个是以公司的形式在和银行包括其他行业在做这种金融科技的应用。第二个,我们和清华大学成立了一个清华大学阿尔山区块链技术研究院,这个研究院是从底层理论、前沿探索,为应用的结合提供底层的技术支持,从这个角度在做推进。第三个,我们也在做一个区块链方面的金融联盟链,从这个联盟链的角度来说,我们邀请商业银行来参与解决方案的探讨,包括试验环境的提供,包括应用的POC试点的落地。

  这个是我们在去年7月31号在清华大学,由陈岩主席和清华大学的陈书记参加的我们研究中心的揭幕仪式,研究中心这边牵头是清华计算机系的孙书记,下面设了两个委员会,一个是学术委员会,一个是产业应用指导委员会。

  今天的介绍分成三部分,一个是区块链技术的简单介绍,第二部分是我们在KYC方面的一些探索,第三部分是其他金融科技的探索。

  区块链从纯技术角度来说,我们认为它就是一种记录日志的方式,大家如果说有过这种技术背景,对日志是很了解的,日志就是按顺序把一些东西记录下来,区块链说白了也是按顺序把它记录下来。为什么它现在流行,因为它记下来的过程里采用了很多东西,一些分布式计算的东西,它可以把去中心化的日志存放起来,另外有很多密码学的东西,存下来的东西从数学从密码的角度来说是不可篡改不可逆的。从区块链的技术引进来说,1.0、2.0、3.0,1.0是从比特币开始的,作为一个比特币价值存储的工具,全球有多少个节点,每个人有个副本的应用。2.0是以以太网出现为代表的,是在存储的基础之上又加上了一些智能合约,可以完成一些事先约定好的有关法律上的或者应用上的,执行一些场景。3.0上可能会出现更多的应用,分布式的应用,包括数字身份,包括知识产权管理。现在还一种讲法,区块链慢慢会成为整个互联网的操作系统,这也是其中的一个方向。

  从技术分类来说,有公有链、联盟链、私有链,公有链任何人都可以加入,联盟链是需要联盟内经过许可才能加入的,私有链是完全使用看好区块链的某一点技术,在自己的私有环境下部署出来的一个私有链的环境。区块链的技术特点讲得也比较多了,它的安全性,包括去中介、可追溯,因为有去中心的分布式存储,健壮性也是很强的。它带来的技术价值有降低成本,也许将来区块链更加成熟之后,我们可以不用建设非常高大上的数据中心了,非常分散的形式来做这种系统的投入,有数据安全,包括可以提高效率,可以做这种风险的防范。在金融市场上,国外有一个R3联盟,前年和去年初可能比较火一点,国外加入的比较多,国内有三家银行加入了,还有一个HyperLedger技术联盟,我们也跟这几家大的商业银行包括一些股份银行也有一些合作,签了一些战略合作协议,我们在做一个阿尔山金融的联盟。介绍这块是因为跟我接下来讲的KYC的东西有一些关系,国外基于区块链做的身份链项目,前前后后大概有20多个,包括一些比较轻量应用的,包括可能有政府参与的,包括像最后日本的那三家主力银行,再加上他的一些主管机构推出来的身份链的项目。

  现在银行业客户信息存在很多痛点,首先我在一个行里的数据可能都不准确,我的借记卡信息和信用卡信息可能地址、电话、身份证,可能某一点上就不一样,有的可能身份证里面还有15位的没有被更改过的,这个都有可能。我们在各个银行也好,包括其他的类似像保险机构也好,我们留下来的信息今天留一个明天留一个,我们每次提交的信息可能认为是最新的,或者说我现在居住的正好用到的,这些信息一个一个全是信息孤岛,没有互通也没有共享。造成这些问题的原因,一方面是监管方面,没有一个统一的监管要求,要求大家保证你的通信地址,保证你的联络方式是必须一样的,国外可能会有这些规定,你如果地址发生变化了,必须向你的金融服务机构,把你最新的公共事业的账单提供给他们作为你新的通信方式变更的凭证,但国内好像没有这规定,大家也没人管,也没有人主动提交。银行也没有提供一个方式说你在网银或者手机银行上或者去柜台做业务的时候,他会问你有没有通信方式发生变更,只有说你自己真的有变化了或者有一些需要了,你才会产生这个变更。银行各个系统之间也会有不一样,新上一个信用卡业务,新上一个互联网金融业务,新上一个贷款业务,有可能留存的信息都不一样。对于客户来说,客户觉得这部分信息放在银行暂时没什么太大的影响,我也没有必须变不可。其实银行他们对于这个客户信息也不是说一点没有想法,很多行都有一个CIF系统,客户信息管理基础设施系统,相当于客户信息治理,但这个治理很多是我们花半年花三个月时间上个系统,把客户信息从网点上通知客户做一个规制,这是一个运动式的,有可能他会收到一定效果,有可能会产生一些应付来的数据,但是过去这个时间之后,这个机制又会变成之前的样子。

  我们在中国银行做了一些试点,一个是构建中行内部的客户信息区块链,中行里边除了核心系统之外还有很多外围系统,外围系统的数量还是一个挺大的数字,在各个系统之间需要有一个共享同步机制。另外可以支持回溯客户信息在中行的变更历史,可以对客户有一个更准确的画像。很快产生一个问题,这个必须用区块链吗,原来的信息系统不可以做吗?可以做,但是做完之后有一些区块链技术带来的特征没法体现出来,比如不可篡改,银行数据也不可篡改,好像很难篡改,但那个是依靠管理,依靠系统运维来保障的,不是从技术上从算法上,从区块链本身这个特点上带来的不可篡改。另外对客户信息还有一个非集中化的应用,从这几点上来说,用区块链来做客户信息治理是比较好的尝试。再有是在跨行客户信息的共享,基于联盟链的客户信息的共享,这样可以避免这个客户他重复提交信息,我在中国银行已经开了户了,我已经是金卡客户了,我去工商银行开户的时候得把我所有资料带上,银行要把我全部资料审核一遍,既耽误客户时间,也增加了银行的成本,同时整个客户变化的历史也没有地方可以记录到。做跨行的客户信息联盟可以带来成本的节约和对客户信息更好的掌握的效果。这些事做完了会有一个概念,个人客户信息到个人资产的变化,我们现在说客户信息我存在银行,这部分信息是我的还是银行的。我们认为这部分信息是属于客户拥有的数字资产,银行只是这个信息的托管方,甚至是说它在某些情况下对外使用这些信息的时候还需要客户的授权。包括前一阵蚂蚁金服做的这个账单,慢慢的大家有一个这个认识了,有一些隐私,有一些客户信息是需要授权的,是需要客户非常非常明确的理解这件事情,同意这个条款才可以去做的。

  对于客户信息数据分类,哪些数据可以上到联盟链,哪些数据至少在初期不太适合上到联盟链,我们做了一个划分,从客户基本信息,这个就是人民银行监管的九项,这九项数据是很基本的,姓名、国籍、性别、证件号、职业等,不代表我任何营销属性的信息,这部分信息是比较适合放在联盟链里的,其他的像一些辅助信息,包括一些营销信息,包括我的收入信息,甚至是我的生物特征信息,这部分信息可能在联盟链的节点,参加联盟的银行在他的私有环境下做一个保存。

  大体的流程,包括个人通过金融机构做数据的确认采集修改,还有金融机构对原有的一些数据,批量的进到联盟链的环节。最右边是参与机构可以通过客户来做这种授权的查询或者授权的修改,同时监管机构也可以对这个联盟链里的这些数据进行合规检查和控制。下面是通过个人的客户端,有可能有联盟的客户端,有可能是加入行的客户端,也有可以对这些客户信息做查询修改。这是一个原型的界面,客户来主动维护信息,个人的KYC终端,登录之后可以看到自己的信息,哪些需要更新,更新的历史也都可以在自己的界面里看到。如果在联盟里有一家银行需要查询,比如我去工行去开卡,我说在中行已经有我的信息了,这时候他在他的行内系统登录,比用我的身份证号和号码做索引去查,我通过我的客户端可以查到这么一个查询的授权,这时候我可能坐在他面对面,我面对面给他做这个授权之后,他才可以看到我的客户信息。这个是我们授权查询的历史,看到哪些东西是我授权了,哪些东西是我拒绝掉的,因为我不知道为什么要查我这个,我可能会拒绝掉。当我坐在柜台面对面的时候,我肯定知道这件事,授权肯定是没问题的。最后提一下,我们在联盟链里也设计了一些机制,客户信息如果我们认为它是属于客户的个人资产,那么对于我这个个人资产的使用,客户可以获得一定的分润的奖励,这部分奖励可以通过很多种途径奖励到个人的钱包或者账户里。这个是联盟的成员机构在做客户信息更新时的一个原型,银行发起做的这种更新也需要客户做授权。银行原来可能他已经有一些,至少他能看到,比如客户最新办的贷款,留的地址和信用卡地址已经不一样了,能不能把信用卡地址改掉?银行知道了也不敢改,因为没有客户授权。这种更新经过客户授权就可以得到修改。这是看到客户授权更新历史的界面。

  稍微提一下我们在其他金融科技方面的一些探索,前面民生银行的王总包括包银消费的领导也提到一些东西,有些东西大家做得还是比较像的。简单提一下,我们这里面分成几大块,这是一个大数据的智能分析平台,在这个智能分析平台里有一部分是数据集算,相当于从原来的数据源整合到有价值的数据资产这里面有一些比较好的高效的工具。然后是深度分析模型,做任何大数据里都会用到,我们在其中有一点做了很好的尝试,现在很多数据都是关系型方式来记录的,提到风控,包括违约,包括灰、黑点技术查询,这种计算量非常大,不适合关系型计算,我们在图计算方面做了一些探索,把数据转化成图模型来提高效率,效果还是比较明显的。我们在做一些反洗钱测算的时候,比如跑几天的数据,可能能压缩到几个小时之内就可以完成,这是图计算方面带来的优势。另外是模型工厂,刚才前面嘉宾也都提到了,我们做很多用户画像,做很多数据建模分析的时候,这个是需和很多建模师对数据的理解,这部分我们现在理解效率不是特别高的,我们在做这个模型工厂,能提供一个工具,能对数据建模师的要求不是特别的高,但是它可以按照工具对于模型的整理,把这个数据能比较快的发现出来目前哪些元素相关,哪些元素不相关,最终能很快经过训练数据、验证数据能比对出来比较合适的模型。我们实际看的效果,如果一个数据建模师建一个模型,短的可能一两周,长的可能更长。如果用我们这个模型工厂,建模效率会有非常大的提升,有的一两天就能做一个模型。这个对于我们做数据预测、风险预测、小规模或者个性化的模型探索方面会带来一个效率的提升。这个是我们大数据智能分析平台的价值。

0