>>返回主页
浙江每日互动(个推)高级副总裁刘宇:数据智能 慧眼识真

2018-01-17 15:50

  各位朋友下午好,我们公司不是一家从事金融行业起家的公司,我们公司跟每个人非常近,是做移动互联网方向的,很有可能在座的相当大的一部分朋友已经是我们公司的客户或者潜在的间接的客户,因为我们是做移动互联网的消息推送技术解决方案的基础平台。在这个平台上已经有几十万的APP都在使用个推的云服务,浙江每日互动是我们公司的名字,个推是我们主要的基础平台的产品名字。这样一个SDK会随着APP的分发安装到大家的手机上,APP利用这样的软件模块完成消息的发送。大家每天可能会收到非常多的比如天气消息,或者您追的剧集,比如有什么新的剧集,或者您关注的东西打折了,等等信息都是从这个云平台上帮助这个APP进行下发的。

  今天我想给各位分享的是我们利用这样一个大的覆盖和大体量的数据,在金融方面的一些应用。今天展开的一个视角是用数据智能的方式来找到真这样一件事情,真包含真的用户,比如咱们做金融业务的时候,征信、放贷等等,这样一些金融业务所面对的对象,至少它是一个真的人,而不是一些羊毛党或者机器人,怎么判断他是不是真人。另外一个,是不是真的需求,从他现在的行为模式去看,是不是真的有这样的资金需求。从还款角度,是不是有真的意愿和真的能力。

  简单回顾一下移动互联网金融大概的历程,从2013年进入到元年,一直到2014年各方纷纷涌入到这个行业里去淘金,再到后面,到2016年监管的元年,使得这个市场更加趋向规范化,再到后面2017年,我们也大胆预测了一下,因为我们非常清楚各家APP也好、手机端覆盖也好大概的情况。基本上P2P这个平台我们当时预测要转向场景化的消费金融的方向,今年随着监管的进一步严苛,使得我们的方向确实是如我们所估计和预言的发展。

  今天的话题可以落在普惠金融这么一个背景下,实际上对于终端用户的了解是特别关键的一个步骤,如何去了解这个人他这几方面是不是都是真的。包括如何通过时间、空间以及用户这样几个范畴、几个维度来扩大普惠金融的面,使得参与到普惠金融的企业能够获得更大的发展。这里面包含客户群体的覆盖,潜在客群洞察和理解,也包含风险数据化和获客成本方面的考虑,这几个方面我们看到都是在运营过程当中非常关键的几个点,也是作为一个个体的企业来看,无法回避的几个特别重要的步骤。

  今天主要分成两块,一块我会介绍一下在大数据风控和反欺诈我们做的尝试和实践,还有一块是精准的流量超市,从源头治理,如何从源头上我们发展客户,优质的至少是真的客户,是真的人、真的需求、真的能力和真的意愿。

  大数据风控和反欺诈这一块,可以看到有这么几个方向,一个是高风险贷款的申请过程,这个过程是如何去识别和规避。还有审批当中有效识别的问题,这里面包含征信数据的不完备,虽然现在的过程是在不断加强这一块,但是在这个过程当中其实我们要参与进去,使得征信数据能够进一步的完备完整。还有一些风控模型,刚才各位老师也分享了非常多的模型方面的实践,我们这边也有一个还算比较有规模的大数据的团队,不断去挖掘数据。现在我们的数据已经在营销、客流分析包括人群热力图的分析,以及在旅游方向等一些关系到国计民生,还有公益,比如地震,灾后救援、灾后难民流向等方面做了一些模型方面的模拟,关注的还是设备的覆盖和设备使用者的行为。这里面还有一些行业坏账,包括违约率、逾期率、坏账率较高,甚至是监管严苛之后发生的一些金融客户用户之间的踩踏事件,使得不同账期不同产品内部产生本源性的竞争。

  我们提出一个产品叫个真,面向是不是真的这件事情,真的包含预测信用和欺诈风险,也包含丰富的黑名单库,已经识别出来这一类人非常明显的属于黑名单一列,也是定义真实用户的大概方向。

  个推,像我开篇讲的,是一个基础的推送平台,本身是做APP的消息推送,主要的客户包括新华社、人民网等一些新闻机构,还包含非常多的银行客户,银行客户当中手机端的APP也是非常多在使用个推的推送服务,几家大的银行还有各地农商行都是我们的客户,还有一些券商等,也包括大家耳熟能详的APP,比如网易新闻、滴滴打车、OFO、摩拜,大家能想到的很多APP都已经在使用个推的推送平台完成设备的覆盖和触达,进而拉动活跃,更不用说滴滴、去哪儿、墨迹天气,非常多,这里只是列举了几个。

  说到覆盖,在覆盖之上我们对这个数据做了哪些分类,这些数据首先都是一些设备的公开信息,绝对不会碰到各位终端用户的隐私信息。这里面设备的信息实际上是在设备级的,并不是在APP里的。这里分成两类,一类是线上数据,一类是线下数据。线上数据主要是依赖于比如大家对APP的安装使用这个方向的考量,线下数据在联网的情况来推测大概的地理位置,通过线上线下数据结合来识别他的行为模式是不是和大众相近,还是这些人很特别,需要进行特别的研究,进而识别它是不是真实的设备、真实的人在使用以及相关的一些性质。这里面我们会把它包成标签系统,这个标签系统绝对不只是这样一点点标签,这个标签系统已经是最新的一套标签体系,它的特点有一些动态可配置可定制的标签,而且是随着时间、随着其他的维度,包括频次,包括数据的温度,数据的温度实际上是基于数据的产生和变化的规律来进行划分,包括冷的数据,相对于不变的数据,比如这个设备使用者他的性别和年龄长期的一些倾向,也包括一些热的数据,比如及时的场景数据,是不是处于某种场景当中,线上的场景、线下的场景都包含,也包含热数据慢慢随着形成的近期的一些模式,这些模式可以用来识别这个人近期的行为倾向甚至兴趣爱好方面的推测。

  几个典型的例子或者几个典型的场景,哪一些是真用户,真用户具有的行为:工作稳定,设备长期使用,作息比较规律,目前比较典型的几个APP使用是正常的使用行为。另外几类情况,比如黑名单的,还有同个设备安装多款借款APP,还有很复杂的模式行为的识别,黑中介,用一些激励去完成他的业务指标,比如同一地点有多个设备进行借贷,本身是互联网金融,为什么会聚集在同一个地点,还有多个设备多个IP地址的,还有同个IP地址短时间内多个ID登录,这个要依赖于客户自有的数据联合进行挖掘。还有羊毛党,比如同个设备多个ID注册,虚拟的地理位置,还有PC端手机模拟器,就相当于用传统的规则模式去做,有一些规则逾越的成本相对较低,作为软件模块植入到APP里,而且有这么大的覆盖量,维持常年长连接的情况,对规则的伪造成本还是非常高的,这一点对于识别是不是一个正常使用的设备来讲刚好是一个天然的优势。

  做一些反欺诈服务的接口可以实现,包含信息的核验,这里不是主动去暴露这样的信息,而是对于他自己填写或者进行报备的时候做一个核验,去告诉是或者否,比如他的常驻地的信息,以及常去地的信息,包括刚才蓝老师讲的,有些人玩失联,失联之后贷后管理,他失联在哪里了,是不是还在使用手机,只是换了个号,或者换手机换号,这样的模式识别都可以进行分析。还有黑名单的,包括一机多卡,一卡多机的。还有一些地址的异常,频繁安装和卸载的APP,还有一些高风险的,一些APP有一些模拟行为,包括模拟APP安装、模拟地理位置,本身装这些APP就是比较高疑的。

  还有一些地理位置长期不变的,出差、出去玩、上班,至少你出去买菜、上超市之类的。还有常年的wifi不变,长期满电充电状态,还有一些长期不适用社交APP的,这种人非常稀少,现在互联网的社交化已经非常流行,他居然没有这样的行为模式都是很异常的。这块是我们基于前面的规则之外考虑到,实际上让机器去做学习,用这样的方法论,采、察、评、用,变成动态规则,或者下沉到特征层去识别使用设备的特征是不是具有某一些机器学习做出来的模型,针对这些模型进行评和用。中间还有察的过程,对特征值进行沙箱分析。评的过程,用一些评分表的模型,对客户进行从高到低的分类,以及用的时候去看KS值区分度,或者从实际业务的结果级来看,是不是风险高的评分值和风险低的评分值和模型有一定的合一的趋势。

  除了这个之外,从源头上控制,当我们业务发展的时候,尽量去有选择性的发展新的用户或者有选择性的去覆盖其他平台的保有用户,这样精准流量超市实际上是从源头上治理乱象的一个角度。这里包含我们提出来的一个新的概念,叫“有领”人群,这是一个传统的概念,不管是蓝领、白领还是金领,至少是具有固定工作、固定收入的群体,这样的群体在相对应的金融产品上有一定的还款能力,另外对还款意愿的提升方面,包括心理状态的分析,也有一个天然的基础。这里面我们也有几类,比如稳定的蓝领、白领、金龄或者有较高收入的自由职业者,也包括无固定工作人群和欺诈犯罪人群,这里通过年龄段、消费水平、职业、APP行为、场景数据、异常行为,这样一些潜在人群在流量超市当中如何让业务的购买方能够很方便的去优选和采购。

  两个方向,一个是红海,一个是蓝海。红海这块有一些行业的保有客户,他有多方面的资金需求,在每个平台上他可能只能满足一部分需求,需要安装多个APP,这里面是不是真的有这样的需求,还是有一些恶意的行为,像我刚才分享的规则和模型都可以带来洞察。还有一批是蓝海,没有装过任何借贷APP,甚至他是白户,对于他的洞察是非常少的,这时候可以通过互联网技术,通过其他的维度,金融体系之外的维度对这个客户进行洞察,然后来决定发展这个客户的意愿和具体的手段。

  品效合一,提升推广效果,这里面我们也组织了一个媒体的矩阵,包括信息流、开屏,大家熟悉熟悉广告位置,也包括流量来源,也包括不同的结算方式等等这样一个灵活的预算管理的方式。还有一个环节,大家在采购流量或者做推广的时候,会有渠道质量管理,有些渠道总是能够带来比较优质的客户,有些渠道相对次之,甚至有些渠道看似很好,过了一段时间发现并不是那么好。这个时候有一些结算和商业合同已经做掉了,这时候如何做真正的渠道质量的评估,这里面我们也是针对渠道带来的C端的客户进行评分聚合,来帮金融企业做渠道商的评分。

  今天分享的就是这些内容,谢谢大家!

0