Your browser doesn't support the features required by impress.js, so you are presented with a simplified version of this presentation.

For the best experience please use the latest Chrome, Safari or Firefox browser.

普华永道风控研究报告解读

徐静 @ 2017/09培训交流

1.大数据风控行业动态简介;

2.反欺诈问题及需求;

3.反欺诈数据来源简介;

4.建立反欺诈模型的目的;

5.反欺诈评分模型的开发;

大数据风控的发展现状


大数据风控即大数据风险控制,是指通过运用大数据构建模型的方法对借款人进行风险控制和风险提示. 传统的风控技术,多由各机构自己的风控团队,以人工的方式进行经验控制; 但随着互联网技术不断发展,整个社会大力提速,传统的风控方式已逐渐不能支撑机构的业务扩展;而大数据对多维度、大量数据的智能处理,批量标准化的执行流程,更能贴合信息发展时代风控业务的发展要求;越来越激烈的行业竞争,也正是现今大数据风控如此火热的重要原因.




(来自百度百科)

1.数据已经撼动了世界的方方面面,从商业科技到医疗、政府、教育、经济、人文以及社会其他各个领域


2.早在1980年,阿尔文∙托夫勒(AlvinToffler,1980)在《第三次浪潮》一书中就预言大数据将成“第三次浪潮”


3.奥巴马政府将大数据定义为“未来的新石油”。凯文∙凯利(KevinKelly,2014)认为所有的生意都是数据生意


4.2013年互联网金融将“大数据”推向了新的高度。金融的核心是风险控制,将风控等Fintech技术与大数据结合、不断完善和优化风控制度和体系,对于互联网金融企业和传统金融企业而言同等重要。

应用层面,金融行业利用大数据进行风控已经取得了一定的成效。使用大数据进行风控已成为美国等发达国家互联网金融企业的标准配置

美国


1.美国Zest Finance公司开发的10个基于机器学习的分析模型,对每位信贷申请人的超过1万条原始信息数据进行分析,并得出超过7万个可对其行为做出测量的指标,而这一过程仅仅5秒钟内就能全部完成


2.为网上商家提供金融信贷服务的公司Kabbage主要目标客户是ebay、Amazon、PayPal等电商,其通过获取这些企业网店店主的销售、信用记录、顾客流量、评论、商品价格和存货等信息,以及他们在Facebook和Twitter上与客户的互动信息,借助数据挖掘技术,把这些店主分成不同的风险等级,以此来确定提供贷款金额数量与贷款利率水平

中国互联网金融企业对于大数据风控的运用也如火如荼


1.阿里推出了面向社会的信用服务体系芝麻信用


2.腾讯的微众银行推出的“微粒贷”产品,其风控核心就是,通过社交大数据与央行征信等传统银行信用数据结合,运用社交圈、行为特征、交易、基本社会特征等维度对客户综合评级,运用大量的指标构建多重模型,以快速识别客户的信用风险


3.对于大数据风控的理论研究尚处于萌芽阶段(CNKI数据库)


4.虽然大数据风控在实践上已经有所进展,但是其有效性也受到一些挑战(要不然也养不活我们这样的贷后金融行业)

问题:当前大数据风控有效性?


A.数据的质量问题:社交数据的真实性;交易数据的真实性

B.大数据风控的理论有效性问题:金融信用与社会信用的相关性不确定;大数据对于“黑天鹅”事件的滞后性

C.大数据收集和使用的制度问题:在数据收集和使用的过程中也面临如何合法使


优化路径

A.多维度的收集数据,互联互通,打破数据的孤岛

B.从供应链交易环节获取数据

C.积极布局“物联网+”,”区块链“等技术

D.对于金融研究部门而言,可从经济、金融等多个角度综合论证大数据风控的有效性,为大数据风控提供理论支持

对于政府监管部门而言,要推动和完善与数据相关的制度建立



问题:

信贷风险并非主要集中在信用风险,而是主要集中在欺诈案件方面;

随着线上化业务的发展,国内欺诈案件的增长呈爆发趋势,反欺诈成为金融机构业务开展过程中所需要解决的核心问题

需求:


大量的欺诈人员及黑灰产业链的存在,将互金平台信贷业务当成资金来源

大部分欺诈来自于平台和欺诈人员的内部勾结

风控模型的验证至少两到三年,互金发展太快,需急速迭代的风控模型,方可适应发展

申请欺诈导致经济损失巨大,很多互金企业是因申请欺诈而倒闭

欺诈团伙的犯罪成本低

欺诈团伙的花样多

欺诈团伙的跨平台性(不少于六成的团伙欺诈,被发现会同时攻击多家机构)

数据需求之申请欺诈


第一方申请欺诈:

多年养号,一朝并发

金融机构积累的内部数据及外部数据

用户其他交易数据,研究日常生活的活跃因子

申请人关系数据

设备指纹IP,登陆cookie等,活体生物识别数据

其他金融机构交易数据


第三方申请欺诈:

盗用他人信息进行信用服务的申请

最重要的是针对申请者提交的相关信息与申请者本人的身份做多维度,实人化的实时打分评判

不仅从进件信息(姓名,身份证,电话,地址等维度),对申请者的信息点强大的底层数据库做拓扑与机器学习分析

在线网络信息(IP,Mac地址)设备号信息做大规模的搜索和实时匹配

交易欺诈


反交易欺诈是利用信用卡当前交易信息和历史交易行为模式对比来进行预测当前交易为欺诈的概率的模型,为智能型反交易欺诈授权策略提供科学依据,对欺诈风险高的交易可以拒绝授权和展开调查

典型的信用卡交易欺诈案例

伪卡

盗刷

需要刻画历史交易相关的所有数据及其他外部数据

建立反欺诈模型的目的

时效性:海量数据寻找信号,更早发现欺诈风险

灵活性:根据风险情况及人力,灵活配置欺诈防范策略

节省人力: 准确聚焦,避免了乱撒网式的排查工作

反欺诈评分模型(Sample Example)

1.基于神经网络的欺诈评分系统的R,Python实现

2.XGBoost申请欺诈侦测模型的R,Python实现(X)


slides已托管在

3.GitHub(https://github.com/DataXujing) 4.RPubs(http://www.rpubs.com/DataXujing/FKslides)

Use a spacebar or arrow keys to navigate