文: 鄂维南
转自:普林科技
导读:2016年3月24日,“第九届中国城市商业银行信息化发展创新座谈会”召开。可以说,大数据已经成为金融发展转型的动力源泉。大会为此专门邀请了国际著名数学家,人称“大数据院士”的中国科学院院士、北京大数据研究院院长、普林科技技术指导委员会主任鄂维南教授就“大数据在银行业如何务实落地”发表了主题演讲。
作为著名学者,鄂院士首先表示这是首次看到整个社会对一项技术产生强烈的兴趣,这背后的深刻原因正是中国经济的转型升级。谷歌的Alpha Go战胜了人类围棋最强选手,其背后的机理便是大数据技术。可以说,这是人类社会一个前所未有的机会,通过大数据技术可以帮助我们做出更加智慧的决策。
就整个大数据应用产业链条而言,首先随着互联网、物联网的发展,企业经营活动、消费者行为产生了海量数据;于是数据采集、传输、存储技术应运而生,Hadoop、Spark等大数据分布式基础架构风生水起。
随后在数据基础上进行基本的运算处理,获得对数据的初步认知。
最后便是应用数据挖掘技术,找到数据背后的规律,形成新的业务认知。当完成这最后一步,大数据的价值才真正被完全释放。
在这方面,除了大家熟知的谷歌,美国还有一家专业从事大数据建模分析的公司Palantir,据传正是他们协助美国政府找打了本拉登的藏身之所。
中国也有一家公司普林科技专业从事这方面的工作,他们帮助央行打造新一代评分模型,帮助证监会构建资本市场征信体系等。
说回到银行业,目前银行业主要面临三方面的挑战。
首先,经济下行,需求不足,这对银行业的精细化管理提出了更好的要求。
其次是新技术的冲击,互联网加大数据催生除了互联网金融、大数据风控等全新的金融业态,传统银行所秉承的经营理念、技术手段遭到了前所未有的挑战。
最后,相比于美国,可以说我国的银行业基础设施还是不够健全,个人征信报告的覆盖人群仅3.7亿,这也就意味着大部分中国人没有任何核心的金融履约行为记录。
具体到城商行,面对这样的大形势,有四方面的问题更为突出。
那么,大数据技术可以如何帮助城商行应对这些挑战呢?
首先,我们来看信贷风控。
信贷风控是银行业务最核心的一环。要达到好的风控效果,好的风控模型和好的数据源都很重要。
就数据源而言,我国有3.7亿人在央行有个人征信报告,这种金融履约行为是对一个人进行授信最核心的数据源。
其次,个人在银行内部的交易数据、理财账户开通数据、存款数据等等可以作为个人金融行为数据的补充,对用户进行更丰富的描摹。
最后,互联网社交行为、手机通讯行为、电商平台交易行为等,可以作为对个人信用描摹的外围补充数据。
这里举一个例子,大家都知道,我国有征信报告的人总共有3.7亿,那么那些没有任何金融履约行为记录的人,在申请贷款时该怎么办呢?
传统的信用评估方法本质上其实一直秉持的是相同的理念,即假定难以得到大量数据、存储大量数据成本过于高昂,或者说不可能使用大体量的数据。所以基于银行本身数据的、基于经验的审贷方法一直占据了主流。
但是大数据时代改变了这一切。传统的信用评估只关注信用历史等几个变量,因而那些“金融活动不足者”便难以获得贷款。于是美国一家公司收集了许多看起来微不足道的数据,甚至包括打字速度在内的上千维度的信息,再通过机器学习的方法建立这些信息和违约率之间的联系。结果显示,这种基于大数据和机器学习的评估模型较业内一流信用评分改善了40%。
可见,相对外围的个人行为数据,结合大数据新算法,可以化学反应出非常神奇的结果。说回中国,其实现在也有很多互联网征信企业,试图通过借款人在网上的行为记录来辅助放贷决策;也有公司试图通过覆盖面达到了12.3亿人的手机,来“增厚”个人信用报告。
比如普林科技就打通了三大电信运营商,通过一个人的手机消费金额、通话对象、停机次数等众多维度手机使用行为信息,来对信贷申请人进行信息核验和风险评估。
我们再来看一下面对金融诈骗、网络诈骗案件增多的情况,大数据可以如何帮助城商行?
基于行为标签化的行为分析与异常识别是一点。通过对用户的个人信息、交易偏好、交易习惯等大量信息的分析,可以清楚地描摹每一个用户,甚至可以得出许多借贷人本人都不清楚的习惯。一旦这个账户出现了某些不符合分析结果的异常交易行为,就能够被精准地识别出来。
关联分析和社交网络分析也是数学模型在金融反欺诈中的绝佳应用。比如诈骗团伙常常通过电话、邮编、身份证号、地址等不同类型的信息互相关联,这些不同的关联关系对应着特定类型的图结构,通过大数据建模分析技术,可以构建基于图的典型欺诈团伙模式库,从而识别不同模式的诈骗团伙。
此外,在对申请人的信息进行处理时,其背后也用到了自然语言处理技术和中文模糊匹配技术,从而实现精准的分析匹配黑名单。
城商行目前面临的第三个问题是,对客户了解不够,细分不够,从而难以进行有效的产品营销。那么我们如何认识我们的客户呢?
这时就需要用到基于标签化的用户画像技术。用户画像本质就是从业务角度出发对用户进行分析,了解用户需求,帮助寻找目标客户。这里举个例子帮助大家理解。
普林科技通过大数据分析和用户画像,为某商业银行深入分析用户的基本信息、消费行为、交易流水等,结合业务场景,将用户细分,业务部门再据此设计产品、制定营销策略,从而节省了45%的营销成本。
最后,目前银行内部数据之间,内部和外部众多数据源之间难以进行数据整合和共享。我们以对公业务为例,传统想要了解一个公司,需要投入大量的人力和精力去获取各种信息,再根据经验做出判断。
而在大数据时代,通过互联网爬虫技术,我们可以获取并整合包括工商、法院、税务、互联网舆情、企业招投标、招聘等海量数据,再通过建模分析将之归结为信用历史、运营指标、舆情指标等多维度,最后输出综合评分。其背后的技术则是网页解析技术、图像识别技术、自然语言处理技术和大数据建模分析技术。
首先,打造核心的风控与反欺诈系统,提高核心竞争力。
其次,将数据分析成果与营销优化的具体方案结合,切实落地。
最后,立足本行数据,结合外部数据源,与专业分析团队合作,有效实现数据共享、信息整合与技术融合。