兴智慧,兴未来——记兴业银行大数据平台建设

来源:兴业银行信息中心作者: 兴业银行信息科技部信息中心 张建 陈章辉 许威 徐文怡

兴业银行信息科技部信息中心主任  张建


未来五年,金融发展面临深刻、复杂的变局。金融业特别是传统银行业的发展境遇,将由于经济新常态、利率市场化、金融脱媒、市场竞争者爆发式涌入、新技术广泛应用等叠加影响而发生变化。伴随互联网、移动互联网、物联网的迅猛发展,大数据的规模正以前所未有的速度增长,大数据正从一种计算机处理对象演变为新时代的“数据石油”


在此大背景下,兴业银行在大数据和人工智能技术应用方面持续探索,特别是在兴智慧大数据平台、兴智系列模型库以及大数据产品方面进行了一系列的实践或规划,积累了一定的经验。


一、兴智慧大数据平台


兴智慧大数据平台是兴业银行持续建设的一个智能信息服务平台,旨在构建智慧的银行信息服务体系,提升智能风控、营销、运营水平。为了达成这个目标,该平台在理念、机制、平台、产品等方面进行了全面创新。


1.理念创新


技术发展基本上沿着“硬件-软件-PC互联网-移动互联网-大数据-人工智能”的轨迹从IT时代发展到DT时代,同时正向着RT时代迈进,自然语言处理、智能语音交互、情感计算、认知计算、机器学习等人工智能技术的发展已呈现出爆发之势。


在这一趋势中,我们深刻地认识到“围墙里”的数据如果不与外部关联注定难以成为大数据。大数据需要开放式创新,金融数据需要工商、法院、税务、电商、社交等数据的相互关联,才能有大数据,才能有跨界大连接,才能产生数据智能。可以说,没有开放就没有大数据,没有连接就没有智能。


2.机制创新


良好的机制是使数据价值持续增长的动力,兴业银行正实践着一条机制创新之路


一是接地气机制,科技工作人员经常到分行一线走访,了解一线业务人员的需求痛点,邀请先进分行分享业务管理过程中的特色做法,建立100多个覆盖一万多人的业务交流群,实现创意收集、营销推广、成果反馈等社交功能,持续强化数据产品迭代与应用的效果。


二是强化抢单机制,根据员工承接任务的情况,多产多得,把过去派工难、派工烦的问题转变为大家抢活干、争活干的良好局面。


三是引入试验机制,将大数据分析过程转化成为更容易使用的数据产品,快速迭代、螺旋上升,推向业务一线,加速数据的价值转化。


四是引入赛马机制,根据数据产品的运营情况和业务价值优胜劣汰,提升数据产品团队的战斗力,加大优秀团队的资源配置。


3.平台创新


数据采集方面,购买和爬虫相结合,拓展大数据来源,激发业务模式创新,并构建统一的外部数据服务竞价管理、内部成本计量管理体系。


数据处理与分析方面,加强数据仓库、数据集市等基础数据平台建设,加强大数据存储和加工基础平台建设,研究与应用流计算、分布式计算、并行计算、内存计算等,加强半结构化、非结构化数据处理集成,建设实时数据处理技术体系。


数据应用方面,注重形成数据分析的决策、行动、反馈的数据应用闭环,并通过各类数据产品和工具满足不同用户的信息使用需求。


4.产品创新


结合重要业务需求,持续优化推广创新数据产品,并每年新推一、两款特色数据产品。加大运营力度,智能感知生活、生产各场景,智能风控或营销,将复杂工作简单化,提升用户体验,并积极推进“四化”服务:


移动化,采取移动优先策略建设各类移动数据服务;可视化,积极开展信息设计,引入可视化工具,提供各类可视化信息服务;极速化,优先在客户营销、客户服务领域开展实时数据服务;互动化,通过满足客户社交互动等需求,提供促进社会化营销、精准营销等的数据服务;通过语义识别等技术提供更自然的人机交互。


二、兴智系列模型库


经过多年的积累,兴业银行基于各类内外部数据开发了一系列的数据分析模型,构成了兴智系列模型库,具体包含兴智风控、兴智营销、兴智运营、兴智绩效系列等模型库设计,日益成为业务部门经营、管理所依赖的极为重要的武器库。


未来五年兴业银行将引入机器学习(含深度学习)等算法,自然语言理解、智能搜索、认知计算、情感计算、图像识别、语音识别等人工智能技术,持续完善数据分析模型,提高风险管控能力,增强客户服务能力,提升营销的精准度和效率,构建智慧银行核心竞争力。


以兴智营销系列模型库为例,贵宾客户降级挽回、贷款非核心客户提升和高交易频次信用卡客户交叉营销三个精准营销模型共计提升零售核心客户9万余户,综合金融资产较模型部署前有提升的客户共51万余户,累计提升资产156亿元。


代发工资客户精准营销模型,提升两家试点分行代发客户综合金融资产近11亿元;潜在VIP客户识别模型为六家试点分行带来13.7亿元理财销售金额,营销客户近1.2万户,营销成功率较撒网式营销提高3倍;安愉人生精准营销模型营销为六家试点分行有效提升客户存款约5000万元,营销成功率较撒网式营销提高5倍。


兴智模型库的核心就是提炼出异常的大数据、找到数据间存在的关联,以及利用大数据进行相关预测:


(1)异常——生异之异。异常的数据通常具有异乎寻常的重要性。在海量数据中提炼出异常的规则引擎,挖掘出异常的结果集,是洞察“异常”最重要的两点。在风险管理方面,提炼出结算量突然减少、还款来源不稳定等异常规则引擎,生成极端异常的黑名单、灰名单;在精准营销方面,挖掘出高净值人群的特征,找到有钱人,生成含金量极高的金名单。


(2)关联——求同之同。在海量数据中找到关联,如股东关联、担保关联、投资关联、上下游关联等,并构建多级关联,透过孤立的表象了解到事物的内在联系,以建立对客户的整体认识。


(3)预测——度势之势。通过管理并处理大量完整的数据,预测未来发展趋势,其中预测未来3~6个月的趋势尤为重要。若能通过大数据分析,对汇率、利率、房地产价格走向等方面作出准确的前瞻性分析与判断,将给银行的经营决策带来价值量巨大的信息。


三、人人都是大数据分析师


兴智慧大数据平台根据用户的差异,提供相匹配的大数据产品,真正实现人人都是大数据分析师。


针对大众用户,兴业银行推出或规划了“兴资讯”、“万花筒”等产品。“兴资讯”为兴业银行的资讯门户,已纳入120多个重要指标,让各级管理者能够随时随地看到所辖机构的经营状况,目前用户量超过1万个,总访问量突破180万次,组织各分行、总行各部门新闻小编500多名,成为行内最大、最全、最及时的信息发布平台。


针对风险管理人员,兴业银行设计研发了“黄金眼”、“核贷宝”、“风控搜”、“黑名单”等创新大数据产品。


“黄金眼”利用图关联技术可视化展现客户的担保、资金、关联关系网络,通过四大维度、百余项指标构建客户异常评分系统,每周对信贷和类信贷客户进行全面扫描,轻松实现对异常客户进行预警,平均命中率突破35%,排查风险77亿元。


“核贷宝”通过机器自动抓取各网站数据,同时智能生成征信报告,解决了原先多岗查多网,再整合数据过程中所存在的工作量大、效率低、成本高、易造假等痛点,极大地减轻各岗位工作量,并避免了人工操作失误,有力促进贷款审核流程的革新,目前累计查询突破50万次,每年节约人力成本6000万元。


“风控搜”是定位于互联网风险类信息查询的搜索引擎,产品主要借助搜索引擎对使用者关注的公司或个人在互联网上的信息进行整合,已吸引了2万用户,排查负面舆情的效率提升10倍。


“黑名单”运用了自然语言处理等人工智能技术,整合了法院、环保、质检、税务、P2P平台等黑、灰名单数据,不仅为集团各子公司提供高质量的风控信息服务,同时覆盖了用户生活中婚恋、求职等场景,保障资金安全、生活安全,产品试运行半年以来查询量突破60万次,为上万亿元资产保驾护航。


针对营销业务人员的需求,兴业银行推出或规划了“瓦西里”等创新大数据产品。“瓦西里”在兴智模型库的营销模型的支持下,实现对客户经理下发营销名单和跟踪名单的功能,配合私人银行部、客户发展部等业务部门开展以老带新、潜在价值客群提升等专项营销活动,成效显著,客户金融资产提升700亿元。


“世界潮流,浩浩荡荡”。短短数载,大数据浪潮以排山倒海之势席卷全球。潮流和趋势不可阻挡,方向越来越清晰,我们唯有迎接全新的机遇与挑战,积极探索,勇于尝试,才能乘风破浪,踏上这场变革的浪潮之巅。