近年来,金融机构都很喜欢提智能风控这一概念,但市场上对智能风控并未有准确的定义。事实上,在AI潮到来之前,也没有人将风险管理与“智能”联系起来。大数据热逐渐降温后,随着人工智能的兴起,计量金融领域又迎来新一波热点:AI in Financial Risk Management。
我很讨厌“智能”这个流行词,因为其不过是将机器学习进行了有目的的包装,而机器学习也远没有发展到一个可靠的工程原则,很多不确定性、规模化、推理性的问题都没有解决。随着大数据、AI技术运用于风险管理已经越来越不鲜见,金融机构对于智能风控系统的建设需求迫切,市场成熟度和集中度也逐渐提升。我想聚焦于其内涵、应用模式和应用架构,谈一谈什么是智能风控。
智能风控有很多种“别名”,我见过的像大数据风控、决策发动机、风险计量发动机、风险模型实验室...其实都可以纳入到这一概念范畴。其基本逻辑都是运用大数据平台的计算分析能力、机器学习或深度学习模型,运用于信贷风控、反欺诈、反洗钱、交易监控、保险理赔等场景。所以,本质上是以数据驱动的风险管控与运营优化。
对于金融机构而言,智能风控并没有改变底层业务逻辑,也和传统金融的风控模式、建模方法和原理没有本质区别。只是由于大数据的引入,能够获取到更多维度的外部数据,像客户行为、电商消费、运营商数据、地理位置、购物习惯等等。与传统金融数据相比(如央行征信、交易流水、资产状况、财务报表等),虽然这些数据与客户违约本质上没有必然关系,但增加了更多风险因子和变量,可以从更多层面刻画客户风险视图,可以提升风险定价、违约计算的效果。
智能风控改变了过去以合规、满足监管检查为导向的风险管理模式,强调用金融科技降低风险管理成本、提升客户体验、数据驱动风控能效,实质上代表了一种精益风险管理思维。如果说巴塞尔新资本协议的全面风险管理(资本计量、监督检查、市场纪律作为三大支柱)是传统风控的体现,那么智能风控则是互联网、大数据时代风险管理实务的变革与创新。
从前些年的大数据风控到如今的智能风控,并没有改变数据+模型+规则的处理逻辑,而是突出了机器学习模型的应用,如线性回归、Logistic回归、支持矢量机、神经网络、深度学习、集成学习等。对于金融机构的风险管理人员来说,随着外部数据获取途径的增加,对于过去无法获取有效风险特征的人员或中小企业,风险数据得到了有效的补充,从而能够为更多的场景、人群设计不同的金融产品,从而起到了金融科技赋能普惠金融的作用。
智能风控在金融领域的应用模式应站在不同行业的视角来看。虽然本质上都是数据驱动的风险控制与管理决策,但由于银行、证券、保险的行业属性、业务场景差异较大,智能风控的应用模式也不同。
银行业:信贷、反欺诈、关联分析
虽然没有考证过,但我相信智能风控的称谓最初应来源于银行业在信贷风险管理、交易反欺诈、风险定价和关联关系监控中的大数据应用。像FICO、Experian(益百利)、Equifax(艾可菲)等公司早已通过各类风控模型来实现反欺诈或征信。随着技术手段的丰富,数据获取的逐渐便利,商业银行可以通过外部数据合作的方式获取、存储、加工不同维度的数据。通过大数据基础平台的强大算力,计算用户之间的相关性,例如电话号、邮箱、地址、设备号等。
以消费信贷风控为例,按照贷前、贷中、贷后作为风控的时间维度,以信用品质、偿债能力、押品价值、财务状况、还款条件作为评估维度,时间和评估形成不同的信贷风险关注要点。商业银行结合不同信贷风险的关注要点,进行相关数据的获取。
图:信贷风险管理控制体系
除大数据外,智能风控的“智能”主要体现在机器学习算法构建模型。在授信申请、违约损失计算、逾期预测、反欺诈等业务目标确定后,通过内外部数据的集成、预处理(如采样、PCA、缺失值填充、归一化)、特征统计等方法,再选择合适的算法进行分析。而在基础工具的运用上,由于运用到大数据技术,多离不开Hadoop/Spark这样的基础计算平台,R/Python这些数据分析工具。当前一些专注于机器学习厂商如第四范式、阿里云也研发了可拖拽的建模工具,部分降低了机器学习的学习成本和门槛。
图:智能风控的分析流程
无论是对个人或是企业的银行贷款、抵质押或担保贷款,亦或是供应链贷款、评分卡、巴塞尔协议中的贷款,还是当前热门的智能风控,根本原理都是衡量客户还款能力和意愿。智能风控只是通过更多的数据维度来刻画客户特征,从而更准确的量化客户违约成本,实现对客户的合理授信。可以看出,其原理和方法论和传统金融风控没有区别,但可以通过自动化审批来替代人工审核,降低人力成本。
证券业:异常交易行为、违规账户侦测
与银行业的智能风控专注于信贷风控、反欺诈等不同的是,证券公司、交易所更关注于“实时”、“事中”交易违规行为的侦测。从监管要求方面,沪深交易所近期也发布了《关于加强重点监控账户管理工作的通知》,要求强化交易一线监管、突出事中监管,明确了严重异常交易行为的重点监控账户监控;从技术方面,由于每日盘中连续交易阶段的数据量大、并发性高,对于低延迟实时计算、机器学习和复杂事件处理是证券智能交易风控的设计要点。
异常交易行为特征描述本质上是一个用户画像项目,对高频交易客户进行群体划分,创建用户画像体系,基于客户交易行为中的各种指标提取特征,使用这些特征作为模型的输入,输出为该用户所属的类别。特征指标如交易活跃度(下单次数,下单频率等),每单报价,持有标的、总资产、资金与持仓信息等。在证券业务层面,则需要覆盖经纪业务、自营、资管等业务。
保险业:风险定价、反欺诈与智能理赔
保险风控的主要应用领域在防骗保和反欺诈。近年来险企运用大数据技术的越来越多,基本思路是借助内外部数据在财产险的查勘、定损、核算等环节识别风险特征。以众安保险为例,其对接了央行征信、公安、前海征信、芝麻信用等外部大数据,其中公安数据包含所有已识别到的风险电话数据、短信数据等。此外,智能风控也逐渐加入生物特征识别、人脸与图像识别等AI技术,提高欺诈识别率、降低理赔成本。
前文说到智能风控是数据+模型+规则的应用模式,其实仍是一种决策信息系统,其技术和应用架构离不开数据采集、数据加工处理、数据挖掘与分析、算法模型上线等关键环节。只是相比于传统的管理信息系统,其架构多引入基于分布式架构的计算发动机(处理离线大数据)、实时流计算发动机(处理线上实时数据)、策略模型平台(算法和建模)。
在商业银行中,智能风控组件多集成于电子银行、互联网金融等业务部门的后端平台中,作为线上秒贷平台、反欺诈、反洗钱等系统的独立的规则或决策单元。
图:基于大数据技术的秒贷平台
还有一些商业银行基于大数据构建了新一代风险管理体系,其本质也是依托于大数据平台的计算能力以及大数据金融风险计量模型,为智能化、自动化风控决策提供支持。这类风险管理体系从全行角度接入包括客户信息、对公信贷、个贷、信用卡、外部数据(工商、税务、司法等)。基于大数据平台建设风险数据集市和模型实验室,综合运用了数据仓库、知识图谱、商业智能、数据挖掘与机器学习等多种技术,为多种风险类别提供决策支持,如客户信用风险、抵质押品风险、异常交易风险、操作行为风险、机构行为风险、授信风险等等。另外,也会与行内基于巴塞尔III的全面风险管理系统、经济资本计量系统进行打通,集成全行全面风险管理与控制体系。
图:基于大数据的全行综合风险管理体系
对于银行的大数据风险计量发动机,包括不限于小微企业贷款、对公客户评级与债项评级、个贷申请评分、对公风险指标计算、信用卡申请与分期评分、零售LGD与RAROC等风险指标计算,实现对零售、对公业务风险管理的全面覆盖。而人工智能技术的应用,则仍体现在机器学习、神经网络与深度学习模型在客户行为分析、反欺诈等应用领域。
除商业银行外,证券公司、交易所、保险公司的智能风控系统架构,也多数都是依赖于分布式大数据计算发动机+实时流计算发动机,将其作为独立的系统组件、或模块集成于风险预警单元、商业智能系统之中。
图:基于大数据的风险模型实验室
我过去曾写过一篇文章《大数据时代的金融风险管理》,谈到的主要是数据挖掘、机器学习等技术在传统金融风险管理中的应用方法。例如,以新资本协议为核心,以风险治理、风险限额、监控指标和内控体系为要素的传统金融风险管理,已经具备了基于模型的定量风险分析(如风险价值度VaR、债券久期与凸性分析、希腊字母分析、信用风险LGD与RAROC等),以及基于传统集中式架构的管理信息系统的支撑。
对于当下热闹的智能风控市场,我认为其问题可以归纳为三点:
第一,市场上很多所谓的智能风控系统仍谈不上什么“智能”。大部分仍是基于规则组合、条件筛选来实现风险预警、半自动化的方式来辅助人来判断。一些系统其实是做了一个客户画像和标签体系,另有一些甚至把风险指标和报表系统也包装成为智能风控平台。行业没有标准,不乏有故意夸大和蹭热度的现象。
第二,对于金融机构来说,智能风控的前提是大数据的运用,而大数据则完全依赖于场景的布局。互联网公司由于具备稳定的场景优势自然能够积累海量数据来刻画用户行为,而绝大多数金融机构仍需借助于外部数据交易的方法来补充数据维度的不足。一方面买来的数据可能缺乏金融属性,不具备参考意义;另一方面由于金融机构缺乏像互联网那样稳定可持续的场景和数据运营体系,也很难形成真正的作用和价值。所以有些机构也干脆直接买同盾分、芝麻信用分,而并不自己来建设系统。
第三、大数据强调相关性而不是因果性,且基于机器学习模型的评估和结果不具备可解释性,将其运用到实际风险审核、侦测场景中的可行性有待商榷。
所以对于智能风控,只可看作是当下大数据、人工智能风口中,风险管理领域的一种新兴技术运用模式。在风险管理的方法论上、风险管理的计量标准和监管要求上,都与传统金融风险管理模式并无区别。其特色在于,通过引入更多维的客户数据(如客户线上消费、电商、运营商、行为),重构数据和应用架构,借助分布式大数据平台的能力、机器学习或深度学习模型,能够实现大批量、快速、精准的风险事件过滤或预测,从而能够在风险管理的时效性、前瞻性、精准性、技术先进性上寻求突破。未来随着生物特征识别、图像识别、区块链等技术的成熟,或可运用于风险管理领域,形成更多智能风控应用模式。
银行与金融科技融合的理想境界是什么?是银行即服务。
2019年6月14日,亿欧智库研究院将在“2019丨全球新经济年会·金融科技峰会”上发布《2019开放银行与金融科技发展研究报告》,深度解读金融科技赋能开放银行的融合与落地应用——上海·虹桥·世贸展馆邀您见证!抢票链接:https://www.iyiou.com/post/ad/id/818