中国银联采取积极方法降低风险

基于英特尔® 技术计算集群的机器学习算法智能替代规则

案例研究

  • 金融服务

  • BigDL: Distributed Deep Learning on Apache Spark

author-image

签署人:

作为以英特尔® 技术为基础的智能系统先行者,人工神经网络风控体系,已在中国银联证明了利用机器学习的价值:主动、高效、准确的风险识别并简化工作流程,其使用一个基于 Cloudera CDH 和 Apache Spark* 计算集群的平台,可达到 60% 的涵盖率。

挑战

与世界各地的金融机构一样,中国银联的交易量正大幅增长。这带来了机遇,也随之增加了欺诈、威胁等风险。银联目前基于规则的风控系统,受限于敏捷性和速度,在识别和应对新兴的威胁力有不逮。它需要更积极、智能的方式保护自己和客户。

解决方案

中国银联部署了一个基于稳健的 Apache Spark* 计算集群,以及其开源深度学库-BigDL 的神经网络风控系统,BigDL 可以允许用户开发自己的深度学习应用程序来作为标准的 Spark 程序。由英特尔技术支持的新平台使用机器学习的方法来提供更大的一致性和高效性,同时能够显著降低用户开发、部署和维护的工时。

选择 BigDL 是因其能提供综合大数据平台内全方位端到端分析功能,还可在需要支持海量大数据的处理进行有效扩展。

影响

与基于规则的风控系统相比,使用新模型的系统提供了高达 60% 的涵盖率,在短短数月的最优训练模型中,还令其实现了 20% 的精确率。通过减少人工干预,让风险控制能力融入更多智能,中国银联能令其内部团队投入更多时间在战略项目中,例如评估如何将分析工具和数据科学应用到其他领域的运作上。

商业挑战

我们使用银行的方式正在迅速改变,包括移动、在线和社交媒体在内的现有交易渠道已变得多种多样。这种日益复杂的支付环境,在给消费者带来更大便利的同时,也对传统安全模式提出了挑战。黑客和网络犯罪分子可以利用在银行和支付系统中的新交易类型中增加的漏洞。根据 2016 年律商联讯的研究报告1,每月的欺诈交易的数量和价值均增加。该报告指出,在所有成功的欺诈交易中,移动交易从 2015 年的 26% 上升到了 35%,更为严重的是,欺诈成本现在已相当于美国商人平均收入的 1.47%。

同样的情况正在全球各地发生,欺诈威胁正随着支付行业本身的发展而增长。在中国,据中国互联网络信息中心(CINIC)统计,移动支付用户数在 2015 年底达到 3.58 亿,增速为 64.5%2。中国银联一家每年需要处理 200 亿单支付业务。

随着时间推移,攻击策略也随之演变,而风险变得越来越复杂。如果不再开发一个更直观和智能的风控系统,银行和金融机构都在承受越来越大的压力。最近的安全漏洞和欺诈活动的报告表明,消费者无法容忍任何形式的银行失误将迫使高级管理人员对现有风控系统执行更高级别的审查。

支付机构传统上使用预先配置的,基于规则的系统来控制和消除风险。这些系统通过建立和更新规则库来评估和减轻金融机构的风险,规则库会根据预先设定的用户行为特点以及以往的风险数据在统一数据库中编制。例如金融机构会在一个主要销售日常用品的小便利店设置一个 POS 终端。这意味着小额交易将被视为日常规范,如果出现了异常的大额交易,所设置的基于规则的风控系统就会触发告警来验证交易的真实性。

随着交易量的增长,基于规则的风控系统正变得不可持续。它需要投入大量的时间和资源来保持更新,并会带来无法接受的停机时间。它也无法应对任何尚未被规则覆盖的威胁,企业不应采取这种被动的方式并依赖其预测未来风险的能力。

随着中国银行业全面开放,行业竞争呈不断加剧之势。银行在以加快业务发展的方式来争夺客户市场的同时,也面临与此相伴且不断增长的各种风险的威胁。从业务角度,欺诈类型分为发卡端欺诈和收单端欺诈。发卡端欺诈包括:虚假申请、伪卡欺诈、非面对面欺诈、未达卡、非法冒用(账户接管)等;收单端欺诈包括:商户欺诈套现、POS 违规移机、商户侧录、伪冒交易合谋、卡号测试、恶意倒闭、洗单等。

根据央行公布数据,2015 年我国银行卡在用发卡量达到 54.42 张,交易 852.29 亿笔,金额 669.82 万亿元;银行卡欺诈率为 1.99BP(每万元中发生的欺诈金额占比),欺诈损失率为 0.13BP。以此计算,我国 2015 年银行卡欺诈金额总计 1392.6 亿元,银行卡欺诈损失约 87 亿元。

由于银行卡欺诈给银行、收单机构及银行卡组织带来了巨大的风险及损失,各机构也积极采取措施进行银行卡欺诈侦测工作。目前,银行卡欺诈侦测主要依赖于规则,通过用业务人员的专家经验或者通过统计方法形成规则或评分方法,然后通过规则引擎对交易进行判别,这种方式形成的规则结果解释性较好,但是严重依赖于专家经验,无法发现新的欺诈模式。

随着移动支付及互联网业务的快速发展,银行卡欺诈风险开始向线上交易转移。相对于传统欺诈案件,网络支付渠道的欺诈表现出犯罪隐蔽、涉案区域分散、犯罪链条长等特点,风控难度更大。目前,神经网络等机器学习算法在 FICO、PayPal 等机构被广泛应用于银行卡的反欺诈工作,并取得了很好的效果。这种通过机器学习的欺诈交易侦测方式,不依赖专家经验,可发现新的欺诈模式,并且欺诈侦测效果准确,受到越来越多研究人员的关注。

基于上述情况,中国银联电子商务与电子支付国家工程实验室联合英特尔技术团队基于双方优势共同开展了基于神经网络的线上欺诈交易侦测模型研究工作。英特尔技术团队提供了开源机器学习平台 BigDL,并在架构方案、数据建模、参数调优等方面给予了有力的支持。

基于规则的风控模型与基于神经网络的风控模型对比:

方案综述

英特尔设计了一种智能的,基于稳健的 Apache Spark 计算集群的人工神经网络风控系统,其基于网络的机器学习软件,拥有超过 10TB 的训练数据,100 亿的训练样本和独特功能。与传统的,依赖于预先配置警告来检测异常事件的风控系统不同,该基于神经网络的风险控制模型解决方案能够通过使用丰富的算法来提高风险检测的准确性,这些算法能够识别在大数据集中的非线性特征。当新的信息更新到系统后,系统通过机器学习来提高风险预测的准确性,潜在的异常会被迅速重点关注。

中国银联采用 Cloudera CDH * 计算集群部署系统,利用单一平台在一个高度安全的环境下整合并分析所有类型,所有渠道的数据。英特尔® 至强® 处理器强大的性能以及对 Apache Spark 的持续优化是成功实施的关键所在。

商业成果

作为以英特尔® 技术为基础的智能系统先行者,人工神经网络风控体系以及 BigDL 是中国银联为自己设定的竞争优势,同时也是其通过机器学习在金融领域内应用,凸显价值来显示其领导地位。在基于规则的风控系统依赖预先设定的警告发现异常交易的同时,中国银联的智能系统以历史数据为样本,利用机器学习和评估模型,可以快速分析、聚合和关联数据。这有助于神经网络系统实时判断交易是否合法,实时消除风险。

Spark 架构支持大量的中间计算单元和迭代计算,这是需要运行神经网络算法。计算结果可以被缓存以备未来使用,随着时间的推移,系统的有效性也会逐步提高。

通过使用英特尔和 Apache Spark 架构,与基于规则的风控系统相比,中国银联新系统能够提供高达 20% 的正确度,同时也具有 60% 的涵盖率,这令其在短短几个月内就达到了最佳训练模式。该系统还使内部团队围绕原始数据开展如何应用分析工具和数据科学实践的研发工作。

总体而言,据有丰富经验的中国银联金融部门与英特尔的技术能力相结合,已经被证明可以高效应对其支付系统的挑战。技术还在继续发展,将机器学习的方法延伸到在线支付领域仍处在试验阶段,中国银联制订了一个战略计划来迎接未来的挑战。它将利用数据分析,来提高用于加强用户识别、以及其他银行和结算系统关键领域的新方法的有效性。

中国银联简介

成立于 2002 年,位于中国的中国银联是一个提供专业银行服务和支付系统的国际金融机构。它拥有世界上第三大支付网络,在亚洲、欧洲和美国的 160 个国家开展业务。它是中国唯一一个成功连接全国各地不同银行自动取款机的银行网络,这使得客户和银行能够无缝地执行和处理跨地区和跨境交易。

找到适合于您公司的解决方案。请与您的英特尔代表联系,或访问英特尔 intel.com/FSI。 这里提供的所有信息可在不通知的情况下随时发生变更。请联系您的英特尔代表,获得最新的预测、计划、规格和路线图。

英特尔技术特性和优势取决于系统配置,并可能需要相关硬件和软件的支持或激活相关的服务。性能变化取决于系统配置。没有计算机系统是绝对安全的。请与您的系统制造商或零售商核对信息,更多信息,请联系中国银联。 英特尔公司 2017 年版权所有。所有权保留。英特尔、英特尔标识是英特尔在美国和/或其他国家的商标。

* 其他名称和品牌可能是其他所有者的资产。

产品和性能信息