人工智能,从至强® 开始

中国银联重塑金融反欺诈模型,效果显著提升

下载文档

电子商务与电子支付国家工程实验室* 是 2013 年经国家发展改革委审批认定,由中国银联* 承建的金融业首家国家工程实验室。实验室的建设目标是建成国内一流、国际知名的电子商务与电子支付研究基地,全面加强技术攻关,力争在全球电子商务、电子货币和电子支付技术领域占据领先地位。而另一个行业新星众安科技* 源于保险业巨头众安保险*,以云计算、人工智能等领域的基础技术研发为导向,业务涵盖金融及健康医疗领域的上下游及周边,其牵头探索互联网保险生态等创新业务模式,正为用户输出综合性的行业解决方案。

金融行业业务的高速扩张也意味着风险指数的急剧上升,尤其在金融欺诈风险上,一项来自尼尔森* 全球银行卡报告的数据显示: 2016 年全球银行卡欺诈损失率已高达万分之 7.15 。居高不下的欺诈率背后是传统风控方法在精准度和时效性方面面临挑战,金融企业迫切需要建立更新的智能风险防控体系。为此,电子商务与电子支付国家工程实验室、众安科技以及英特尔三方针对相关金融风控需求,结合各自的优势,共同开展了基于深度学习的反欺诈技术研究,并结合以往基于规则和传统机器学习等方法中汲取的经验,创新提出了基于三明治结构的多层欺诈侦测方案框架。该方案目前已在伪卡、套现欺诈侦测等场景进行了实测,获得了良好的效果,并有望在其他交易欺诈、信用欺诈以及保险欺诈等更多风险侦测场景发挥优势。

面临挑战

金融反欺诈面临新的挑战:互联网时代的到来,令金融欺诈行为变得更高频化和精准化,层出不穷的欺诈行为给社会生活带来巨大不安,传统的反欺诈方法和模型亟待改进,以应对新的挑战。

深层次交易特征学习能力不足:基于规则和机器学习的金融反欺诈模型在对相对复杂的序列化交易特征进行学习时,效果低于预期,同时单一的深度学习方法也存在单笔交易内特征学习能力有限的问题。

解决方案

三明治结构欺诈侦测模型:电子商务与电子支付国家工程实验室、众安科技与英特尔一起,创新地提出 GBDT→GRU→RF 三明治结构欺诈侦测模型架构,通过多层学习的方法,规避序列化交易特征学习能力不足以及单笔交易内特征学习能力有限等问题。

英特尔技术提供全面支撑:英特尔不仅为新模型提供了性能卓越的英特尔® 至强® 处理器产品家族作为动力源泉,也对模型中的三层方法分别提供了针对性的技术和工具优化,提升模型的整体工作效率。

成果

创新性反欺诈模型树立行业标杆:电子商务与电子支付国家工程实验室、众安科技与英特尔一起,创新性地利用多层深度学习方式来帮助金融反欺诈模型具备更优性能。试验系统的良好效果表明了这一方案具有可行性,也为深度学习等先进技术手段在金融行业的进一步应用与创新提供了示范。

英特尔技术在金融领域的应用:在三明治结构欺诈侦测模型架构中的应用与成功,验证了英特尔产品与技术能够对人工智能在金融行业的应用提供正向助力,同时这些项目的经验也反哺英特尔,帮助其完善自身产品与技术。

金融业务在给人们带来便利生活的同时,也带来日益严峻的欺诈风险。除了传统层出不穷的金融欺诈手段,例如信用欺诈、盗刷欺诈,恶意套现以及保险业骗保等,伴随互联网时代出现的个人信息泄露、欺诈黑产化等问题,也导致更高频化、精准化的欺诈犯罪,羊毛党、互联网欺诈等行为正在变得愈发猖獗。以银行卡为例,传统风险与新型风险相互交织,各类犯罪手法不断翻新,如图一所示,自 2010 年开始,全球银行卡欺诈损失率随着欺诈损失金额增长而逐年上升。2016 年欺诈损失金额达 247.1 亿美元,相比 2010 年的 4.5BP 上升 60%1

图一:不断上升的全球银行卡欺诈损失金额和损失率

为应对这些问题,电子商务与电子支付国家工程实验室、众安科技等一系列金融行业巨头持续开展金融反欺诈的各项行动,并联手信息行业巨擘英特尔,将前沿的人工智能技术引入反欺诈领域,构建了一系列高效可靠的反欺诈模型。

创新的三明治结构欺诈侦测模型

目前,金融行业对交易欺诈风险的侦测方式主要有两种:基于规则和基于机器学习算法。基于规则的方法是通过不断建立、更新基于交易行为特征的规则库,并在交易发生时,通过查询规则库判别交易潜在的风险。例如某便利店出现大额支付行为时,规则库就会去匹配这一交易行为是否具有异常特征。基于规则的反欺诈方法是基于对以往交易欺诈经验的总结与归纳,其主要依赖专家经验,存在一定的主观因素,且难免出现一些疏漏,在交易欺诈方式层出不穷的今天,存在一定的不足。

与基于规则的方法相比,基于机器学习方法的反欺诈方案具有更好的客观性及准确性。机器学习中一些优秀的分类算法,例如 LR(Logistic Regression,逻辑回归), RF(Random Forest,随机森林)以及 GBDT(Gradient Boosting Decision Tree,梯度提升决策树)等分类算法能够较好地学习到一些潜在欺诈模式,并已经被电子商务与电子支付国家工程实验室、众安科技等应用于反欺诈模型中。但在实际交易场景中,特征工程可能较为复杂,例如深夜在便利店,一张很久不用的信用卡突然出现大额支付行为,或者一个病毒性感冒患者长期频繁就诊且开具巨额药品。这里出现了 “深夜”、“很久不用”、“便利店”、“病毒性感冒”、“巨额” 等多种复杂特征,对传统机器学习的方法提出了挑战。

针对这一挑战,电子商务与电子支付国家工程实验室与英特尔双方工程师前期基于英特尔® BigDL 库、Spark Pipe Line* 等技术进行流程化建模。这些技术能够很好地将复杂的特征学习工作流水化,并提高最终模型的效果。在建模过程中,工程师们从少量的原始字段中衍生出数百个特征因子,并形成长短时统计、可信度等 6 个维度的特征变量,帮助模型进行更好的学习。

但该模型在实际测试和应用中,被发现仍存在一些问题,例如特征工程的建模与计算较依赖专家经验,同时基于机器学习的方式缺乏交易序列分析,在对纵向交易行为进行分析时缺乏一定效力。因此,电子商务与电子支付国家工程实验室、众安科技与英特尔联手开展进一步合作,尝试使用深度学习方法来自动学习交易序列相关的特征。

方案中首先选用单一 RNN(Recurrent Neural Networks,循环神经网络)方法,采用 LSTM(Long Short-Term Memory,长短期记忆网络)方法或 GRU(Gated Recurrent Unit,门控循环单元)方法来直接对交易数据进行欺诈侦测建模,但效果却不太理想。究其原因,是 RNN 网络虽然能学习到交易序列间的特征关联,但对单笔交易内特征的学习能力只与传统浅层神经网络能力相仿,达不到预期的目标。

为了让新模型能更好地加深交易序列间特征关联的学习,三方专家提出一种创新的多层混合型欺诈侦测模型框架。这一框架采用了一种 “GBDT→GRU→RF” 的三明治结构。如图二所示,首先框架将针对单一 RNN 方法在单笔交易内特征学习能力不足的不足,在框架的前端引入 GBDT 模型进行进一步的特征优化,将优化后的特征与人工特征相结合,作为 GRU 网络的输入,以此来学习序列间的特征,并且能够将单笔交易内的特征时序化。

图二:前部 GBDT→GRU 结构

在中间层,框架也没有直接使用 GRU 网络的输出作为直接的欺诈侦测判别,而是将其作为序列间特征学习的一环,将学习得到的序列间特征与原先的交易内特征相结合,形成最终交易特征向量,在此基础之上,为进一步地将时序特征进行融合学习,框架最后还叠加了一个顶层的 RF 模型,作为最终的欺诈判别分类器,这一框架的整体结构如图三所示。

图三:GBDT→GRU→RF 三明治结构欺诈侦测模型架构

针对新的深度学习欺诈侦测模型,三方工程师分别针对伪卡欺诈侦测,骗保检测等银行、保险业务常见应用场景,采用真实数据进行了多项仿真验证。GBDT→GRU→RF 三明治结构欺诈侦测模型无论是在召回率还是在准确率方面都达到预期效果。与传统分类器方法或单一的 RNN 方法相比,该模型的 F1 值(一种准确率和召回率的加权平均值,用于衡量侦测模型性能)明显增大,部分场景下可获得 1.5 倍以上的效果优化。

例如电子商务与电子支付国家工程实验室在信用卡伪卡欺诈侦测场景中采用了 GBDT→GRU→RF 三明治结构模型。假设某一账号在深夜发生了若干笔小额支付行为后,接着发生了一笔异地大额交易,三明治结构欺诈侦测模型通过前部 “GBDT→GRU” 学习的过程,能够学习类似于集成特性 1 (“深夜+小额”)与集成特性 2(“深夜+大额”)之间的时序关系。该功能可以称之为将 “集成特性的时序化”。而加上后部 “GRU→RF” 过程后,又能够进一步学习到类似于将时序特征 1(多笔小额试探+大额套现)与时序特性 2(当前交易地点与前几次交易为异地)进行再融合的异常特征。这种将 “时序特性的集成化” 的功能可进一步加深模型的特征学习能力。图四显示了在信用卡伪卡侦测场景中的实测效果,有效 F1 值可超过 0.4。

图四:GBD→GRU→RF 三明治结构欺诈侦测模型评估效果

从模型到应用

1、电子商务与电子支付国家工程实验室智能分析即服务平台(IAaaS)综合运用国家工程实验室在大数据、人工智能、机器学习建模、图计算等技术方面的优势和经验,对现有业务模型、算法、输入和输出接口等业务接口内容进行封装和整合,对外提供智能分析服务和解决方案。用户通过调用封装后的 API 接口即可得到经过模型算法运算分析后的结果数据,从而更好地服务公司前台业务部门和合作伙伴,实现对创新支付业务的有力支持。目前,该平台已经对外提供了公安协查、羊毛党查询、移机违规终端查询和营销效果评价等服务 API 接口。为了更好地发挥三明治深度学习框架的应用价值,如图五所示,电子商务与电子支付国家工程实验室将该框架部署到智能分析即服务平台,对外提供了基于该框架的伪卡、套现等欺诈行为侦测服务。业务人员无需深入研究这一复杂的模型算法框架,只需要根据数据接口规范调用 API 即可获得服务。

图五:电子商务与电子支付国家工程实验室智能分析即服务平台框架图

2、众安科技也采用了 GBDT->GRU->RF 三明治结构欺诈侦测模型协助国家人社部识别用户骗保行为,有效提升了模型识别的准确率和覆盖率,最终 F1 增至 0.591,能极大减少医保资源的浪费,缓解医社保资金紧张等问题,将其导向真正需要帮助的人群。此外,在医疗保险方面,使用较为长期(5-10 年)、相对完整的体检报告和就医诊断信息进行序列化建模,可以进行更完整的用户健康状态判别和预测。通过对用户的健康状态预测,一方面,保险公司可以对风险做出更精准的衡量,从而在风险定价、成本预算、欺诈识别等各方面带来颠覆式变革;另一方面,也可以向客户提供更恰当准确的健康建议及服务,变被动的事后保障为积极主动的事前风险管控,及时且有针对性地发现和预防疾病。总之,在骗保检测、借贷安全和反薅羊毛等保险领域,随着数据收集的日渐完善、深度学习模型尤其是序列型模型的逐步优化,深度学习也将有着更广阔的应用空间。通过离线和在线结合、冷启动和人机闭环配合,结合三明治模型,众安科技设计了高效的保险反欺诈框架,为业务运营提供了有力的支撑,如图六所示。

图六:基于三明治结构的保险反欺诈框架

从软件到硬件的全方位技术支撑

除了算法设计上的独到创新,GBDT→GRU→RF 三明治结构欺诈侦测模型取得的成功也离不开底层硬件设施提供的强大性能支撑。英特尔为模型提供了高性能的英特尔® 至强® 处理器产品家族,其不仅在内核、高速缓存方面表现优异,还以大量的硬件增强技术助力提升框架性能。例如英特尔® 高级矢量扩展指令集 2(AVX2)、英特尔® 快速通道互联链路(QPI)等。

而更新一代的英特尔® 至强® 可扩展处理器更是可以为框架的性能提供更强助力,这一处理器不仅在处理性能上远超上一代产品,更集成了英特尔® 高级矢量扩展 512(AVX-512)技术,其出色的并行计算能力正符合人工智能的需求,可在框架的运行过程中发挥重要作用。

除了处理器产品外,英特尔也为模型中的 GBDT、GRU、RF 三种方法提供了深入而有效的全方位优化方法和工具。首先针对 GBDT 方法,英特尔提供了基于 Apache Spark* 计算集群的开源深度学习库:BigDL,其允许用户开发自有深度学习应用程序来作为标准的 Spark 程序,可为用户带来更大的一致性和高效性;其次在 GRU 方法上,新模型采用了面向英特尔® 架构进行优化的 Tensorflow*。英特尔为 Tensorflow 提供了多种有效的优化方法,例如英特尔® MKL-DNN(Intel® Math Kernel Library for Deep Neural Networks),通过将其引入 Tensorflow 代码,用户可以充分利用英特尔® 架构处理器的可伸缩性来降低系统因为数据格式转换带来的开销,优化系统负载;最后,在 RF 方法应用阶段,所采用的英特尔® Python 发行版,其内置的英特尔® DAAL(英特尔® 数据分析加速库)可以为用户提供用于数据预处理、转换、建模和预测等任务的构建模块,能有效提高整个模型的工作效率。

截止目前,新的三明治结构欺诈侦测模型在电子商务与电子支付国家工程实验室及众安科技开展的多项测评中,都取得了预期的良好成果,电子商务与电子支付国家工程实验室、众安科技与英特尔联手开展的新模型研究、开发与构建,为人工智能在金融反欺诈领域的应用提供了有益的经验和探索,为深度学习中众多新技术、新算法在金融领域场景的应用趟平了道路。在未来,三方还将继续技术合作,将更多的先进技术和产品引入其中,加速金融反欺诈研究,将更多的金融风险消弭于未发之时。

经验:

传统基于机器学习的金融反欺诈模型对于序列化的交易特征学习能力不足,而单一方法的深度学习模型则对单笔交易内特征的学习能力有限,利用多层次的深度学习模型,可以最大程度上规避这些不足,提升反欺诈模型的工作效率和性能。

英特尔不仅为新型的反欺诈模型提供了高性能处理器产品作为动力之源,还提供了多样化、全方位的技术支撑,为三明治结构欺诈侦测模型中每一个层面所用的方法,都提供了有针对性的优化手段和工具,帮助整个反欺诈模型实现了更高的工作效率。

英特尔技术特性和优势取决于系统配置,并可能需要支持的硬件、软件或服务才能激活。没有计算机系统是绝对安全的。更多信息,请见 Intel.com,或从原始设备制造商或零售商处获得更多信息。描述的成本降低情景均旨在在特定情况和配置中举例说明特定英特尔产品如何影响未来成本并提供成本节约。情况均不同。英特尔不保证任何成本或成本降低。

英特尔、Intel,至强是英特尔公司在美国和或其他国家的商标。英特尔商标或商标及品牌名称资料库的全部名单请见 intel.com 上的商标。

* 其他的名称和品牌可能是其他所有者的资产。

人工智能,从至强® 开始

人工智能 (AI) 可以帮助您的企业将数据价值发挥到极致。快来一探究竟,看运行在 CPU 架构上的 AI 如何为您做得更多。

了解更多

如何开始人工智能之旅: 技术路径不只一条,您的选择也不只一个

在 AI 之旅的起点上,无论是传统推理、机器学习、深度学习,亦或是它们的融合,都是可选项。

了解更多

如何开始人工智能之旅: 改弦更张不合算,别忽视既有平台

无论是在机房,还是选择公有云服务,企业要充分评估既有的数据存储、处理和分析平台,基于或借助它构建和部署符合自身需求的 AI 应用。

了解更多

如何开始人工智能之旅: 你已拥有 “原力”,只待释放潜能

企业既有 IT 基础设施在 AI 应用上的潜能很强,随着 CPU 在流行深度学习框架上的持续优化和提供更多的软件工具,只需对它稍做升级,即可充分释放潜能。

了解更多

产品和性能信息

1数据来自《尼尔森全球银行卡报告》