英特尔® SGX 助力阿里云构建端到端隐私保护机器学习方案

概述

  • 基于英特尔® SGX,英特尔携手阿里云 DataTrust 打造端到端大数据和人工智能隐私计算解决方案,联合验证了隐私保护机器学习的端到端工作流和相关业务场景,展示了基于 BigDL PPML 快速构建端到端隐私计算的最佳实践。

author-image

作者

面向大数据与 AI 的数据融通面临严峻安全风险

数字化转型凸显了数据的重要价值,加速了数据的流转,也带来了复杂的多方数据存储、流转与处理问题。特别是在 AI、大数据等应用中,由于单个组织难以掌握到 AI 与大数据应用所需要的全部数据,因此需要通过多方数据合作,实现数据资源的融通利用。例如,在训练金融 AI 算法时,单体金融机构的数据往往无法满足算法训练的需求,此时可以通过联合建模的方式,实现数据的共享,并共同创建、维护该AI模型。由于跨机构、跨行业的数据融合、联合分析和建模的需求日趋增加,数据安全风险急剧增长。这一方面是由于数据本身可复制、易传播,在传统安全模式下,数据一经分享难以追踪。另一方面,数据持续流动会导致责任划分不明确、权限控制困难、以及问题难以追责等问题。

保证数据的安全可靠成为重中之重面向 AI 和大数据的传统安全防护方案常常会面临如下挑战:
 

  • 联合分析、联合建模等应用涉及到频繁的数据共享、数据融合,而传统的数据安全解决方案可能有助于保护静态和传输中的数据,但难以保护正在使用的数据。这可能导致部分安全威胁突破安全防线,导致数据泄露等事件的发生。
  • AI和大数据应用涉及到数据输入、数据分析、机器学习、深度学习等多个流程,任何一个流程的漏洞都可能导致数据泄露等严重后果。因此,实现端到端的安全防护至关重要。
  • 针对 AI 和大数据的攻击广泛涉及到已知与未知的安全威胁,覆盖多种攻击技术与工具。而传统方案往往从软件层面出发,难以保护硬件底层,这影响了其防护效率的进一步提升。
  • 数据安全保护措施常会涉及到较为复杂的计算,可能会带来一定的性能损耗,对于数据银行的运行效率带来负面影响。

基于英特尔® BigDL PPML 的阿里云端到端隐私保护机器学习

为了帮助企业在 AI 和大数据等应用中,更好地实现端到端的隐私保护,阿里云与英特尔合作,将英特尔® BigDL PPML 与阿里云 DataTrust 平台进行协同,联合验证了隐私保护机器学习的端到端工作流和相关业务场景。

英特尔® BigDL PPML

BigDL 是英特尔开源的统一的人工智能解决方案平台,数据科学家、数据工程师等开发者可以使用 BigDL 轻松创建端到端的分布式人工智能应用。 BigDL 应用英特尔® SGX 可信硬件执行环境  (Trusted Execution Environment, TEE),并集成了其他软硬件安全措施,构建了一个分布式的隐私保护机器学习 (Privacy Preserving Machine Learning, PPML)  平台,能够保护端到端 (包括数据输入、数据分析、机器学习、深度学习等各个阶段) 的分布式人工智能应用。

作为英特尔® BigDL PPML 的重要基础技术,英特尔® SGX 通过绕过系统的操作系统和虚拟机软件层,能够更有效地抵御多种类型的攻击。它可显著加强数据安全,满足对于机密计算的广泛需求。英特尔® SGX 提供了一种基于硬件的内存加密机制,将内存中的特定应用代码和数据隔离开来。英特尔® SGX 允许为用户级代码分配专用内存区域( Encalve,安全飞地),以免受到拥有更高权限的进程的影响。

英特尔® SGX 经过了严格测试,是业界广泛部署的基于硬件的数据中心可信执行环境 (TEE),大幅减少了系统中的攻击面。除了有助于防御基于软件的攻击外,英特尔® SGX 的验证机制还能够帮助用户确保应用程序及相关硬件没有受到攻击,且处理器安装了最新的安全更新。

借助 BigDL PPML 平台,开发者可以:
 

  • 在加密数据上开发并运行标准的分布式人工智能应用 (如大数据分析、机器学习、深度学习等)。
  • 利用基于硬件的安全技术技术 (如英特尔® SGX) 保护计算过程以及相应的内存数据。
  • 为人工智能应用提供端到端的安全和隐私保护,例如:在具备英特尔® SGX 硬件能力的 K8s 环境中创建并认证可信的集群环境;通过密钥管理系统  (Key Management System, KMS) 为分布式数据提供加密和解密能力;通过英特尔® SGX、加解密技术、 TLS 和安全认证等技术实现安全的分布式计算和数据通信。

阿里云 DataTrust 隐私保护计算平台

阿里云 DataTrust 是行业领先的基于可信执行环境、安全多方计算 (Secure Multi-Party Computation, MPC)、联邦学习(Federated Learning, FL)、差分隐私 (Differential Privacy, DP) 等隐私增强计算 (Privacy Enhancing Technique) 技术打造的隐私增强计算平台,致力于实现数据价值的安全流动,为行业带来正确、易使用、高可用的安全数据流通产品。

阿里云 DataTrust 以英特尔® SGX 为底座,结合 MPC、 FL 等技术,基于阿里云数据中台丰富应用场景实践,能够在保障数据安全的前提下完成多方数据联合分析、联合训练、联合预测,为企业提供立足数据业务原生的数据安全流通解决方案,助力企业业务增长。

收益:推动数据价值安全流动

基于英特尔® BigDL PPML 的阿里云端到端隐私保护机器学习解决方案继承了可信执行环境 (TEE) 的优点。和传统数据安全解决方案相比,它的安全性和数据效用性十分突出,同时性能损耗较低。

通过应用该方案,企业能够构建端到端的安全保护流程,在数据输入、数据分析、机器学习、深度学习等 AI、大数据应用的多个阶段建立安全防护能力,避免安全威胁乘虚而入。同时,该方案实现了基于硬件底层的保护,具备更高的数据保护等级,能够防护传统安全方案难以抵抗的攻击形式,降低重要数据泄露的风险。

在该方案的支持下,企业能够提供安全的数据融通服务,联合分析、联合训练、联合预测等应用不透露原始数据以及基于数据应用逻辑层面的授权,保证场景化的数据融通安全需要;满足商业的自主性、可控性、安全性,为客户提供透明可控的安全流通环境,可随时管控和退出,永保数据控制权。同时,该方案运用前沿的安全技术,面向业务场景封装,可解决企业数据业务原生的海量级数据安全融通。

该方案的典型应用场景:
 

  • 全域精细运营: 品牌方通过联动平台、第三方等全域数据,在保护个体隐私及数据安全的前提下,构建品牌数智化运营能力,优化人货场的配置,拉动业务增长。
  • 联合智能风控: 行业或企事业单位在原始数据不出自身环境的前提下,通过隐私增强计算技术,实现与多方数据的联合风控,提高风控识别有效性,助力业务良性增长。
  • 广告搜索推荐: 在保护消费者隐私与一方、二方数据安全的前提下,通过数据加持进行联合建模,提升算法准确率,提高广告投放有效性,推动业务持续高效增长。