英特尔® SGX 助力阿里云构建端到端隐私保护机器学习方案

面向大数据与 AI 的数据融通面临严峻安全风险

数字化转型凸显了数据的重要价值，加速了数据的流转，也带来了复杂的多方数据存储、流转与处理问题。特别是在 AI、大数据等应用中，由于单个组织难以掌握到 AI 与大数据应用所需要的全部数据，因此需要通过多方数据合作，实现数据资源的融通利用。例如，在训练金融 AI 算法时，单体金融机构的数据往往无法满足算法训练的需求，此时可以通过联合建模的方式，实现数据的共享，并共同创建、维护该AI模型。由于跨机构、跨行业的数据融合、联合分析和建模的需求日趋增加，数据安全风险急剧增长。这一方面是由于数据本身可复制、易传播，在传统安全模式下，数据一经分享难以追踪。另一方面，数据持续流动会导致责任划分不明确、权限控制困难、以及问题难以追责等问题。

保证数据的安全可靠成为重中之重面向 AI 和大数据的传统安全防护方案常常会面临如下挑战：

联合分析、联合建模等应用涉及到频繁的数据共享、数据融合，而传统的数据安全解决方案可能有助于保护静态和传输中的数据，但难以保护正在使用的数据。这可能导致部分安全威胁突破安全防线，导致数据泄露等事件的发生。
AI和大数据应用涉及到数据输入、数据分析、机器学习、深度学习等多个流程，任何一个流程的漏洞都可能导致数据泄露等严重后果。因此，实现端到端的安全防护至关重要。
针对 AI 和大数据的攻击广泛涉及到已知与未知的安全威胁，覆盖多种攻击技术与工具。而传统方案往往从软件层面出发，难以保护硬件底层，这影响了其防护效率的进一步提升。
数据安全保护措施常会涉及到较为复杂的计算，可能会带来一定的性能损耗，对于数据银行的运行效率带来负面影响。

基于英特尔® BigDL PPML 的阿里云端到端隐私保护机器学习

为了帮助企业在 AI 和大数据等应用中，更好地实现端到端的隐私保护，阿里云与英特尔合作，将英特尔® BigDL PPML 与阿里云 DataTrust 平台进行协同，联合验证了隐私保护机器学习的端到端工作流和相关业务场景。

英特尔® BigDL PPML

BigDL 是英特尔开源的统一的人工智能解决方案平台，数据科学家、数据工程师等开发者可以使用 BigDL 轻松创建端到端的分布式人工智能应用。 BigDL 应用英特尔® SGX 可信硬件执行环境 (Trusted Execution Environment, TEE)，并集成了其他软硬件安全措施，构建了一个分布式的隐私保护机器学习 (Privacy Preserving Machine Learning, PPML) 平台，能够保护端到端（包括数据输入、数据分析、机器学习、深度学习等各个阶段）的分布式人工智能应用。

作为英特尔® BigDL PPML 的重要基础技术，英特尔® SGX 通过绕过系统的操作系统和虚拟机软件层，能够更有效地抵御多种类型的攻击。它可显著加强数据安全，满足对于机密计算的广泛需求。英特尔® SGX 提供了一种基于硬件的内存加密机制，将内存中的特定应用代码和数据隔离开来。英特尔® SGX 允许为用户级代码分配专用内存区域（ Encalve，安全飞地），以免受到拥有更高权限的进程的影响。

英特尔® SGX 经过了严格测试，是业界广泛部署的基于硬件的数据中心可信执行环境 (TEE)，大幅减少了系统中的攻击面。除了有助于防御基于软件的攻击外，英特尔® SGX 的验证机制还能够帮助用户确保应用程序及相关硬件没有受到攻击，且处理器安装了最新的安全更新。

借助 BigDL PPML 平台，开发者可以：

在加密数据上开发并运行标准的分布式人工智能应用（如大数据分析、机器学习、深度学习等）。
利用基于硬件的安全技术技术（如英特尔® SGX）保护计算过程以及相应的内存数据。
为人工智能应用提供端到端的安全和隐私保护，例如：在具备英特尔® SGX 硬件能力的 K8s 环境中创建并认证可信的集群环境；通过密钥管理系统 (Key Management System, KMS) 为分布式数据提供加密和解密能力；通过英特尔® SGX、加解密技术、 TLS 和安全认证等技术实现安全的分布式计算和数据通信。

阿里云 DataTrust 隐私保护计算平台

阿里云 DataTrust 是行业领先的基于可信执行环境、安全多方计算 (Secure Multi-Party Computation, MPC)、联邦学习(Federated Learning, FL)、差分隐私 (Differential Privacy, DP) 等隐私增强计算 (Privacy Enhancing Technique) 技术打造的隐私增强计算平台，致力于实现数据价值的安全流动，为行业带来正确、易使用、高可用的安全数据流通产品。

阿里云 DataTrust 以英特尔® SGX 为底座，结合 MPC、 FL 等技术，基于阿里云数据中台丰富应用场景实践，能够在保障数据安全的前提下完成多方数据联合分析、联合训练、联合预测，为企业提供立足数据业务原生的数据安全流通解决方案，助力企业业务增长。

收益：推动数据价值安全流动

基于英特尔® BigDL PPML 的阿里云端到端隐私保护机器学习解决方案继承了可信执行环境 (TEE) 的优点。和传统数据安全解决方案相比，它的安全性和数据效用性十分突出，同时性能损耗较低。

通过应用该方案，企业能够构建端到端的安全保护流程，在数据输入、数据分析、机器学习、深度学习等 AI、大数据应用的多个阶段建立安全防护能力，避免安全威胁乘虚而入。同时，该方案实现了基于硬件底层的保护，具备更高的数据保护等级，能够防护传统安全方案难以抵抗的攻击形式，降低重要数据泄露的风险。

在该方案的支持下，企业能够提供安全的数据融通服务，联合分析、联合训练、联合预测等应用不透露原始数据以及基于数据应用逻辑层面的授权，保证场景化的数据融通安全需要；满足商业的自主性、可控性、安全性，为客户提供透明可控的安全流通环境，可随时管控和退出，永保数据控制权。同时，该方案运用前沿的安全技术，面向业务场景封装，可解决企业数据业务原生的海量级数据安全融通。

该方案的典型应用场景：

全域精细运营：品牌方通过联动平台、第三方等全域数据，在保护个体隐私及数据安全的前提下，构建品牌数智化运营能力，优化人货场的配置，拉动业务增长。
联合智能风控：行业或企事业单位在原始数据不出自身环境的前提下，通过隐私增强计算技术，实现与多方数据的联合风控，提高风控识别有效性，助力业务良性增长。
广告搜索推荐：在保护消费者隐私与一方、二方数据安全的前提下，通过数据加持进行联合建模，提升算法准确率，提高广告投放有效性，推动业务持续高效增长。

选择您的语言

使用 Intel.com 搜索

快速链接

最近搜索

高级搜索

仅搜索