解读至强秘笈之 SGX,为数据处理构建硬件级 “安全隔离区”

  • 英特尔 SGX 技术能在 CPU 的支持下,在内存等特定硬件环境中构建出一个可信安全的 “飞地”(Enclave)。飞地独立于操作系统、虚拟机以及 BIOS 系统之外,即便比客户应用程序更底层的基础软件或系统在恶意攻击中沦陷,飞地也可以通过基于硬件的、增强型的安全防护更有效地阻断这些攻击,尽力避免其中的数据或代码被窃取或篡改。

author-image

签署人:

通过数据协同,引入更多源、多维、高质量的数据来打破数据孤岛,已成为各行各业深入开展大数据和 AI 应用,充分挖掘数据价值,进而加速推进数字化和智能化转型进程的共识。但数据安全与隐私是否能获得充分保障,依然是将其付储实践的重要前提。因此,越来越多的企业客户都开始全力探索包括联邦学习在内的隐私计算方案,以求让数据实现 “可用而不可见” 的、更为安全的共享。

今天我们要解读的至强秘笈,就与英特尔® 软件防护扩展(Software Guard Extension, SGX)技术及其主要用途——隐私计算密切相关。作为可信执行环境(TEE)的重要技术实现,如图一所示,英特尔® SGX 能在 CPU 的支持下,在内存等特定硬件环境中构建出一个可信安全的 “飞地”(Enclave)。这种飞地独立于操作系统、虚拟机以及 BIOS 系统之外,也就是说,即便这些比客户应用程序更底层的基础软件或系统在恶意攻击中沦陷,由英特尔® SGX 技术生成的飞地也可以通过基于硬件的、增强型的安全防护更有效地阻断这些攻击,尽力避免其中的数据或代码被窃取或篡改。

图一 英特尔® SGX 安全方案示意图

这种飞地的概念,其实很像大规模传染病爆发期间常见的、被严防死守的隔离区或专门的隔离医院。但与医疗防疫场景中主要隔离患者或潜在传染者不同,SGX 技术生成的飞地所容纳的,是那些需要受到严密保护的应用代码或关键数据,它们一旦进入飞地,就如同未感染的人进入到安全隔离区,会得到重重保护,纵使隔离区外的病毒肆虐,隔离区内各种消毒防疫措施也能让病毒难再靠近他们一步。

在提供这种隔离效用的同时,英特尔® SGX 也提供了完备的远程鉴权能力,这犹如一套完备可靠的、用于隔离区准入的检疫认证流程,它可让数据、代码的传递及进入飞地的动作变得更为安全牢靠。

当然,封闭隔离区越大,就意味着它能为更多人提供隔离保护的服务。出于类似的考虑,英特尔在其面向单路和双路的全新第三代至强® 可扩展处理器中,对英特尔® SGX 技术进行了全面强化,最高可在一个双路系统中支持 1TB 容量的飞地空间。更大的飞地空间,就能容纳更多、更大体量的应用程序和核心数据,为企业实现更大数据量的隐私计算打下基础。

得益于英特尔® SGX 原生的、基于硬件的高安全防护级别,及其与隐私计算,特别是联邦学习出色的适配性,传统行业中较早涉足大数据和 AI 技术的金融行业企业,立即就看中了它的应用潜力,开始了相关用例的探索。

平安集团旗下的智能科技服务提供商平安科技,就基于英特尔® SGX,以 “云-边-终端” 服务架构打造了具有数据隐私保护能力的蜂巢平台,可高效解决 “云边协同” 这一重要趋势与边缘和终端设备对数据和模型仍缺乏有效保护这一现实之间的矛盾。

图二 具有 “云-边-终端” 服务架构的平安科技蜂巢平台

从图二所示的架构可以看到,蜂巢平台利用英特尔® SGX 分别在云端和边缘节点的服务器内存中开辟出安全的 “飞地”。客户可在云端基于英特尔® SGX 和蜂巢隐私计算方案对模型进行训练,并通过 “飞地” 间的安全通道向边缘推送最新模型。在边缘,得益于 “飞地” 对部署在边缘节点的离线模型以及对来自边缘和终端的数据所进行的有效保护,联邦预测得以更安全地运行。同时,蜂巢算子还可结合 Graphene 等 LibOS,支持自定义模型联邦预测/训练。目前,蜂巢平台已能支持多种深度学习、机器学习模型在金融、医疗、车联网等领域和场景中的应用。

与此同时,拥有雄厚技术优势和海量数据积累的互联网和公有云企业自然也不会 “落伍”,许多亟待开展数据协同应用、又对数据安全与隐私保护有着严苛需求的大厂,也在加速部署和应用英特尔® SGX 技术。

在互联网领域深耕人工智能基础技术,并打造了开源深度学习平台 “飞桨”(PaddlePaddle)的百度,就选择英特尔® SGX 作为基础,来构建自家的 MesaTEE 安全计算平台。该平台能与飞桨开源深度学习平台展开联动,从而为飞桨的用户们带来可定制的机密计算能力。

图三 基于英特尔® SGX 的百度 MesaTEE 平台与百度飞桨平台联动

如图三所示,在运行过程中,MesaTEE 平台能以 Executor 插件的形式在飞桨平台上构建基于Graphene-SGX 等 LibOS 组件的英特尔® SGX 安全可信环境,并将特定的深度学习任务投递到安全环境中,从而以更为安全可信的方式,为深度学习模型提供更多元的数据。目前,运行于英特尔® SGX 安全可信环境的百度飞桨平台已在医疗影像筛查、金融风险控制等细分领域的机密计算能力实践中体现出高效、高性价比、简单上手和支持多容器等优点。