目录

  • 削减社交网络的存储成本.

  • 原架构.

  • 全新解决方案详情.

  • 英特尔与云服务提供商紧密合作

  • 业务结果

author-image

作者

基于英特尔® 傲腾™ 技术和英特尔® NVMe 固态盘,VK 引入全新数据分层架构。以 2:1 的比例整合服务器,节省数亿美元。

社交网络软件工具属数据密集型应用,用户每日观看的视频和照片量达数百万级。不足为奇的是,对于俄罗斯最大的社交网络 VK 而言,数据存储就占到了其一半以上的预算。为降低成本,VK 采用英特尔® 傲腾™ 持久内存、英特尔® 傲腾™ 固态盘和英特尔® 非易失性存储器 (NVMe) 固态盘对原有的分层存储架构进行了现代化改造。最终,VK 成功省下数百万美元。

挑战

•          降低数据存储(数据以每年 600 PB 的速度增长)的总体拥有成本 (TCO)。

•          让 VK 用户能够快速访问最新、最热门的内容。

•          支持数据分层,将访问频率较低的数据迁移到成本较低的存储器中。

•          无需再为满足不同最终用户设备需求而存储同一图像的多种格式。

解决方案

•       VK 将其内容分发网络 (CDN) 服务器中存储温数据的 SATA 固态盘 (SSD) 升级为英特尔® 固态盘 D5-P4320 系列,将热数据从动态随机存取存储器 (DRAM) 迁移到了英特尔® 傲腾™ 固态盘 DC P4800X 系列。

•       VK 引入英特尔® 傲腾™ 持久内存来存储数据库索引,从而将热数据从昂贵的 DRAM 中迁出。

•       VK 还将其服务器的处理器从英特尔® 至强® 金牌 6230 处理器升级为英特尔® 至强® 金牌 6238 处理器,提高了服务器性能。

•       VK 将采用英特尔® 现场可编程门阵列(英特尔® FPGA)把图像的单个高分辨率原版实时转换为每个用户所需的分辨率,从而减少存储多种图像尺寸和格式的需求。

结果

•       通过将数据从 DRAM 转移到固态盘和采用内存模式的英特尔® 傲腾™ 持久内存,大幅降低了最热数据的存储成本。

•       全新的多层存储架构有助于统一并减少系统配置的数量。

•       全新存储解决方案 让 VK 能够在 1U 服务器中存储高达 0.4 PB 的数据,由此在降低供电和散热成本的同时,以 2:1 的比率整合服务器,为持续增长的数据提供支持。

•       通过升级处理器,VK 将计算成本降低了一半,将每瓦性能提高了 33%1

削减社交网络的存储成本

社交网络改变了我们与朋友、家人和同事联系的方式。VK 是俄罗斯和独联体 (CIS) 地区最大的社交网络平台,且仍在快速增长。在2018-2019 年度,VK 的月活用户为 9,700 万,远高于四年前的6,600 万1。每天,VK 用户查看的帖子高达 90 亿条、观看的视频高达 6.5 亿个、发送的消息高达 100 亿条、点 “赞” 次数高达十亿次。在一年的时间里,用户上传了约 600 PB 的新数据,其中包括照片和视频,而这些数据必须永久存储。

由于所有数据都通过网络进行流传输,因此数据存储基础设施成为 VK 最大的成本支出也不足为奇。存储成本已占到公司年度预算的 60% 至 65%,因此优化存储总体拥有成本 (TCO) 成了 VK 的当务之急。在整个存储空间中,共分布了 1.1 EB 的数据。

数据存储在离上传位置较近的地方。VK 背后的 IT 基础设施是19,000 台服务器。公司拥有三个主要的数据中心,并由 30 个内容分发网络 (CDN) 提供支持,以此加快最热数据的访问速度。“俄罗斯是一个疆土辽阔的国家,城市之间的距离很远。我们需要出色的 CDN 缓存基础设施在靠近用户的位置存储数据,以便用户在使用我们的社交网络平台时能够获得良好的体验。” VK 副首席运营官 Roman Podpriatov 说道,“这些服务器上的数据访问速度必须非常快。”

原架构

VK 在其 CDN 服务器上采用的是三层数据缓存结构。随着数据热度的下降,数据会向下层移动。热数据指的是最近上传到网络且仍被经常访问的数据。温数据则是已不再被频繁访问的数据。通常情况下,温数据是最长一个月前上传的数据。而冷数据是指很少被访问的数据。

在采用新技术之前,CDN 中的冷数据存储在遍布俄罗斯的分布式数据网络中的硬盘上。温数据存储在 SATA 固态盘中,而热数据存储在 DRAM 中。

此外,基于 Nginx Web 服务器的数据库服务器使用 SATA 固态盘和硬盘来存储数据,使用 DRAM 来存储索引。

Podpriatov 表示:“我们的目标是减少使用的服务器数量。如果我们可以减少服务器基础设施所需的设备数量,那么就可以节省其他基础设施成本。由于 DRAM 非常昂贵,因此我们急需一种更加经济高效的存储方案。”

此外,为满足各种各样的用户设备需求,VK 需要为每个图像存储多个副本。因此,他们也希望为此寻求一种更加高效的方法。

全新解决方案详情

VK 对其存储架构进行了现代化改造。对于 CDN 服务器,热数据已从昂贵的 DRAM 移至英特尔® 傲腾™ 固态盘 DC P4800X 系列,并且通过引入英特尔® 傲腾™ 持久内存取代 DRAM 来处理相关工作负载,由此降低单位比特成本(见图 1)。如果工作负载支持英特尔® 傲腾™ 持久内存的 App Direct 模式,那么内存就具备了持久性。英特尔® 傲腾™ 固态盘 P4800X 系列可帮助消除数据中心存储的瓶颈,方便处理更大、更具性价比的数据集。在全新的存储方案中,温数据存储在非易失性存储器 (NVMe) 英特尔® 固态盘D5-P4320 系列上。

Podpriatov 表示:“现在,我们可以将热数据和温数据均存储在固态盘上,从而减少了我们的 DRAM 用量。之前我们的固态盘不够快,无法为热数据提供良好的用户体验,因此我们只能将某些数据存储在 DRAM 中。现在,我们可以将数据全部存储在比内存便宜得多的固态盘中。”

图 1:VK 针对 CDN 服务器采用的全新存储解决方案增加了性能更出色的固态盘来存储温数据,增加了成本更低的快速存储器来存储热数据。

对于数据库服务器,VK 引入了英特尔® 傲腾™ 持久内存来存储数据库索引(见图 2)。英特尔® 傲腾™ 持久内存具有更强的内存寻址能力,可有效提升数据库性能。将数据从 DRAM 迁移到英特尔® 傲腾™ 持久内存还可降低数据库索引的存储成本。数据库本身已从硬盘或 SATA 固态盘迁移到非易失性存储器 (NVMe) 英特尔®  固态盘 D5-P4320 系列,有效地提高了性能和存储密度。

数据库服务器和 CDN 服务器均基于两个英特尔® 至强® 金牌 6238 处理器、六个英特尔® 固态盘 D5-P4320 系列、八个英特尔® 傲腾™ 持久内存和两个 25 Gbps 网卡。CDN 软件堆栈则基于 cache_api、nginx、自动化证书管理环境 (ACME) 和等价多路径路由 (ECMP)。数据库服务器使用的是定制版本的 Memcached,并且将采用内存模式的英特尔® 傲腾™ 持久内存作为 Memcached 的缓存。

图 2:VK 针对数据库服务器采用的全新存储解决方案将索引从昂贵的 DRAM 迁移到了性价比更高的英特尔® 傲腾™ 持久内存。

这些服务器之前是基于英特尔® 至强® 金牌 6230 处理器的,但在新方案中 VK 已将处理器升级为英特尔® 至强® 金牌 6238 处理器,从而提高存储和计算性能、优化总体拥有成本,并从计算能力中获得更出色的每瓦性能。根据 VK 2020 年的预测,通过升级处理器,VK 可将计算成本降低一半,将每瓦性能提高 33%(见图 3)1。Podpriatov 表示:“在完成升级后,我们实现了性能的显著提升。”

图 3:与使用英特尔® 至强® 金牌 6230 处理器1相比,VK 预计使用英特尔® 至强® 金牌 6238 处理器可节省的成本情况(基于美元/每秒查询量 ($/qps) 和每秒查询量/瓦 (qps/W)。

为了进一步优化存储并提高能效,VK 正在部署采用英特尔® Arria® 10 GX FPGA 的英特尔® 可编程加速卡(英特尔® PAC)(见图 3),并运行 CTAccel 图像处理器工作负载。通过采用低功耗、单槽、半高 PCIe 英特尔® PAC,VK 可在其各类服务器中轻松部署多个FPGA。与在通用处理器上运行的软件相比,FPGA 可以通过提供定制硬件大幅加速应用功能。VK 可以通过利用 FPGA 的可配置性将高分辨率图像即时转换为所需的大小和格式。这样一来,VK 只需要存储高分辨率图像,从而减少了总体存储需求;与 VK 测试过的其他解决方案相比,这一方案还能提高能效。

图 4:采用英特尔® Arria® 10 GX FPGA 的英特尔® PAC 概念和内部视图

解决方案的技术组件

• 英特尔® 傲腾™ 固态盘 DC P4800X 系列。VK 已将特定 CDN 服务器上的数据从 DRAM 迁移至英特尔® 傲腾™ 固态盘,从而降低了 DRAM 成本。

• 英特尔® 傲腾™ 持久内存。数据库索引对于性能高度敏感,因此 VK 采用英特尔® 傲腾™ 持久内存,以低于 DRAM 的单位比特成本来存储数据库索引。

• 英特尔® 固态盘 D5-P4320 系列。这类经济高效的固态盘为温数据提供所需的性能,并在 VK 的数据层级结构中发挥着重要作用。而该数据层级结构可将使用频率较低的数据从快速存储器迁移到速度较慢(但更便宜)的存储器。

• 采用英特尔® Arria® 10 GX FPGA 的英特尔® 可编程加速卡(英特尔® PAC)。这款基于 PCI Express* (PCIe*) 的数据中心级 FPGA 加速器卡支持内嵌和旁路加速,具备FPGA 加速的强大性能和多功能性,并且是获得面向搭载FPGA 的英特尔® 至强® CPU 的加速堆栈支持的几个平台之一。

英特尔与云服务提供商紧密合作

VK 和英特尔的紧密合作已逾五年。Podpriatov 表示:“在这段时间里,我们一起开展了许多项目,共同解决了很多问题。VK 与英特尔已经建立了良好的合作关系。VK 知道,如果在测试或实施过程中遇到任何困难,都可以联系英特尔并获得支持。”

V K 自行负责实施,但英特尔为一些验证流程提供了协助。Podpriatov 表示:“我们只能在生产环境中测试该存储解决方案。使用真实数据填充固态盘并检查数据如何从热存储转移到冷存储,可能要耗时长达两个月。这样的测试是无法在实验室条件下进行的。”

Podpriatov 还说道:“从新产品开发到实施和生产,英特尔团队一直为我们提供帮助。英特尔与我们分享了路线图和新技术,这让我们有机会在生产环境中实施新技术,了解这些技术是否适合我们,以及实施这些技术可以节省多少成本。”

业务结果

VK 估计,通过引入全新的存储解决方案,可以节省总计数亿美元的成本。新的存储解决方案让 VK 能够在 1U 服务器中存储高达 0.4 PB 的数据,只需更少的机架就能存储相同数量的数据,因此在空间、供电和散热方面将不断实现成本节约。目前,VK 的供电和散热成本已得到了降低。Podpriatov 表示:“我们可以用一台新服务器来替换两台旧服务器,同时还能提升性能。”

通过将数据从 DRAM 转移到固态盘和英特尔® 傲腾™ 持久内存,VK 可以在提供客户所需的性能的同时降低热数据层存储成本。Podpriatov 表示:“与以前的存储解决方案相比,现在我们能够以更低成本获得更高性能。”

未来,VK 计划引入英特尔® 固态盘 D5-P4326 系列,进一步降低成本、增加存储容量。

VK 简介

VK 是俄罗斯和独联体 (CIS) 地区最大的社交网络平台,月活用户高达 9,700 万。公司的愿景是打造简单便捷的通信工具,实现人员、服务和企业的连接。VK 总部位于圣彼得堡,在莫斯科和索契设有基地,并在叶卡捷琳堡、喀山和下诺夫哥罗德设有地区办事处。VK 是 Mail.ru 的子公司。www.vk.com

 

了解更多信息

第二代英特尔® 至强® 可扩展处理器产品简介

英特尔® 固态盘(英特尔® SSD)

英特尔® 傲腾™ 数据中心级固态盘系列

英特尔® 傲腾™ 持久内存

采用英特尔® Arria® 10 GX FPGA 的英特尔® 可编程加速卡(英特尔® PAC)

英特尔® FPGA 可编程加速卡产品家族

面向云服务提供商的英特尔资源

寻找适合贵企业和组织的解决方案。请联系您的英特尔代表或访问 intel.cn/csp