用多云策略兼顾灵活和优化

Opera 基于英特尔平台,为 AI 时代的业务拓展定制混合云基础设施

下载文档

作为互联网行业的老兵,Opera* 深知在移动互联网时代,唯有精准把握用户喜好,才能在激烈的市场竞争中占据一席之地。为此,Opera 积极展开业务转型,在短短数年内,就从一家面向传统互联网业务、提供单一浏览器产品的企业迅速升级成为基于人工智能(Artificial Intelligence,以下简写为AI)的数字内容发现与推荐平台提供商,在非洲、印度及东南亚等区域市场独领风骚。

华丽转身的背后,业务的调整与扩张也对 Opera 的 IT 基础设施提出严峻考验。一方面,随着 Opera 业务在全球快速扩张,系统可用性、数据安全性等问题越来越突出,IT 成本也随之高企,吞噬大量利润;另一方面,Opera 领先的智能数字内容发现与推荐系统,背后的高性能 AI 平台也对 IT 基础设施的计算和存储能力提出了非常严苛的要求。

为此,Opera 携手业界巨头英特尔,在 IT 基础设施建设上打出一记漂亮的组合拳。在云平台建设上,它根据业务需求,告别了以前单一的、基于公有云的模式,转用混合云的部署方式,既保留了 IT 能力的灵活性和扩展性,也在安全性、可用性和成本控制上获得保证。同时通过引入包括英特尔® 至强® 可扩展处理器、英特尔® 固态盘等在内的多款英特尔领先产品与技术,为 Opera AI 算法平台的高效运行提供了更为充沛和优化的算力及存储能力,以实现更优质的用户体验。

Opera 获得的解决方案优势:

• IT 基础设施运行成本得以显著降低,并在可用性上获得提升;

• Opera 能够有效地管理和保障其数据安全,提升用户满意度;

• 更强劲的计算、存储能力确保 Opera 内容发现与推荐系统可高效执行 AI 训练和推

理过程,为用户提供精准的内容推荐服务。

2018 年 7 月 27 日,一家传奇的互联网公司再次登陆纳斯达克*(Nasdaq*),并受到投资者们的追捧,发行当日最高股价较发行价上涨 30%1。这家载誉归来的公司就是 Opera,23 年的行业历程曾令其获得无数的赞誉与口碑,但过于单一的产品与业务模式也使其一度远离人们的视线。

凭借在浏览器等产品上积累的丰富经验,Opera 以内容发现与推荐作为新的市场切入点,以领先的自研 AI 平台为后盾,推出了Opera News* 等创新型产品,来向市场证明它仍是互联网行业不可忽视的强者。

成功转型的 Opera 在内容类市场上披荆斩棘,高歌猛进。2018年第一季度,其 PC 与移动端浏览器产品季度平均月活跃用户数(Monthly Active Users,MAU)达 3.22 亿,其精心打造的新锐产品 Opera News,如图一所示,季度平均 MAU 仅用一年多时间就从2017 年第一季度的 910 万快速攀升到 2018 年第一季度的 9,020万,增长近 10 倍2

图一 Opera News 从 2017 年第一季度到 2018 年第一季度的市场表现2

九层之台,起于累土,良好的 IT 基础设施是 Opera 获得成功的一大关键因素。为确保各项业务获得稳定、高速地发展,Opera 在英特尔公司的助力下,以节支增效,提升 AI 平台性能为出发点,利用英特尔提供的一系列领先产品与技术,构建了基于混合云架构的IT 基础设施。

更贴合业务需求的混合云架构

虽然 Opera 此前采用的公有云平台一度以其灵活、可扩展等优点,被视为构建 IT 基础设施的良好选择。但很多企业都发现,单一的公有云部署对于业务需求多样化的企业而言,也存在不少缺陷。

首先,在可用性和安全性上,通用的公有云服务提供的技术支持和服务类型往往有限,并不能完全满足 Opera 或与 Opera 类似企业的多样化业务体系。以 Opera 提供的新闻推荐服务为例,除了常见的英语、法语版本外,其还推出了大量的本地化版本,包括印地语、斯瓦希里语等 30 多种语言。在安全性上,Opera 的内容发现与推荐系统中也聚集了大量用户浏览数据,因此亟需高等级的安全机制来防止用户隐私外泄。

同时,随着企业业务规模达到一定量级,公有云在成本上的表现也不容乐观。Opera 发现,其部署在公有云上的算法服务器虚拟机,每月租赁费用高达数千美元,而在本地数据中心购买并部署同样配置的物理机,仅需几倍于此的价格3

混合云无疑是破解这一难题的理想选择,它既可以保证 Opera 具备业务拓展所需的灵活性和可扩展性,也能在显著降低 IT 成本的同时,充分保障数据和算法的安全性和私密性。

在英特尔的协助下,Opera 对其业务进行了细分,令不同的功能和负载得以匹配更适合于它们的 IT 基础设施。其中,爬虫、测试以及部分本地化应用,以其弹性可扩展、敏捷性高的要求,仍继续部署在公有云中;关键AI算法服务器、Hadoop* 大数据平台以及核心存储系统,由于多线程、复杂计算和 IO 密集等需求,被部署在数据中心物理机上;而用户接入、负载均衡等服务则被部署在私有云虚拟机环境中。

作为混合云架构的积极倡导者和核心技术提供者,英特尔不仅为混合云提供了丰富的硬件产品,还在软硬件协同优化、工具配置、方案制定等多个层面,与互联网、传媒、智能制造等诸多领域的合作伙伴展开了全方位合作,致力于帮助它们构建最适于业务发展的 IT 基础设施。

为保证 Opera 在全球各数据中心部署的数千台服务器能够高效、稳定地运行在混合云架构中,英特尔一方面同 Opera 开展深入技术交流,与之分享在 Openstack* 云计算管理平台和 Ceph* 分布式存储系统上的最佳实践经验,同时还派出专家团队,与 Opera共同探讨云计算平台和存储系统的性能优化。另一方面,针对Opera 的业务需求,英特尔为其数据中心提供了全面的硬件参考,包括技术细节分享和软、硬件增强功能的讨论。最终,Opera选择了基于英特尔® 至强® 可扩展处理器的服务器作为其 IT 基础设施的主流配置。

来自 Opera 业务部门的反馈表明,基于英特尔® 架构平台构建的全新混合云架构 IT 基础设施,不仅在使用成本上远远低于此前的公有云方案,在运行性能、可用性和可靠性上也有更优的表现。

为内容推荐提供强劲算力支撑

在 Opera 现有的产品和服务中,内容发现与推荐系统堪称“主角”般的存在,其工作原理,是通过 AI 算法来拟合用户对内容的满意度,并基于结果向用户推荐最贴切的数字化内容。如图二所示,这一系统可以简化分解为用户画像、内容分析以及精准推荐三大部分。

图二 Opera 内容发现与推荐平台构成示意图

在用户画像阶段,内容发现与推荐系统的平台会根据用户的浏览日志等数据,对用户的行为、环境特征进行抓取和分析,并打上年龄、性别、使用时间、浏览方式等不同范畴的用户标签。内容分析是通过对新闻等数字化内容的语义特征进行识别分类,获得多个层次和维度的语义标签,例如科技、娱乐、电影、葡萄酒等。在获得用户画像与内容分析结果之后,再由 Opera 自行研发的推荐模型与经典推荐算法,如逻辑回归(Logistic Regression,LF)、因子分解机(Factorization Machines,FM)以及深度神经网络(Deep Neural Network,DNN)等的组合,并基于海量数据进行大规模推荐模型训练和推理,从而使用户获得所需的精准内容推荐。

不难看出,Opera 构建的内容发现与推荐系统需要利用海量的日志数据进行训练和推理,而针对日志一类离散数据集进行机器学习,正是以英特尔® 架构处理器为代表的通用处理器的擅长。推荐算法往往涉及大量的分类问题,以常见的 LF 算法为例,它通过拟合逻辑函数的方式来预测事件发生的概率,例如,用户喜好足球的可能性是 80%,喜欢篮球的可能性是 30%,由此获得内容推荐的依据。

Opera 这一平台的算法复杂度以及实时性要求也令人叹为观止,Opera 算法技术 VP 孙锋表示:为使推荐变得更为精准,Opera机器学习推荐系统往往具有几百亿级的参数和几百亿级的训练数据,同时模型参数也会以秒级的频次进行更新,这对 IT 基础设施的计算和存储性能提出了更高的挑战。

来自英特尔的领先处理器和存储产品能够帮助 Opera 强有力地应对这些挑战。在计算性能方面,以 Opera 数据中心部署的英特尔®至强® 金牌 6138 处理器为例,其提供了多达 20 个内核和 40 个线程,并支持英特尔® 高级矢量扩展 512(英特尔® AVX- 512)技术,使之单指令多数据处理能力得以进一步提升,进而为计算能力带来更多加速度,以更高效地应对像 AI 这样的、对性能有苛刻需求的工作负载。

在 Opera 利用多线程性能测试工具 Sysbench* 执行的一组测试数据表明,与上一代英特尔® 至强® 处理器 E5 v4 产品家族相比,如图三所示,新一代英特尔® 至强® 可扩展处理器在处理器性能测试、多线程测试等多个测试项中有着大幅性能提升(测试数值越小越好)。

图三 归一化处理后的 Sysbench 测试数据对比4

在存储系统建设上,英特尔为 Opera 提供了基于 NVMe* 规范的英特尔® 固态盘 D C S 45 0 0,这一产品采用了英特尔® 3DNAND 技术以及领先的接口控制固件,与英特尔上一代固态盘或传统 HDD 硬盘相比,IOPS 性能有了质的飞跃。在英特尔的协助下,基于 NVMe 规范的英特尔® 固态盘产品可作为存储系统的缓存(Cache),与传统 HDD 硬盘一起,共同构成 Opera 推荐平台的存储系统,这种搭配既满足了 Opera 平台在存储容量上的需求,也实现了高吞吐、低延迟的性能表现。

此外,英特尔与 Opera 双方团队还就面向英特尔® 架构优化的Caffe* 和英特尔® 数学核心函数库(Intel® Math Kernel Library,英特尔® MKL)在 Opera AI 平台上的应用开展了多项优化实践,明显提升了其 AI 平台的训练和推理效率。

展望

面向即将到来的 AI 时代,Opera 正致力于构建以更多创新型产品为基础的数据内容平台。一方面,它计划在现有平台中加入更多的内容元素,例如视频和音乐;另一方面,它将专注于建设更强的 AI能力,以提高用户留存率和用户访问时长,而与英特尔的进一步深入技术合作,无疑将有助于 Opera 达成这一目标。

目前,Opera 正计划逐步将更多英特尔® 架构领先产品与技术导入其AI平台中,例如新一代的英特尔® 傲腾™ 固态盘,其基于创新的 3D XPoint™ 技术,在低延迟和稳定性方面有着远胜于传统NAND介质固态盘的性能表现。由英特尔® 傲腾™ 固态盘担纲缓存的数据中心存储系统,再配合英特尔® 高速缓存加速软件 (Intel®Cache Acceleration Software , 英特尔® CAS),已在多个实践案例中被证明具有兼顾容量和性能的“双赢”表现。

同时,另一项针对数据中心环境的英特尔领先技术—英特尔®数据中心管理平台(Intel® Data Center Manager,英特尔® DCM)也正处于 Opera 的验证性测试(Proof of Concept,POC)进程中,它能够根据每一台服务器的工作状态动态调整能耗标准,从而更大程度地降低运行成本,优化机架密度,提升环保系数。相信随着英特尔® 傲腾™ 固态盘,英特尔® DCM 以及其他英特尔领先产品和技术的融入,Opera 全新的 IT 基础设施也将迎来新一轮性能加速和总拥有成本下降的收益,这也将为其业务的创新发展、AI 能力的提升注入更多、更强的活力。

人工智能,从至强® 开始

人工智能 (AI) 可以帮助您的企业将数据价值发挥到极致。快来一探究竟,看运行在 CPU 架构上的 AI 如何为您做得更多。

了解更多

如何开始人工智能之旅: 技术路径不只一条,您的选择也不只一个

在 AI 之旅的起点上,无论是传统推理、机器学习、深度学习,亦或是它们的融合,都是可选项。

了解更多

如何开始人工智能之旅: 改弦更张不合算,别忽视既有平台

无论是在机房,还是选择公有云服务,企业要充分评估既有的数据存储、处理和分析平台,基于或借助它构建和部署符合自身需求的 AI 应用。

了解更多

如何开始人工智能之旅: 你已拥有 “原力”,只待释放潜能

企业既有 IT 基础设施在 AI 应用上的潜能很强,随着 CPU 在流行深度学习框架上的持续优化和提供更多的软件工具,只需对它稍做升级,即可充分释放潜能。

了解更多

产品和性能信息

2数据引自 Opera 提交的招股计划书。
3数据援引自 Opera 内部统计数据。
4Sysbench 测试中脚本一为单线程处理器性能测试,最大素数 =50000,脚本二为 56 线程处理器性能测试,最大素数 =50000,脚本三为全线程处理器性能测试,最大素数 =200000。硬件平台一处理器为英特尔® 至强® 处理器 E5-2690 v4/2.60GHz,内存 256GB,硬件平台二处理器为英特尔® 至强® 金牌 6138 处理器/2.00GHz,内存 128GB。