携手英特尔,看京东云如何解决混合多云难题

BUILT IN - ARTICLE INTRO SECOND COMPONENT

京东云发布行业首个混合云操作系统云舰

为推动企业利用云计算加快数字化、智能化转型,加快技术与产业的深度融合,自 2015 年以来,国家出台了一系列政策性指导文件全面扶持企业上云,在 “十四五” 规划中也强调了 “上云用数赋智” 行动。中国信通院发布的《2020 年云计算发展白皮书》预测, 2023 年中国云计算市场规模将接近 4000 亿元。

而在企业上云如火如荼的背后,单云部署方式已经不能完全满足需求。一方面,单云部署需要用户选择特定的云厂商,因而不免被其产品与技术所束缚;另一方面,当单云出现宕机等故障时,将大大影响企业业务的连续性与稳定性。2020 年 11 月,某头部云厂商就曾遭遇连续数小时的故障,导致部分网站和服务系统崩溃,严重影响了多家互联网企业和软件公司的服务。因此,可以有效分散单点风险的混合多云部署方式,成为了企业上云的必然趋势。

自 2019 年英特尔提出了 “云图” 计划后,力图覆盖企业用云的全流程,与产业合作伙伴一起帮助企业上云、用云和管云。2020 年,三人对谈栏目《众说纷 “云” 》作为 “云图” 计划中的重要部分首次亮相。今年,英特尔提出 “数智云图” 理念,持续赋能云上中国,与京东云再次携手共创《众说纷 “云” 》,以新颖、趣味的方式深度剖析企业多云部署的痛点,并解析了标杆性产品——京东混合云 “云舰”,力求解决常见混合多云场景下各类用云难题。


十年磨一 “舰”

虽然多云部署可以帮助企业摆脱单一云技术或产品的束缚,但混合多云动态弹性、大规模和服务多样及复杂性等特点,使得多云管理面临挑战。由于每个云计算环境又有自己独特的服务和功能,为了有效的评估计算资源和服务配置状态,保障系统安全和应用安全,构建一致性的管理平台对于混合多云至关重要。

京东作为头部的电商平台,面对着全球最极端、最复杂的混合多云环境。如何管理 3 个云厂商、70 多个数据中心、近 60 朵城市云和近百个边缘数据中心的计算与存储资源,以保障数十万智能设备的高效运营,始终是京东关注和亟需解决的技术问题。

在 7 年 “618” 活动流量洪峰的磨砺中,京东云 “云舰” 平台应运而生。作为云时代技术创新的代表,云舰采用了企业级的云原生容器内核,融合了容器、微服务、DevOps 等技术方案,大幅降低了应用研发、发布和运维的难度。

在 2021 年 “618” 活动中,云舰在线管理 Pod 数量超过 200 万,运行容器峰值核数超过 1000 万个,完成全球最高难度的云原生实践,再次以高弹性从容应对海量需求。

而云舰平台并未止步于京东的内生应用。

一方面,京东通过自建的供应链体系,打造了丰富的产业生态,在零售、物流、金融、健康、物产和保险等领域,沉淀了深刻的行业理解。京东云云舰平台凭借京东在多行业多场景的应用实践,形成了面对多种复杂环境的解决方案,支撑各行业企业实现数字化转型。

另一方面,京东云联手长期战略合作伙伴英特尔,通过软硬件协同满足了混合多云对服务敏捷性和可靠性的要求。基于第三代英特尔® 至强® 可扩展处理器的京东云新一代天枢服务器为云舰平台提供了高可靠性的基础架构,为企业 IT 架构带来了灵活性和高性价比,为各行业所需的工作负载提供了更为优秀的性能。

通过丰富场景的经验积累和强强联手的技术研发与实践,云舰平台成为国内首个将混合云的管理推向操作系统级别的产品,实现了对基础设施全面、彻底的统一化管理与调度,有效解决了部署混合多云遇到的核心痛点。


云舰的三招致胜之道

面对多云部署的管理难题,京东云推出了搭载阿基米德智能调度平台的混合多云操作系统 JDOS,能够跨云、跨地域进行统一管理、监控和运维。

通过 K8S 引擎增强,阿基米德平台可以实现多集群的生命周期管理,通过智能化调度,最大化应用算力,实现降本增效;通过应用京东自研的机器学习、深度学习等算法,阿基米德平台可以对资源应用进行画像统计与预测,使资源利用效率成倍提升;通过基于英特尔 IPU 产品,京东云自主研发的智能网卡方案,阿基米德平台可以加速网络基础设施,释放 CPU 内核,实现应用程序性能的提升。

短视频领域作为多地、多用户的平台,要保证各地用户的视觉体验,对统一管理的要求较高。通过云舰平台,短视频可以实现一次性、分钟级的扩容,快速应对用户高峰期的工作负载问题,提升用户体验。

面对异构资源能力不一致的问题,云舰平台推出了 TPaaS 技术中台,以提供统一标准的 PaaS 组件能力,使用户一次适配,处处稳定运行。

通过将系统与应用解耦,云舰应用市场提供的 PaaS 组件和业务应用可以无差别地运行在各种不同的云平台上,大大降低了 PaaS 组件的迁移成本;通过开放 PaaS 生态,云舰平台除了京东云自研的 16 类 PaaS 组件外,还集成了开源 PaaS、生态伙伴 PaaS 等多种组件,使用户可以在一个平台上享受全面、统一的服务;在基础架构上,通过在数据库 Redis 服务里引入了英特尔® 傲腾™ 持久内存,成功实现了 TPaaS 中台服务 30% 的 TCO(总拥有成本)优化。

以 AI 应用为例,京东云可以通过自研的 PaaS 级 AI 应用,为机器视觉、自然语言处理(NLP)等场景提供支持。值得一提的是,第三代英特尔® 至强® 可扩展处理器集成深度学习加速和硬件增强型安全功能,并针对主流库、工具和模型优化,可为各种智能应用负载提供更优性能和 TCO 表现。

以大型企业集团为例,由于成立时间长、规模大,IT 系统建设时间跨度大,企业的系统往往结构复杂。同时各地区分公司独立部署使得技术发展不均衡,信息流转不通畅,且独立部署的各个云厂商的 PaaS 能力存在差异,且只能向下兼容自身的 IaaS,导致很多功能无法统一实现,为企业进行统一管理和决策带来了很大的难度。云舰的 TPaaS 技术中台兼容主流的公有云、私有云、虚拟机及各种网络、存储模型,可以在多云架构下实现 PaaS 能力的统一,大大降低企业的开发成本,帮助企业快速发展。

面对复杂业务环境带来的IT安全挑战,云舰平台以安全运营中心为核心,打造了一套云原生主动安全防御体系,能够有效保障应用安全可靠的运用。

一方面,云舰平台全方位覆盖网络安全、主机安全、应用安全、数据安全、业务风控、安全管理等多个领域,云上用户可以按需使用,大大减少了安全策略的部署成本;另一方面,云舰平台采用大数据、人工智能、威胁情报等技术,构建了网络空间安全治理模型,可以辅助安全运营团队有效识别风险隐患,提升风险治理能力。同时,英特尔也为云舰平台的安全性添砖加瓦。英特尔与京东云联合发布的白皮书中提到,云舰基于英特尔® MCA Recovery 技术和  MFP(Memory Failure Prediction)技术,为技术方案提升了 40% 的可靠性和稳定性(数据来源于《英特尔 MCA+MFP 助力京东构建稳定、高效的云服务》白皮书),实现了对云上应用的有效保护,以及英特尔® 软件防护扩展(SGX)能够为系统及平台提供安全可信的计算环境,实现数据和算法的硬件级别的隐私保护。

由于金融行业切实关系到国民经济的稳定运行,过去的金融系统往往较为封闭,技术路线固定。而随着互联网化、移动化的发展,金融行业的 IT 技术更加开放,面对的环境更加复杂,因此对安全性的要求也更高。云舰平台通过智能、开放、可灵活扩展的安全防御体系,可以在多云数据分区的基础上,全方位维护金融数据安全和金融应用稳定运行,全面提升金融行业 IT 安全管理效率。

云舰平台如同混合多云的控制中心,可以统筹混合多云的复杂环境,实现对多场景的调度与匹配。


“不做选择,全都要”

云时代企业部署混合多云的趋势,使得企业可以不被单个云产品捆绑、不做选择、享受全面的服务,而对于云厂商来说,构建 “云计算+产业链场景” 的开放生态成为了扩展业务、赋能行业的必然选择。

英特尔在数十年的创新历程中,除了硬件 OEM 和操作系统、虚拟化等软件服务商外,在新技术的不断发展中,还与京东云等各个领域的创新技术厂商保持密切合作,全面服务数据计算,存储和传输,持续加速人工智能,大数据分析,高性能计算等应用,助力各行业构建灵活高效平台,加速云数智变革。

同样的,京东云始终以开放的心态与其他生态伙伴进行合作:在底层生态上,京东与更多上下游的伙伴携手,通过与英特尔等强大伙伴的协作,共同提升产品水平,为用户提供更好的服务体验;在 PaaS 组件生态上,京东云全面开放。2021 年,京东云正式发布了行业首个全面开放的 PaaS 生态 “云筑计划”,并在首期引入了 PingCAP、巨杉、博云、亚信安全等近 30 家合作伙伴入驻。

在生态开放的道路上,未来,“云舰” 将搭载更多的功能型 “战舰”,以更强的产品、更好的服务驶向用户之海。