英特尔高效能数据中心白皮书

英特尔高效能数据中心白皮书

推进数据中心绿色发展,助力实现 “双碳” 战略

  • 面对气候变化这一项严峻的环境、经济与社会挑战,英特尔立足独特的产业定位,坚定履行责任,通过生产运营、技术产品、产业联动三管齐下,发挥引领作用,推进 RISE 战略,致力于在自身的运营、供应链,以及产品技术的创新研发与应用中,减少“碳足迹”,同时通过英特尔技术和产业影响力,携手生态伙伴减少碳 “足迹”,共同迈向碳中和计算的未来!

author-image

作者

导言

气候变化正在给人类生产生活带来直接且严峻的挑战,也深刻影响着全人类的可持续发展,需要各国积极行动,减少温室气体排放,共同推动可持续议程与进程。

基于推动实现可持续发展的内在要求,以及构建人类命运共同体的责任担当,中国将生态文明发展模式明确为国家总体战略,以及共谋全球生态文明建设重要举措,宣布了 “碳达峰” 和 “碳中和” 的目标愿景,并陆续出台严厉措施,使得绿色经济与发展可持续成为社会重要议题,也使产业绿色化成为各行业发展的重中之重。

英特尔积极实施环境战略

英特尔基于履责 (Responsible)、包容 (Inclusive)、可持续 (Sustainable)、赋能(Enabling) 的 RISE 战略和 2030 目标,在中国积极履行企业社会责任,将促进环境可持续作为长期承诺,制定了企业整体环境目标,持续投资节能减排。其中,提升产品能效,推进绿色计算,正是英特尔实施 RISE 战略,助力中国实现“双碳”战略目标的关键行动之一。

数据中心现代化面临环境挑战

随着数字化成为拉动经济发展的重要引擎,据权威统计,2019 年中国数字经济对经济增长贡献率达到了 60% 以上1,数据中心作为其重要底座,也已担当起新基建的重要支撑角色,机架数量呈现快速增长趋势。但同时,数据中心耗电量也不断刷新纪录,在 2020 年已占全社会用电量约 2.7%2。面对不断增长的能源消耗,加速运营模式的转型,成为数据中心行业可持续绿色发展的重要课题。

在政策层面,推进生态文明建设已经成为中国的基本国策,以及五位一体总体布局的重要支柱,也是向世界彰显中国负责任形象的战略之举。而加快建设绿色数据中心,构建新一代信息基础设施,对于提高资源能源利用效率,进一步推动绿色低碳发展具有重要意义。为此,2021 年 5 月,国家发改委等四部委联合发布《全国一体化大数据中心协同创新体系算力枢纽实施方案》,将绿色低碳列为基本原则,强调通过创新技术全面提高数据中心能源利用效率;同年 7 月,工信部印发《新型数据中心发展三年行动计划 (2021-2023 年)》,明确提出新建大型及以上数据中心电源使用效率 (Power Usage Effectiveness,PUE)降低到 1.3 以下的目标。其后,北京市、银保监会、人民银行也出台规定,支持与促进减碳;2021 年 11 月,国家市场监管局批准了《数据中心能效限定值及能效等级》国家强制性能效标准,综合发力,激励相关 IT 企业通过创新方案等多维度措施,帮助数据中心进一步实现绿色低碳,为经济社会高质量发展提供新动能。

从数据中心技术层面看,如何在计算密集型工作负载和其与低能耗运行之间的矛盾找到解决方案,本身便是个深刻的命题。而作为数据中心重要设备的服务器,不同散热设计功耗 (Thermal Design Power,TDP)、业务需求和功能承载对数据中心环境、服务器各硬件及功率要求都有着巨大的差异。

英特尔创新科技,助力数据中心应对环境挑战

英特尔致力于成为推动可持续发展的领导者,通过积极行动和创新技术,携手合作伙伴共同减少环境影响,不仅部署战略投资,长期坚守环境承诺,而且发挥自身技术和产业等优势,在机架密度、液冷技术、服务器能效比提升等方面提供多项解决方案,并积极推动绿色数据中心相关标准化工作,以期通过与生态伙伴开放合作,驱动全栈联动节能,系统化减少碳足迹。

增加机架功率密度,综合提升数据中心能源效率

高功率密度数据中心依托成本、效率和容量等优势,越来越受到青睐。英特尔积极参与国家绿色数据中心计划,推动行业技术标准制定,联合中国信息通信研究院 (云计算与大数据研究所) 等单位编写 《ODCC-2021-05002 数据中心功率密度演进白皮书》,提出对数据中心最优化密度模型以及数据中心功率密度的发展建议,助力政府相关政策的出台,指引数据中心产业绿色发展。

在技术创新方面,英特尔推出 DCM 数据中心管理平台方案。该方案通过实时精确获取服务器设备能耗及环境温度等信息,实施智能分析与策略匹配,有效帮助数据中心提升机柜密度,定位僵尸机,从而增加单位面积计算能力和能效水平,为数据中心绿色发展提供助力。在产业实践方面,英特尔携手百度智能云、宁畅、浪潮信息、中国电信等伙伴,采用高密度机架方案,推出各具特色的数据中心机架产品及节能方案,显著降低了数据中心的碳排放水平。
 

  • 百度智能云

为解决服务器在散热效率、供电能力、供电损耗、节点密度等方面的多个痛点,百度智能云设计并规模化应用北极整机柜技术方案,近些年先后推出 1.0、2.0、3.0 和 4.0 整机柜系列产品,先进的硬件技术助力百度智能云走在行业前列,北极整机柜有效提升节点密度,单机功耗大幅降低。目前,北极 3.0 架构搭配英特尔® 至强® Whitley 平台已上线百度机房,搭配英特尔® Eagle Stream 平台的深度自研设计产品也将在明年落地。

在环境保护与节能减排领域,双方战略契合、理念一致。将继续深化和拓展合作,以高能效产品和方案,助力生态文明建设,赋能全球可持续发展。
 

  • 宁畅

通过携手英特尔,宁畅在服务器液冷技术、电源转换效率、主板低损耗设计等领域实现了持续创新。宁畅 B5000 G4 多节点服务器采用 4U8 节点结构设计,搭载第三代英特尔® 至强® 可扩展处理器,在一个标准 42U 机柜中,可实现 80 个计算节点部署,极大提升计算密度。其模块化设计贯彻绿色节能理念,实现统一供电、共享散热管理。其支持的液冷冷板式散热,搭配专业冷媒,覆盖 CPU、内存等主要部件,整机 PUE 低至 1.1,且能够极大降低总体拥有成本。

携手英特尔加速推进 “智定+”,研发和采用新技术,为市场提供更绿色、更环境友善的计算产品,贡献生态文明建设。
 

  • 浪潮信息

预制化数据中心是浪潮信息的创新力作,旨在为客户提供快速搭建、快速成型、适应各种条件的数据中心产品和服务。通过与英特尔合作,进行处理器功率控制调优,和根据业务负载自动调整功率,以及基于英特尔的开放处理器微代码,调整主板与处理器电压等举措,浪潮信息预制化数据中心方案已落地在公有云服务。实践表明,这一方案显著性提升了功率密度,单机柜功率密度最高可支持 20kW,实现算力的有效提升。且即使采用纯风冷,PUE 也可内控保持在 1.2 以下。基于这一高功率密度方案,浪潮信息还与工商银行联合构建预制化数据中心,极大提高了单机柜功率密度,显著提升了能效和智能化管理水平,斩获 “数据中心创新产品” 大奖。

通过从产品设计、制造工艺等底层架构着手,与英特尔广泛合作,基础性提升服务器等功效比,支持用户打造绿色数据中心,促进 “双碳” 战略实现。
 

  • 中国电信

互联网数据中心 (Internet Data Center,IDC) 能耗是中国电信能耗的主要来源。为积极应对 IDC 高能耗,以及能耗管理不够精细、维护耗时耗力等问题,中国电信引入 AI 技术,利用机器学习、深度学习等算法,结合 IDC 能耗特点,面向机房制冷系统构建节能模型,生成定制化的节能方案,形成一房一策的节能策略集,使得制冷节能率达 30% 左右,平均综合节能率达 4%~9%。

希望通过与英特尔等产业伙伴广泛合作,借助计算架构创新和智能技术的应用,提升数字基础设施能源效率,推进绿色数据中心建设赋能未来绿色计算创新。

数据中心液冷技术,打造能效新标杆

液冷技术被业界认可为降低数据中心能耗的可靠与可行方案,具备提升服务器使用效率和稳定性、降低能源消耗比,以及增加服务器密度等优势,成为数据中心绿色发展的关键举措。在这一领域,英特尔携手联想、浪潮信息、新华三、宁畅、超聚变、百度智能云、阿里云、京东云、腾讯云等伙伴,也已推出多款产品,实现液冷技术在多场景的落地应用,为数据中心绿色变革提供实践典范和生态之力。

 

  • 联想

联想基于新一代海神温水水冷技术,以及第三代英特尔® 至强®可扩展处理器,打造了联想 ThinkSystem SD650 服务器,采用创新散热技术提升性能,降低功耗。经在北京大学超算系统部署 196 个节点,以及超过 4 年的运行表明,其不仅性能稳定可靠,而且 PUE 值低至 1.08,Linpack 达 92.59%;另具北京气象局部署 800 个节点,并经与空调系统共用一套冷源的应用显示,其将机房投资降低了 30%,Linpack 达 70.2%。

采用新一代英特尔®️ 架构,通过双方深化合作,系统级提升基础设施性能和运行效率,优化和管控功耗,助力绿色发展。

 

  • 浪潮信息

浪潮信息基于第二代英特尔® 至强® 可扩展处理器,采用节点内双 CPU 液冷设计,推出 i24M5-LC 高密度液冷服务器,通过与新一代高密度数据中心的结合,支持快速组建完整的液冷服务器系统,成为经济高效的液冷集群方案,PUE 可低至 1.2 以下,并已在实践应用中取得良好成效。如在西安一个创新港部署了 200 多个节点,单机效率达到 66% 左右;在稻城某高海拔数据中心,该服务器通过控制处理器散热器实现均衡降温,保障了几近无人值守状态下的高稳定运行;某 985 高校则采用了基于第三代英特尔® 至强® 可扩展处理器的纯液冷集群,运行效率超过 70%,深受用户好评。

 

  • 新华三

新华三与英特尔从产品设计、工艺等方面着手,基于第三代英特尔®至强® 可扩展处理器,合作开发了新华三下一代整体液冷解决方案,提供浸没式和冷板式服务器液冷系统,配套液冷机柜系统以及液冷数据中心整体方案,打造更加绿色的数据中心。全新推出的 H3C UniServer 冷板式液冷服务器,与传统风冷服务器相比节能 21.3%,并入选信通院 “零碳算力共建计划”。在全生命周期具备良好的节能降碳效果,实测整机柜全年局部制冷 PUE 低至 1.042,可以轻松实现数据中心达到 1.2 以下 PUE 的目标,同时整机柜噪声低于 60dB (A),并在降低设备故障率、提高性能等方面也有显著效果,有效助力百行百业节能减排。

与英特尔等伙伴深化合作,创新数字化解决方案,助力百行百业节能减排,共创更加可持续的未来。

 

  • 宁畅

宁畅 G40 系列服务器搭载第三代英特尔® 至强® 可扩展处理器,除支持主流 “冷板式液冷散热” 外,还支持 “闭式液冷散热” 系统。“闭式液冷” 系统让用户无需改造传统风冷机房,便可实现散热能力提升 40%,结合宁畅风扇混合优化技术,让典型负载风扇功耗降低 40%,助整机功耗降低超 3%,实现“普惠”的数据中心 “绿色” 方案。作为智能算力定制专家,结合英特尔前沿技术,宁畅定制化 “分体液冷冷板” 方案正被众多知名互联网企业接受、采用。

 

  • 超聚变

超聚变基于第三代英特尔® 至强® 可扩展处理器打造创新架构整机柜液冷服务器,整机柜使用机柜上走电下走水架构,原生液冷设计实现天然可靠性保障,支持 100% 液冷散热,PUE 达 1.10 以下,优于中国国家对大型数据中心枢纽节点要求;整机柜支持高密部署,可支持 144 个 CPU,同时机房免冷机部署,空间利用率再提升 20%;业界首创液、网、电三总线盲插,机柜内 0 线缆部署,支持机房向机器人运维演进,配套超聚变智能运维管理软件,可将业务上线效率提升 10 倍以上。

超聚变联合英特尔在算力基础设施深入合作,通过架构创新和整机工程技术创新打造高效的商用液冷方案,致力为客户提供绿色算力。

 

  • 百度智能云

百度智能云多年来一直在探索降低服务器的整体功耗,早在 2017 年就携手英特尔推出冷板式液冷服务器解决方案,2021 年双方在液冷技术领域进一步深度合作,一是发布业界面向冷板式液冷的 《天蝎 4.0 液冷整机柜开放标准》,二是面向浸没式液冷,双方共同探索创新技术,并推进业界首个浸没式液冷整机机柜标准的制定,助力 IDC 由风冷数据中心向液冷数据中心转变,推动产业绿色发展。液冷散热技术的创新应用,既能解决随着芯片功耗越来越高风冷技术难以解决的散热问题,又能够有效降低服务器单机能耗,实现绿色节能。

 

  • 阿里云

阿里云从 2016 年开始尝试大规模部署液冷技术,认为浸没液冷除能够提供超高的散热效率,同时也以高可靠、高可用等特点,为数据中心带来跨越式的技术创新,但其前提是首先解决服务器硬件对浸入式液冷的兼容问题。英特尔对包括直接接触式 (浸入式) 和非直接接触式 (冷板) 在内的各种液冷技术做了全面的研究与开发,围绕浸入式液冷所面临的材料兼容性、电气信号完整性、芯片散热特性、服务器系统散热特性、服务器及机柜 (Tank) 结构设计等课题,与阿里巴巴开展了广泛而深入的合作,从处理器定制和服务器系统开发与优化着手,突破芯片功耗墙功耗和冷却两大影响算力提升的关键问题,使得液冷服务器在阿里巴巴数据中心成功大规模部署,在 2018 年建成首个互联网液冷数据中心,在 2020 年投产首个 5A 级绿色液冷数据中心,在每年可以节省电能至少达千万级的同时,服务器系统的故障率相比风冷服务器下降约 53%,帮助阿里巴巴有效降低了数据中心总体拥有成本。

与英特尔共同推动节能型数据基础设施建设,更好服务云市场,并引领数据中心产业的绿色进程。

 

  • 京东云

在现代化的高密度数据中心,随着算力的提升,散热效率、节能减排以及运营成本遭遇了极大挑战,面对挑战,京东云和英特尔共同推动数据中心液冷冷板解决方案。相比传统的空气冷却方案,液体冷却 (液冷) 有着更高的冷却效率与能源效率,不仅能够有效降低 XPU (如 CPU、GPU) 等关键组件的运行温度,降低其因为高温降频所带来的性能损失,提升整体性能表现,还有助于节约电能的损耗以及碳排放量,在经济性、环境保护等方面都有着不菲的收益。

为了进一步发挥液冷的潜力,京东云与英特尔合作,发布了从数据中心级到微处理器级的冷板液冷整体解决方案。该整体解决方案在冷却液分配单元 (CDU)、工作液、歧管、服务器等方面进行了针对性的创新设计,采用了定制版本的第三代英特尔® 至强® 可扩展处理器,以及英特尔节点管理实施、空闲电源优化等技术,有效提升了 IT 能源效率 (ITUE)。目前,该方案的商业部署已经在京东云自建数据中心中进行批量部属,并经 11.11 以及春晚红包互动活动重载验证,能够将京东云数据中心的 PUE 从 1.3 降低到 1.1,每个 14KW 机柜每年可节电 31031 度,碳减排 24.4 吨。

与英特尔等产业合作伙伴一起,继续推动架构创新及智能技术发展,助力绿色数据中心建设,为产业数智化变革赋能。

 

  • 腾讯云

为满足数据中心高密度计算设备的冷却需求,腾讯云积极探索可再生能源利用,不断通过架构及技术革新降低数据中心 PUE,并加强软硬件技术研发,提升服务器能效。腾讯云基于英特尔平台的首款自研服务器,在计算密度提升上高达 50%,并通过设计高性能散热器和研发创新独立风道设计,将平台散热能力提升达 45%。目前,腾讯云在中国南区的第四代 T-block 技术通过采用高效率的制冷和供配电架构,拥有 30 万台服务器的园区一年能节省约 2.5 亿度电,且具有低噪音、高能效等特点与成本优势,还可解决高密度数据中心的散热问题。未来腾讯云也将与英特尔继续紧密合作,推动冷板式液冷技术规模化应用,共同探索更节能、更绿色的系统集成方案。

携手英特尔一如既往地全方位深化合作,以至强全栈产品为基础,打造全面、智慧、安全的 XPU 基础设施平台,并通过强大的生态体系赋能,持续推动节能技术创新, 共建数据中心绿色节能新纪元。

英特尔基础设施智能化与能效创新组合,持续优化数据中心能耗

作为数字化基础设施建设的推进者,英特尔在服务器和数据中心产品领域,不断进行创新技术迭代,从 XPU 部件创新、服务器与机柜设计到数据中心建设,全方位、立体化为客户提供能效优化解决方案。英特尔能效创新技术包括:

1、动态功耗钳制管理:

通过为服务器动态分配电能供应,可将机架密度提高 10%-20%,而对性能影响有限。

2Turbo 机柜技术:

使用机架备用电池消除计划外峰值功耗,可将服务器上架率提高20%~30%。

3、待机功耗优化技术:

通过优化服务器空闲或低利用率状态时的功耗 (将 CPU 功率降低到 TDP 的 50% 以下),使功率/利用率负载线变得更加线性。

448V 集中供电技术:

通过增加母线电压,适应大功率机架之需,可将电源效率提高 2%,并提升机柜空间利用率,能够综合提升能效。

5SLO 自适应平台效率管理:

根据工作负载所需动态优化功率分配,提升能源利用率 。

6、英特尔®️ SST 技术:

英特尔® SST 技术能够对处理器单个及多个核心的运行状态、频率和功耗进行精细化控制,依靠 PP、BF、CP 和 TF 四种不同但又可互补的配置模式,在保障能效更优的前提下,满足不同负载的差异化需求,从而为数据中心的多样化、差异化应用需求提供更好支持。

73DVC 散热技术:

通过和生态链伙伴合作,首次将 3DVC (三维立体真空腔均热板散热技术) 引入到服务器散热设计中,利用三维空间气液相变换热技术,相比较热管散热器,在性能提高的同时,成本也降低 20% 左右。

8、英特尔®️ FIVR (全集成电压调节器技术)

通过核心级别的功耗和性能调节,使得 CPU 在应对复杂多变的计算任务时获得更好的能效成为现实。

 

  • 百度智能云

通过与英特尔合作,推出了 48V 整机柜集中供电方案,将电源效率提升 2%,铜排损耗降低 90%,电源数量减少 37.5% 以上,机柜空间利用率最高提升 3 倍,通用计算服务器功耗降低超 1.5%,GPU 服务器功耗降低超 2%。

 

  • 中兴通讯

作为国内首家采用英特尔电源汇流条技术,降低服务器主板 CPU 供电传输损耗的创新型设计合作伙伴,中兴通讯经过反复论证,优化印刷电路板 (PCB) 的布板 (layout) 设计,使主板单颗 CPU供电直流损耗降低 36%,效率较传统电源方案提升 0.5%-1%。在散热设计和功耗优化方面,经与英特尔及生态链合作伙伴的严格仿真测试和验证,对风扇的结构性能、工作电量消耗做了反复优化,且首次将 3DVC 应用在服务器散热设计中,实现成本降低 20%,同时散热性能提高 3%~5%,在相同配置下整机系统功耗降低了 40W,相当于一个中型数据中心 (以 3000 台服务器计) 一年节省电费 75 万元人民币。

发挥与英特尔合作第一梯队的位势,探索和创新节能减排方案和新领域,以期在助力实现‘双碳’战略中发挥引领作用。

 

  • 超聚变

超聚变服务器全生命周期智能管理软件 FusionDirector,结合英特尔提供的节能与 RAS 底层技术,打造了数据中心基础设施五大智能运维能力,包括智能部署、智能发现、智能升级、智能维护和智能节能,能够使数据中心主要运维场景的工作效率提升 30%,具备更好运维体验,同时还可极大地降低运维成本。

FusionDirector 基于服务器全生命周期构筑安全防护体系,保障服务器从启动、运行、数据流、合规性,直到退服环节的全生命周期安全,全方位保护客户的资产及数据安全。

结合英特尔节能和 RAS 可靠性技术,超聚变 Fusion Director 给数据中心基础设施运维提供了五大智能技术,让数据中心主要运维场景的工作效率提升 30%。

联手产业生态共同发力,进一步扩大技术 “手印”

在帮助数据中心等数字基础设施节能增效,推进绿色计算的同时,英特尔作为全球领先的芯片公司,也不断发挥自己的产业影响力,联手产业上下游合作伙伴,共同推动“双碳”政策落地实施。

 

  • 中国电信

中国电信发布 “翼节能” 系列成果,并与英特尔合作推进绿色智慧数据中心建设,同时携手英特尔等合作伙伴积极推动标准化立项,探索 AI 等新技术在数据中心节能减排中的应用,且经过相关试点,已经取得显著成效。

 

  • 京东云

京东云借助英特尔®️ 内存故障预测 (英特尔®️ MFP) 技术,可实时分析内存故障并主动隔离潜在风险,降低服务器宕机故障率,延长元器件使用寿命,有效减少数据中心的电子垃圾等。

结语

面对气候变化这一项严峻的环境、经济乃至社会挑战,英特尔立足独特的产业定位,坚定履行责任,通过生产运营、技术产品、产业联动三管齐下,发挥引领作用,推进 RISE 战略,致力于在自身的运营、供应链以及产品的营销及使用中,减少直接的气候 “足迹”,同时通过英特尔技术和产业影响力,帮助产业伙伴与其他各方来减少碳 “足迹”,共同迈向碳中和计算的未来!