第七代 Pico Corvil 工具采用第三代英特尔® 至强® 可扩展处理器进行低时延金融分析

第七代 Pico Corvil 工具采用第三代英特尔® 至强® 可扩展处理器进行低时延金融分析

  • 在金融交易实践中,速度意味着一切。Pico 携手英特尔,将第三代英特尔® 至强® 可扩展处理器内置到了第七代 Corvil 10000 工具中,向实现每秒 1 亿个数据包吞吐量的目标看齐,更好地为不断提高的交易速率和交易量提供支持。

author-image

作者

执行概要

Pico 是全球重要的金融市场技术服务提供商。随着金融市场中网络时延的降低以及报文速率和交易量的提升,Pico 的 Corvil Analytics 工具需要实现更高的持续吞吐量。Pico 的工程师和开发人员与英特尔合作,将第三代英特尔® 至强® 可扩展处理器集成到了第七代 Corvil 10000 工具中。尽管这并非市场最初的需求,但 Pico 表示,新 CPU 更为强劲的性能和全新功能将使 Corvil 10000 能够达到每秒 1 亿个数据包的吞吐量,更好地为不断提高的交易速率和交易量提供支持。
 

解决方案摘要:

•    Pico Corvil Analytics 10000 工具
•    双路英特尔® 至强® 铂金 8358 处理器(每路 36 核) 
•    英特尔® Speed Select 技术
•    目标为每秒处理 1 亿个数据包


挑战

在金融交易实践中,速度意味着一切。多年来,统一证券行情协会 (Consolidated Tape Association, CTA) 证券信息处理器 (SIP) 的传输速度越来越快,因而时延得以降低。低时延带来了交易量的增加。如今,CTA 时延已低于 20 微秒,实现了每 100 毫秒近 100 万次报价和数十万次交易。为了顺应速率的提高,期权价格报告机构 (Options Price Reporting Authority, OPRA) 的报文会通过 40 Gbps 的网络传递给客户,这就要求金融服务业 (Financial Services Industry, FSI) 的基础设施具备更高的性能。

Pico 为整个金融市场提供任务关键型技术、数据和分析服务。该公司的弹性专有网络 PicoNet* 是一个全球性的低时延、全冗余一体化网络。PicoNet 实现了包括各大公有云提供商在内的全球各大金融数据中心的互连。客户涵盖全球各大银行、交易所、量化对冲基金、电子做市商和资产管理公司。

Pico 为整个金融市场提供任务关键型技术、数据和分析服务。

提供商在内的全球各大金融数据中心的互连。客户涵盖全球各大银行、交易所、量化对冲基金、电子做市商和资产管理公司。

Pico Corvil Analytics 裸机设备在 Pico 的托管数据中心和私有数据中心内运行,以获取金融策略师和交易员使用的交易信息,并添加时间戳、进行处理和存储。

“交易所的报价和交易以微秒为单位更新,” Pico 产品管理负责人 Donal O’Sullivan 解释道。“最快的 FPGA 引擎会在亚微秒的时间框架内运行。我们的工具会密切监视交易活动和客户的算法,实时获取大量数据、为其添加时间戳、建立关联性、开展分析,然后在本地将所有这些数据存储到磁盘。这些数据会用于故障排除、风险管理、监管报告和客户留存。”

Pico 目前的旗舰工具 Corvil 9000 支持 40 Gbps 以太网且支持未来升级至 100 Gbps,可用于数据分析、抓包和导出。该工具短时间内可以支持 100 Gbps 的数据传输。然而,随着数据量的持续增长,再加上交易网络中大量采用 100 Gbps 以太网,Pico 需要一种性能更强的解决方案。该公司想开发一种速度更快的新型工具,为客户提供足以应对未来几年流量变化的数据分析吞吐能力。

Corvil 系统每秒需持续处理多达 1 亿个数据包,这意味着每一秒都要完成 1 亿个数据包的获取、分析、时间戳添加及磁盘存储。为了达到这个标准,Corvil Analytics 10000 工具在第三代英特尔® 至强® 可扩展处理器上进行构建。

借助第三代英特尔® 至强® 可扩展处理器,Corvil 10000 的目标是实现每秒 1 亿个数据包从获取到存储一系列操作,而不是仅支持数据暴增的情况。没有新技术的支持,这样的性能就无法实现。

解决方案

O’Sullivan 补充道:“在产品线设计之初,我们就决定将我们的工具构建在英特尔® 平台上。随着每次全新英特尔® 架构的发布,我们对这一决定就越发坚定。Corvil 10000 是我们出色的第七代分析工具的一部分。”

根据 O’Sullivan 的说法,对于典型的市场数据包来说,100 Gbps 的线速相当于每秒 1 亿个数据包。因此,Corvil 系统需要在低时延市场环境下的托管设施中每秒持续处理高达 1 亿的数据包。

“要执行我们所提供的分析服务,我们分析了所有的数据包。” O’Sullivan 说道。“这意味着每一秒都要完成 1 亿个数据包的获取、分析、时间戳添加和磁盘存储。”

为了达到这个标准,新一代 Corvil Analytics 10000 工具在采用了全新微架构的第三代英特尔® 至强® 可扩展处理器上构建。与上一代英特尔® 至强® 可扩展处理器相比,该处理器可实现高达: 

•    1.46 倍平均性能提升1 
•    1.6 倍内存带宽提升以及 2.66 倍内存容量提升1
•    1.33 倍 PCIe 通道增幅1

此外,全新英特尔® 处理器还内置了英特尔® Speed Select 技术,并支持 PCIe Gen4,以加速 I/O。通过与英特尔合作,Pico 于 2021 年便收到了新一代英特尔® 服务器处理器的早期样本,并开始着手移植代码。

O’Sullivan 说:“在代码移植初期,我们的测量结果显示我们的流数据包处理引擎,也就是设备的核心引擎,有了 40% 的增长2。这是在几乎未对代码做具体调整以利用新功能的情况下实现的。”


结果

第三代英特尔® 至强® 可扩展处理器帮助 Corvil 工具实现了继续提供出色服务所需的能力。借助全新的英特尔® 处理器,Corvil 10000 的目标是实现每秒 1 亿个数据包从获取到存储一系列操作,而不是仅支持数据暴增的情况。没有新技术的支持,这样的性能就无法实现。

“第三代英特尔® 至强® 可扩展处理器每时钟周期指令数的增加为我们处理引擎带来的提升立竿见影,” O’Sullivan 解释道。“而这仅仅只是个开始。为获取数据、添加时间戳、进行算法及其他处理,我们的系统需要进行大量的内存访问。内存带宽和内存速度的提升使这一切可在内核中持续得到处理。”

全新的英特尔® 处理器还消除了包括磁盘 I/O 和压缩在内的其他瓶颈。

“我们需要增加更多的存储容量来支持持续不变的存储吞吐量。” O’Sullivan 补充道。“有了 PCIe Gen4,我们就有了更多更快的 PCIe 通道,可以支持更多的磁盘来实现我们需要的吞吐量。”

鉴于目前的数据处理量,Corvil 工具在将数据存储到磁盘之前,会使用 CPU 内核来完成数据的压缩。据 O’Sullivan 说,全新英特尔® 处理器对位代数和矢量位操作计算的支持,使其在以持续不变的速度进行磁盘压缩上有了显著的改进。

Corvil 工具通过在整个分布式基础设施上进行横向扩展,以及利用英特尔® 架构提供的高内核数和超线程技术,持续保持高性能。虽然也存在许多非关键路径的线程,但因为总是有需要更多性能的热线程,所以对某些任务进行多线程处理并不总是最佳方法。

“尽管时间戳处理从计算角度来看不算太昂贵,但如果想每秒进行 1 亿次处理,那么成本就非常高了!多线程带来很多令人头疼的问题,因此按顺序在单线程上执行这项操作颇有益处。英特尔® Speed Select 技术让我们能以更快的速度运行线程,这速度甚至会超过睿频,与此同时还能保持在功耗和散热的限制之内。如果没有这些全新的 CPU,我们不可能实现所需要的持续吞吐量。” O’Sullivan 总结道。


解决方案摘要

由于具有可持续的高报文吞吐量,Pico 的 Corvil Analytics 工具为金融市场服务提供了非常出色的性能。多年来,Corvil 一直在英特尔® 架构上构建自己的产品线。面对网络带宽和金融市场中报文量的不断增加,Pico 采用第三代英特尔® 至强® 可扩展处理器来构建第七代 Corvil 10000 工具。新一代的英特尔® 至强® 可扩展处理器具有更多的每时钟周期指令数、更大的内存带宽和容量、更快 I/O 的 PCIe Gen4 以及英特尔® Speed Select 技术。这一系列得到增强的特性使新的 Corvil 工具能够以每秒 1 亿条报文的吞吐量为目标,同时还可为交易基础设施中的新一代网络带宽留有余量。

尽管时间戳处理从计算角度来看不算太昂贵,但如果想每秒进行 1 亿次处理,那么成本就非常高了!多线程带来很多令人头疼的问题,因此按顺序在单线程上执行这项操作颇有益处。英特尔® Speed Select 技术让我们能以更快的速度运行线程,这速度甚至会超过睿频,与此同时还能保持低功耗/热耗。如果没有这些全新的 CPU,我们不可能获得所需要的持续吞吐量。”

—Donal O’Sullivan,Pico 产品管理负责人

更多信息

详细了解 Pico 及其 Corvil Analytics 工具。

探索第三代英特尔® 至强® 可扩展处理器的功能。该处理器内置英特尔® Speed Select 技术和英特尔® 深度学习加速技术,可加速 AI 推理。


解决方案组成部分

•    Pico Corvil Analytics 10000 工具
•    双路英特尔® 至强® 铂金 8358 处理器(每路 36 核) 
•    英特尔® Speed Select 技术
•    目标为每秒处理 1 亿个数据包