全新内置 AI 加速引擎英特尔® AMX,助阿里电商推荐系统实现 AI 推理性能突破

阿里巴巴正采用 CPU 处理 AI 推理等工作负载,为解决其面临的 AI 推理吞吐量、时延等多方面的挑战,阿里巴巴引入第四代英特尔® 至强® 可扩展处理器实施推荐系统升级;利用该处理器搭载的英特尔® AMX 高级硬件特性,并结合英特尔® oneAPI 等软件进行优化之后,阿里巴巴在保证足够精度的情况下,推理吞吐量提升达 2.89 倍。