基于英特尔® 至强® 可扩展处理器的新一代京东云服务器加速大模型推理助力构建数智化供应链基础设施

京东云携手英特尔优化推理服务器,其利用第五代至强® 可扩展处理器强劲的算力和内置的英特尔® AMX 加速器有效提升 AI 推理表现,并借助英特尔® oneDNN 降低开发难度。最终在大模型推理场景中可降低时延。新方案基于通用服务器打造,避免了采购专用加速器的高昂成本,且更具灵活性。