用友采用第五代英特尔® 至强® 可扩展处理器 加速自然语言处理 (NLP) 应用 助力企业服务数智化转型

第五代英特尔® 至强® 可扩展处理器

概述

  • 用友 iuap 为了解决随着 NLP 业务模块快速增长引起向量数据吞吐挑战。为此用友携手英特尔,在第五代至强® 可扩展处理器强劲性能的支撑下,经测试其在 NLP 工作负载中实现了 1.2 倍代际吞吐性能提升,不仅化解了吞吐性能挑战,并且提升了服务器的单位性能密度,在相同性能水平下降低总体拥有成本,也帮助了用户在应用中可根据此实践按需完成硬件选型。

author-image

作者

我们一直致力于推动 NLP 等技术在企业服务流程的广泛应用,使得企业服务由流程驱动转变为基于 AI 模型调度的语义驱动。在此过程中,高性能的第五代英特尔® 至强® 可扩展处理器能帮助我们加速 AI 应用,进而为企业带来智能化的业务运营、自然化的人机交互、智慧化的知识生成、语义化的应用生成,契合企业基于数智技术实现业务与业务、业务与财务、业务与管理融合创新的时代需求。”

— 方高林,用友助理总裁

我们正在迈向以 AI 广泛应用为突出标志的数智化时代,第五代英特尔® 至强® 可扩展处理器将为用户的数智化转型战略提供坚实的算力基础。与用友的合作证明,该处理器在向量化操作、AI 加速等方面有着卓越的性能优势,且具备出色的灵活性与经济性,可助力打造数智化的企业服务体系。”

— 唐炯,英特尔(中国)有限公司,软件技术合作事业部总经理

挑战

自然语言处理 (NLP) 应用常会涉及到向量化处理,这在满足数据匹配、特征检索等应用要求的同时,也给基础设施平台带来了以下挑战:
 

  • 海量的向量化数据处理会导致吞吐性能出现瓶颈,随着 NLP 应用规模的扩大,需要进行向量化处理的数据在不断增长,带来了与日俱增的性能压力。
  • 在如今的 NLP 应用中,词嵌入 (Word Embedding) 等技术实现了深度应用,这些技术依赖于向量映射等操作,对于向量性能带来了较高要求。
  • 出于经济性考量,用户通常希望能够尽可能提升向量化处理的性能密度,对于基础设施的总体拥有成本 (TCO) 进行更好的控制。

解决方案概述

作为人工智能 (AI) 技术的一个重要发展方向,自然语言处理 (NLP) 在近年来实现了高速发展,并被普遍应用于虚拟个人助理 (VPA)、智能搜索、智能语音助手、知识问答等领域,为用户提供了更加贴近自然语言表达方式的人机交互服务,增强业务的智能化并提升处理效率。随着接入 NLP 服务的应用、用户数量的快速增长,以及 NLP 模型复杂度的不断提升,NLP 面临着日益沉重的性能挑战,这包括 NLP 中的向量化处理要求较高的吞吐能力。

为了提升 NLP 应用的处理性能,用友在全新一代商业创新平台 (BIP) 的支撑底座:iuap 中,采用了第五代英特尔® 至强® 可扩展处理器进行加速。第五代英特尔® 至强® 可扩展处理器实现了显著的代际性能提升,并可利用英特尔® AVX-512 指令集的支持,大大提升了向量指令的吞吐能力,能够更好地应对庞大的向量数据操作量带来的性能压力,助力构建更加高效的企业智能中台,赋能智友对话机器人、智能大搜等应用。

用友 iuap 通过 NLP 技术赋能企业数智化转型

用友商业创新平台 YonBIP 是用友采用新一代信息技术,按照云原生(含微服务)、元数据驱动、中台化和数用分离的架构设计,涵盖平台服务、应用服务、业务服务与数据服务等形态,集工具、能力和资源服务为一体,服务企业与产业商业创新的平台型、生态化的云服务群。YonBIP 具有数字化、智能化、高弹性、安全可信、平台化、生态化、全球化和社会化八大特性,是企业通过数智化实现商业创新发展的使能平台。

iuap 作为全新一代商业创新平台的支撑底座,服务于成长型、大型及巨型企业数智化转型,助力企业提升数字化技术驾驭能力。其基于技术平台、数据中台、智能中台及业务中台,为企业提供了中台化构建能力、多云环境下的混合云开放集成互联互通能力、技术普惠化下的低代码开发和数智能力自助等应用快速构建能力。iuap 智能中台是企业数智化大脑,通过 AI 平台 + 算法 + 知识图谱技术,以统一的智能交互方式和智能服务,提升核心竞争力,为客户创造价值,降本增效。其产品主要包含数智员工、RPA、智友、智能搜索、知识图谱、AI 工作坊、智能服务等。

1. iuap 智能中台总体架构

iuap 智能中台在智友对话机器人、智能大搜等应用中深度采用了 NLP 技术:

  1. 智友对话机器人

智友对话机器人是 AI+ 互联网时代,人工智能应用的核心入口,通过运用语音识别 (ASR)、自然语言处理 (NLP) 和语音合成 (TTS) 等技术,将语音等非结构化的数据,转变为机器可处理的结构化数据,与现有的 OA,CRM,ERP 等应用系统相结合,成为用户的智能虚拟助理,为用户提供问答与任务执行服务。智友对话机器人依托于用友 IUAP 云平台,结合协同、采购、人力等领域特性,通过意图、知识库、技能、对话标注等的综合运用,构成机器人创建、训练、反馈、优化的闭环使用场景。典型的对话机器人应用有以下几种:
 

  • 知识问答:对用户意图进行解析,基于预置业务知识库,进行业务问题进行解答。
  • 业务处理:对接相关业务系统,将语音指令,转换为机器人能够理解的结构化指令,并结合后台业务系统,完成相应操作。
  • 闲聊:回答用户的一些问候、情感及娱乐信息等开放性问题。

 

  1. 智能大搜

智能大搜是用友云智能搜索服务的一个核心应用,应用场景包括智能搜索、知识问答、图谱协作、员工赋能等,提供搜文档/图片/视频/课程、AI 问答搜、图谱搜索/推理、智能问答、AI 导读与推荐等功能(见图 2),可以帮助企业快速构建基于领域/行业多模态知识的检索及问询系统,支持海量级结构化/非结构化数据存储,提供智能问答(知识、文档、图片问答等)、资源检索、智能推荐等服务。

2. 用友智能大搜应用场景

在上述产品中,用友在任务型对话(包括槽位识别、意图理解、指代消歧、实体识别等)以及搜索、问答(包括检索增强、Query 分析、关键词/摘要抽取、关键词召回、向量召回、语义相关性、多级排序、关联推荐等)中采用了 NLP 技术,并在搜索问答场景中的多类型资源召回,任务型对话中的意图/触发语句识别、以及其他语义相关性计算场景中进行了向量化处理。

采用第五代英特尔® 至强® 可扩展处理器加速 NLP 向量化处理

向量化是一种并行计算技术,该技术能够根据一定的规则,将多个数据组合为单一的向量,成为一组属性的集合,有助于提高程序的执行效率,也能够用于描述特定目标的不同特征属性,是 AI 等应用的重要基础数据。在 NLP 应用中,有大量的流程都需要进行向量化处理。

向量化在词嵌入等技术中得到广泛应用。词嵌入是 NLP 中的一种表示技术,它将词语或短语从词汇表映射到向量的实数空间中,通过训练模型,使其学会预测一个词在给定上下文中的出现概率,从而得到这个词的向量表示,词义的语义信息就能以数值的形式表达出来。在用友 NLP 业务的向量化处理中,其会根据不同任务进行模型结构优化和策略设计,采用企业内部数据/行业数据进行预训练及监督微调,随后进行模型加速、性能优化。

向量数据是 NLP 应用重要的基础数据,由于 NLP 业务规模的快速增长,目前平台的特征向量规模可能会达到亿级别,这对于向量数据的吞吐能力提出了苛刻要求。

第五代英特尔® 至强® 可扩展处理器有助于改善向量的吞吐性能。第五代英特尔® 至强® 可扩展处理器拥有更可靠的性能,更出色的能效。它在运行各种工作负载时均可实现显著的每瓦性能增益,在 AI、数据中心、网络和科学计算的性能和总体拥有成本 (TCO) 方面亦有更出色的表现。相较上一代产品,第五代英特尔® 至强® 可扩展处理器可在相同功耗范围内提供更高的算力和更快的内存。此外,它与上一代产品的软件和平台兼容,因此部署新系统时可大大减少测试和验证工作。
 

  • 21% 整体性能提升1
  • 42% 推理性能提升2
  • 16% 内存速度提升3
  • 2.7 倍三级缓存提升4
  • 10 倍每瓦性能提升5

3. 第五代英特尔® 至强® 可扩展处理器具备强大性能

用友的测试数据如图 4 所示,相较于第四代英特尔® 至强® 可扩展处理器,第五代英特尔® 至强® 可扩展处理器在 NLP (YonMaster Dialogue Bot) 工作负载中实现了 1.2 倍的代际吞吐性能提升6

4. 用友 NLP 应用在基于不同代英特尔® 至强® 可扩展处理器上的吞吐性能比较

收益
 

  • 提升 NLP 应用的性能,显著化解 NLP 中频繁的向量化操作所带来的吞吐性能挑战,从而助力上层的智友对话机器人、智能大搜等应用的高效运行。
  • 提升了服务器的单位性能密度,在同等性能的水平下,降低了服务器规模的扩展需求,有助于降低 TCO。
  • 该应用实践为用友 YonBIP 用户的硬件选型提供参考,用户可以根据实际的性能需求,选择更适用的硬件配置。

展望

在第五代英特尔® 至强® 可扩展处理器的支撑下,用友 iuap 智能中台提升了 NLP 应用的向量吞吐性能,支撑了整体平台的优化升级。面向未来的发展需求,用友还将在任务型对话中进行意图槽位识别算法升级、Query 改写模型与大型语言模型 (LLM) 结合;在搜索问答上持续优化检索增强 (RAG) 技术,开展垂域微调、多模态问答等。用友还将与英特尔进行进一步合作,推动 NLP 的性能优化、模型加速。

面向新一轮商业创新的大潮,用友与英特尔将聚合企业服务生态圈,为客户提供基于新一代数智技术、真正云原生技术架构、创新应用架构的平台和应用服务,提供随需而用的企业云服务和无处不在的数智价值,助力企业实现业务运营和管理的数智化升级与转型。

关于用友
用友是全球领先的企业云服务与软件提供商。用友致力于用创想与技术推动商业和社会进步,通过构建和运行全球领先的商业创新平台 — 用友 BIP,服务企业数智化转型和商业创新,成就千万数智企业,让企业云服务随需而用,让数智价值无处不在,让商业创新如此便捷。用友在财务、人力、供应链、采购、制造、营销、研发、项目、资产、协同领域为客户提供数字化、智能化、高弹性、安全可信、平台化、生态化、全球化和社会化的企业云服务产品与解决方案。

关于英特尔
英特尔 (NASDAQ: INTC) 作为行业引领者,创造改变世界的技术,推动全球进步并让生活丰富多彩。在摩尔定律的启迪下,我们不断致力于推进半导体设计与制造,帮助我们的客户应对最重大的挑战。通过将智能融入云、网络、边缘和各种计算设备,我们释放数据潜能,助力商业和社会变得更美好。如需了解英特尔创新的更多信息,请访问英特尔中国新闻中心 newsroom.intel.cn 以及官方网站 intel.cn