又是一年 618。
每到电商销售旺季,都会迎来雪片一样的订单,这既考验电商平台承担的速度和效率,更是对物流公司的分拣和运送能力的检验。互联网让用户变得更为挑剔,用户很难接受狂欢之后的等待,优质的物流则是保证用户体验的第一环。
今年 618 期间,上海区域 200 多家韵达网点全部开启了“预售极速达”服务,旨在将预售订单第一时间送至客户手中。在这项服务的背后,是 AI、大数据和 IT 系统结合的力量。
一、 AI 让分拣压力化为无形
物流行业,通常有仓储和分拣两个关键环节,而在物流系统中,分拣是最为繁琐,用时最长的环节。
用户在电商平台上下单,由系统分拣模块,将货物根据订单地址进行区分,分配至不同地点的仓库。订单抵达仓库之后,即开始分拣。接着出库抵达下一级分拨中心或者中转站,最后进入配送。
在电商销售旺季,处于流程前端的下单量会短时间内激增,唯有提高分拣流程的效率,才能提升整个物流系统的效率,为用户提供优质的服务。一些优秀的物流公司,正在求助于 AI,在分拣流程的几个关键环节以智能化的手段,获得更高的分拣效率。
为了应对电商购物节期间的业务量洪峰。韵达在分拣中心实施了网格仓策略,借助由视觉人工智能 (AI) 驱动的智能共配分拣系统对快件进行自动分拣。
通常的智能分拣中心,现场的人力并不多,核心业务流程都依靠系统控制,流水线的运行速度也飞快,会有一种看到水在流动的视觉感受,就像是力与美的结合。
在这种“美感”的反面,则是分拣线面临的准确度与低时延的压力。分拣线会对快件面单上的信息进行三段码 OCR (Optical Character Recognition) 检测,由于识别的结果决定着快件在分拣线上的去向,因此该步骤对分拣效率至关重要,对系统的识别准确度和时延有较高要求。
一旦识别出现错误,就会造成分拣线回流,即快件需重新再过分拣线或需要人工分拣;而当错误率较高时,更会加重网点的操作压力。故而,韵达提出系统识别的准确度须达到 95% 以上。另一方面,系统时延与分拣线传输速度息息相关,检测算法的时延会直接影响分拣传输的效率,过慢就会造成快件积压,进而影响分拣速度和派送时效,韵达经过评估后发现智能分拣线系统的时延必须要小于 130ms 才能满足他们对高效率的需求。
为了解决这些难题,韵达选择了英特尔的解决方案,基于英特尔® 数据中心 GPU Flex 系列 170 和英特尔® 分发版 OpenVINO™ 工具套件来优化其三段码 OCR 检测系统和分拨视频分析平台性能。
为验证方案性能,韵达进行了三段码 OCR 测试和 TSM (Temporal Shift Module) 测试。在三段码 OCR 测试中,共对 2450 张图片进行了识别,测试结果显示平均运行时间为 114ms,很好地满足了韵达对低时延的需求;准确度能够达到 97%-98%,也优于韵达 95% 的预期基准。
在 TSM 测试中,选用了 1200 个视频并分不同实例和批量大小做了测试,测试结果如图所示。
综合测试和网店测试结果,韵达的视觉 AI 方案从算力、时延、准确度、并发能力、稳定性和散热能力等多个方面都能很好地满足韵达的需求,并带来了如下企业优势:
第一,提升业务效率并降低成本:智能分拣系统的部署显著提升了分拣线效率,进而提升了派送效率和派送时效;此外,高效的智能分拣系统还帮助韵达实现了人力和成本节约。
第二,优化业务管理和决策:英特尔® 数据中心 GPU Flex 系列 170 带来的高算力让韵达实现了更高效的分拨视频流分析,可帮助韵达在跨年度/跨季度预测、合理定价、网点时效提升和奖惩制定等方面做出优化。
二、 每个物流场景,都少不了英特尔的身影
实际上,这仅仅只是韵达基于英特尔 GPU 的解决方案,其实韵达与英特尔和合作远不止于此。
早在 2018 年,韵达就与英特尔展了全方位的技术交流与协作,英特尔的至强®️ 可扩展处理器及其他一系列软硬件产品技术在“大小件测量”、“数据中心异常检测”以及“件量预测”等多个关键环节上为韵达构建起高效的 AI 应用底座。
在 2020 年,为了利用 AI 视觉技术解决在物流运输、分拣、派送等过程中遇到的难题,韵达也采用了英特尔 CPU 及其他软硬件组合,完成了智慧视觉解决方案的优化,实现了分转中心智能数据处理,但也同时遭遇了新的技术挑战:
一方面,由于物流场景的复杂性与多变性,物流行业有着爆仓识别、违规操作分析、车辆到站识别、装载率识别等非常复杂的场景,一个场景甚至会出现几十种不同的情况,未经优化的算法可能会出现效率与精度问题,影响设计目标的实现。
另一方面,因为视频推理等人工智能负载对于硬件有着严苛的需求,传统的硬件在边缘侧难以满足视频推理在性能、精度、功耗等方面的需求,同时,专用的硬件方案也有成本昂贵、开发与部署门槛高等问题。
当然,从深度学习算法自身来看,面向图像识别的深度学习模型也常会存在解释性差的问题,模型复杂度高、优化困难,计算强度高、对于算力有着较高要求,需要进一步实现算法优化。
在此项目中,英特尔和韵达一起构建了基于至强® 可扩展处理器和酷睿™ 处理器的边缘计算解决方案,将工作负载转移到网络边缘,不仅降低了网络负载与人工智能推理延迟,还切实降低了人工智能基础设施平台的采购成本,以及高带宽网络的部署与运维成本。
值得一提的是,除了硬件之外,韵达还通过英特尔® SVET 开源套件快速搭建了视频拉流、解码、抓图编码分发业务,同时利用 OpenVINO™️ 工具套件,在英特尔平台上优化了视觉算法,提升了性能。
不止韵达,也有其他物流公司选择了英特尔基于异构的基础设施,利用 XPU 实现 AI 推理加速,同时借英特尔® 分发版 OpenVINO™ 工具套件和英特尔® oneAPI 工具套件等简化开发与运维,实现应用跨 XPU 的无缝切换。有效监测园区内是否存在攀爬传送带等危险作业,踩踏、暴力分拣等违规作业,以及未戴安全帽等着装安全问题。
英特尔还将以更多、更高性能的专用加速器,持续为物流行业及合作伙伴带来更多场景的优化方案。
三、 AI 驱动,让每个包裹都能准时送达
通过以上案例,我们也发现不同物流场景中都面临着相似的难题:比如模型开发与维护难度大,计算强度高,再比如专用的硬件方案也有着成本昂贵、开发与部署门槛高等问题。
走向 AI 驱动的智慧物流,要跨越这些难题,英特尔显然已经给出了自己的答案:
那就是更加全面、异构化的产品布局,用更加完备的软硬件产品组合为全开发链路护航。
- 通用计算芯片:如至强®️ 可扩展处理器,其部署门槛最低,可以充分利用企业现有的 IT 基础设施;
- 通用加速芯片:英特尔®️ 数据中心 GPU Flex 系列主攻视觉类的 AI 推理加速,而数据中心 GPU Max 系列包含有超过 1000 亿晶体管,可为 AI 模型的高效训练提供强有力的支持,同时其还能兼顾科学计算,加速多个架构中的 SC 和 AI 工作负载;
- 专用加速器:Habana®️ Gaudi2®️ 的发布也已近在眼前,据悉 7 月它就会正式与用户们见面,并且在 6 月 27 日刚刚发布的 MLPerf 新一代测试报中,它已经有了先声夺人的表现——不论是大家非常熟悉的 BERT、ResNet、Unet 模型,还是最近半年异军突起的大语言模型 GPT-3,Gaudi2️® 都有非常靓眼的表现。
当然,跨异构 XPU 的切换,少不了软件的支持。借助 OpenVINO™️ 工具套件和 oneAPI 工具套件等可以帮助用户简化 AI 应用开发并实现跨 XPU 的无缝切换。用户可以根据自身工作负载的需求,选择更适合的芯片的运行。
四、 小结
物流业是支撑经济社会发展的基础性产业。在数字经济时代,物流不仅是单行道,还促进了新的零售业和新的制造,提高了传统的库存周转率,构建了灵活的供应链。
随着物流业的规模不断扩大,传统物流的运营模式受到挑战,急需向智能化转型升级。以数字化技术,尤其是 AI 技术的赋能,物流行业走向智慧化,精细化,高效化是大势所趋。
但 AI 应用的开发和优化并非易事,尤其是在异构计算兴起的今天更是变得越来越复杂。英特尔拥有强大且专业的技术团队,完备的异构硬件产品布局,易用的软件工具组合,可以为物流乃至更多行业 AI 应用的开发、部署、落地应用提供支持。
让 AI 驱动物流行业智能化转型,让每个包裹都能准时送达。