如何开始人工智能之旅

改弦更张不合算,别忽视既有平台

 

 

 

下载文档

在人工智能(AI)大潮席卷之下,许多企业正在考虑的,已不再是“是否要部署 AI”,而是“应该如何构建或部署AI”。要解答这个问题,我们不妨先回过头来,重新审视一下 AI 的三大支柱——海量数据、算力和 AI 算法,看看它们之中哪一个才是企业推进 AI 时最重要的先决条件。

先看算力,高算力确实是发展 AI 不可或缺的条件,但在计算技术日新月异的今天,它早已不是仅供少数机构或企业享用的资源;再说算法,在互联网行业主导 AI 复兴的时代,开放和免费已是主旋律;最后看数据,似乎只有它,才是企业需要通过长期投入和积累来获取的宝贵资产。

图一:训练使用的数据集越大,质量越好,AI 应用的受益就越多

这样一看,好像数据才是 AI 最核心的要素?是的!许多数据科学家,其实就是这样看待数据在 AI 中的价值,并将 AI 应用视为企业现有数据处理和分析工具链条上的补足或智能化升级的。毕竟 AI 的目标,就是要让计算机系统演进成为像人脑一样的,可以自主学习和理解事物、处理问题并做出决策的信息处理机,如果没有大量信息(数据)的输入和训练,实现智能进化纯属空谈。

图二:高级数据分析就是有“AI 加成”的数据分析,也是多数企业 AI 应用中最常见的场景

确定了数据的“中枢”地位,企业启动 AI 应用构建的关键一步,也就呼之欲出——那就是别急着改弦更张,别忙着从零开始,而是要充分评估既有的数据存储、处理和分析平台,基于它,或借助它构建和部署符合自身需求的 AI 应用。

来自中国银联电子商务与电子支付国家工程实验室的另一个案例,验证了这种做法的收益——该实验室采用了基于 Cloudera CDH 和 Apache Spark 的计算集群来构建人工神经网络风控系统。英特尔开源的 BigDL 技术的导入,更是让实验室能开发自己的深度学习程序作为标准 Spark 程序,使用机器学习和评估模型对系统内海量历史数据进行快速分析、聚合和关联,进而帮助系统实时判断新出现的异常交易是否合法。

这一应用实例中的基础设施,同样是基于英特尔至强处理器,它也是目前大多数企业既有 IT 基础设施的“核芯”。选择在这个用户熟悉、信任的 CPU 架构,及其支持的既有数据应用的基础上构建 AI 应用,相比另起炉灶、另寻其他架构的方法,无疑用时更短、风险更低,加之有众多优化库、框架和工具的加持,它在机器学习和深度学习中的性能表现,也足以满足主流企业用户的期望。而且,至强在与 AI 相关的应用灵活性上,也有独到的优势。

图三:相比专用的 AI 硬件架构,企业在使用基于英特尔至强的既有 IT 基础设施构建 AI 应用时可获取的主要应用优势

这种灵活性,主要体现在基于至强的 IT 基础设施资源可以被灵活调配、复用,例如在业务繁忙忙时支持业务应用,在闲时则运行基于 AI 的数据分析。UCloud 就利用其云服务器中时常处于空闲状态的至强处理器 AVX 处理单元,辅以面向英特尔架构优化的 AI 框架,推出了性能出色的 AI 在线服务。AWS、微软 Azure 等众多海外公有云巨头也推出了基于至强平台的 AI 云服务,同样是看中了其应用灵活性带来的创收灵活性。

图四:UCloud AI 在线服务的系统架构和部署流程展示,从中不难看出它们对既有 IT 基础设施的倚重

至强的 AI 应用灵活性,还体现在它可部署的设备和位置上。GE 医疗集团近期就在一项实测中发现,使用经过英特尔深度学习开发工具包和 MKL-DNN 优化的代码,可在仅使用少数几个至强处理器内核的情况下,在 CT 影像分类上实现非常出色的推理性能,这意味着这类 AI 应用完全能在至强平台的支持下,部署到医疗机构内部,或者是它附近的边缘服务器上,并在未来有望直接移入医疗影像的采集设备中,以优化临床工作流程和提高诊断效率。

图五:GE 医疗集团的测试使用了至强平台以及针对这一平台优化的多种软件工具,这对于发挥既有基础设施在 AI 应用中的性能至关重要

人工智能,从至强® 开始

人工智能 (AI) 可以帮助您的企业将数据价值发挥到极致。快来一探究竟,看运行在 CPU 架构上的 AI 如何为您做得更多。

了解更多

如何开始人工智能之旅: 技术路径不只一条,您的选择也不只一个

在 AI 之旅的起点上,无论是传统推理、机器学习、深度学习,亦或是它们的融合,都是可选项。

了解更多

如何开始人工智能之旅: 你已拥有 “原力”,只待释放潜能

企业既有 IT 基础设施在 AI 应用上的潜能很强,随着 CPU 在流行深度学习框架上的持续优化和提供更多的软件工具,只需对它稍做升级,即可充分释放潜能。

了解更多