人工智能就绪模型

判断组织利用人工智能创造商业价值的能力

下载文档

在英特尔,我们与许多研究人工智能 (AI) 解决方案的组织合作。图像识别、自然语言处理 (NLP) 和预测性维护崭露头角,成为引人关注的热点。有些企业是第一次接触这些人工智能应用案例,其他则在研究如何在成功迈出第一步后继续深化发展。

为了帮助处于人工智能之旅各个阶段的组织,英特尔创建了一种就绪模型,帮助决策者了解应该优先考虑哪些方面。我们基于我们与各种场景和垂直行业的客户往来的经验来构建此模型。例如,想要改进质量控制的制造公司,或是想要在算法交易中使用人工智能的金融服务机构。本白皮书将指导您如何判断组织利用人工智能创造商业价值的能力,并利用一系列问题,帮助您了解如何实施自我评估。

首先,我们可以根据组织处在人工智能之旅中的阶段将其分为三类——首次使用人工智能,还是正在纵向扩展,或者在扩大人工智能的使用范围。

了解您当前处在人工智能之旅的哪个阶段

有些组织刚刚开始接触人工智能

有些组织仍然不太熟悉应如何部署人工智能应用,例如图像识别、自然语言处理 (NLP) 和预测性维护。一般有三种常见场景:

• 已经拥有数据池的组织可通过利用人工智能获益。例如,一家与英特尔合作的太阳能发电厂会定期采集硬件的图像,以便找出损坏的地方。在此场景中,该组织希望了解,他们是否可采用一种图像识别算法来自动确认缺陷位置。在医疗健康行业也可以找到相似的场景:评估放射诊断图表或其他医疗数据。

• 组织在传统环境中运行工作负载,希望使用人工智能或机器学习来探索进一步优化的机会。例如,一些已经熟悉数据分析的企业,或者运行物理算法的研究机构。类似地,在机械、材料、货物或加工中使用固定模式进行缺陷检测的制造商可能也意识到了机器学习的优势。

• 有些组织一直在研究人工智能的潜力——例如,在客户服务场景中使用 NLP,或者零售商使用图像识别来优化对店内客户的行为的分析。在有些案例中,人工智能最擅长解决的问题可能并不明显——例如一些幕后应用案例,如预测性库存管理。

对于这些组织,他们可能难以预先描绘人工智能的优势,且其数据也并非一直可用,或者数据的呈现形式并不适合人工智能。

其他组织已准备好纵向扩展人工智能这些组织已经研究过人工智能的潜力,知道在哪些地方适合使用人工智能,且已成功实施过测试模型。具体可以归类为以下几种场景:

• 组织可能已经开展了概念验证,在工作站或单台设备上运行人工智能解决方案。他们面临的挑战在于,需要将解决方案迁移到数据中心环境中,以便将其转移到生产环境中。例如:在运营中运用预测性维护洞察。

• 组织已经“自行”开发出解决方案,现在想要使用行业标准的基础设施和/或软件。不管是硬件、软件还是二者兼有,组织面临的挑战在于向一个(短期内)并不会产出理想结果的架构迁移。

虽然这些组织在人工智能之旅中处于更靠前的位置,但他们可能仍然缺乏在“纵向扩展”人工智能方面所需的技能,难以依靠相对简单的软件和硬件配置推广到少数工程师以外的用户群。此外,迁移至多节点解决方案也需要解决一个现实问题:人工智能并不是按线性扩展。例如,尽管单节点配置每秒可以处理数百张图像,但迁移至 50 台处理器并不能将此性能提高 50 倍。如果需要“大范围”使用,而非一次性采样,数据源也可能成为瓶颈。

其他组织正在广泛实施人工智能

第三类组织已在某种程度上使用机器学习和人工智能,并希望扩展到更广泛的应用范围。通常包含以下三种场景:

• 组织可能已经在业务部门成功使用人工智能,现在希望扩展应用范围。例如,一家公司可能在生产中采用图像识别来进行质量控制,现在想要在呼叫中心中部署 NLP。

• 组织已成功利用人工智能来学习和解析数据,现在希望扩展到基于推理的维护和模型更新中去。他们可能还希望利用人工智能的成果来推动自动化,例如,使用库存数据来推动备品备件的库存管理、计划和采购。从基础设施的角度来看,这些组织可能还希望改善功耗或性能,并降低总体拥有成本 (TCO)。

在这些场景中,他们面临的挑战在于:要确保平台能够适用于多个应用案例,并按要求及各案例之间的资源需求波动来管理资源。

三种人工智能就绪类型

虽然组织可能处于人工智能之旅的不同阶段,但他们进入下一个阶段或继续获得成功的历程则取决于是否具备合适的技能和资源、基础设施和技术、以及流程和模型。

我们还可以从以下方面考虑就绪性:

• 基础——实施人工智能的前提是具备合适的基础设施和接口

• 运营——合适的管理和治理机制是决定人工智能解决方案可持续性的关键

• 转型——一个组织最大限度地发挥人工智能价值的能力

基础就绪是第一步,但人工智能能否取得成功则由运营就绪状况和转型就绪能力(企业对人工智能的接受程度)决定。这催生了新的要求,而这些要求又进一步推动了人工智能部署的基础建设。

基础准备就绪

实施人工智能的前提是具备合适的基础设施和接口。虽然这一点合情合理,但是在没有对潜在场景进行测试和评估之前,并不能明确到底有哪些需求。同时,组织可能缺乏相应的技能和专业知识。鉴于这些因素,组织还需考虑下列问题。

基础设施平台

许多组织都想知道,现有的数据中心设施是否能用于人工智能工作负载。虽然概念验证给出的答案可能是肯定的,但有些设施并不适合用在机器学习和人工智能所需的大规模可扩展流程中。根据具体的场景,人工智能所需的数据流可能严重占用您的网络带宽。有些人工智能解决方案可规划在非高峰期,以最大化吞吐量。与此同时,其他时间关键型场景则可能给网络带来严重的负担,比如当数据与预测性维护功能链接起来的时候。

如需进一步了解计算、存储和网络领域对人工智能平台的要求,请查看我们关于创建概念验证的白皮书

云资源

将基于云的服务作为人工智能的基础,特别是在图像和自然语言处理等领域。云具备门槛低、按使用量付费等优势,因此特别适合用于训练和测试。当组织希望纵向扩展人工智能的使用范围时,他们需要检查他们基于云的资源是否仍然适用。云服务提供商可能提供分等级的价格和服务级别协议,这可能是根据运行工作负载的底层计算基础设施来定义的。决策者需要力争在性能和成本之间达成平衡,可能需要针对每个工作负载逐个完成。

数据来源

关键的数据来源必须是可使用且可访问的。决策者和工程师需要确保用于深度学习算法的数据有适当的数量和质量,无论数据是来自于内部还是外部:如果是后者,则可能需要安排与第三方之间达成一致。

软件包

如今,各种各样的推理、机器学习和人工智能软件包可供您选择,每种都有各自的优缺点。开源软件包,例如 TensorFlow* 和 BigDL 与 英特尔® Saffron™ 软件和基于云的服务等商业解决方案配合使用。所有这些都需要与用于数据管理、可视化等的工具集成:每个应用案例都需要软件架构为手头的工作选择最合适的工具,这可能需要考虑到下游系统、定制、优化和其他改动。

基于英特尔® 至强® 处理器的人工智能软件优化

为了让数据科学家和开发人员能够在工作中使用他们喜欢的框架,英特尔对许多广受欢迎的人工智能框架的深度学习库实施了优化,其中包括 TensorFlow*、Theano* 和 MXNet*。

适用于深度神经网络的英特尔® 数学核心函数库(英特尔® MKL-DNN)在这些框架的底层运行,充当加速器,采用特定的数学函数来支持深度学习,在搭载英特尔® 高级矢量扩展指令集 2(英特尔® AVX-2)和英特尔® 高级矢量扩展指令集 512(英特尔® AVX-512)的 x86 上实施优化。作为开源项目,它将继续紧跟所有大型框架的新趋势。

另外,BigDL 是面向 Spark* 的分布式深度学习库,可在现有的 Spark 或 ApacheHadoop* 集群上直接运行。BigDL 由英特尔开发,允许将预先训练的 Torch* 模型载入 Spark 框架,并且有效地进行横向扩展,以针对大规模数据实施数据分析。

有关这两种解决方案的更多信息,请查看我们的信息图:人工智能概念验证解析信息图

运营准备就绪

合适的管理和治理机制是决定人工智能解决方案可持续性的关键。IT 决策者可以检查一些领域,以确保人工智能部署已做好运营准备。我们建议检查以下几点。

敏捷交付

最佳实践模型,例如开发运维,以及其他敏捷方法能为处于人工智能之旅各个阶段的组织提供显著帮助——在早期阶段,持续开发和交付能应对快速变化的需求、不明确的结果,满足重复检查、评估和测试的需求。对于更高级的使用,持续改进可能推动数据源和模型发生变化。

运营管理

开发运维的“运维”面也需要采用与高效的服务交付有关的标准(用于作为人工智能基础的平台),还需要对所有内部和外部数据源实施有效管理。除此之外,还应存在衡量人工智能有效性的标准。例如,获得的洞察或自动化成果是否能够产生预期的价值?

技能和专业知识

对于处于人工智能之旅早期阶段的组织而言,缺乏技能是他们经常面临的一个挑战。起初的时候,您可能需要从外界引入相应的技术人才,尤其是针对特定解决方案时架构师,他们可以调整概念验证解决方案;但是,在 IT 和业务部门中培养内部技术人才对组织而言是非常有利的。若在没有内部技术人才的情况下执行概念验证以外的操作,会给人工智能项目增加不必要的风险,尤其是在检查和评估阶段。

网络安全

鉴于人工智能和自动化之间的关系能够最小化人为干预,因此应将监管、数据的网络安全、基础设施和算法视为最优先项。潜在的安全风险来自于输入到人工智能中的数据出现污染、模型篡改,或者对所得洞察未经授权的访问。

管理、合规和风险

人工智能和管理之间的关系错综复杂,且涵盖多个方面。当组织处于人工智能之旅的早期阶段时,所面临的管理问题与其他以数据为中心的 IT 项目并无差别,主要是项目是否能够交付、客户隐私是否受到保护等。随着其使用范围扩大,人工智能会涉及更多问题:例如,在预测性计划和维护中,就备品备件采购(如果存在)而言,需要多大程度的人为参与?

从数据到洞察到创新再到收益:英特尔® 至强® 可扩展处理器助您一臂之力

英特尔® 至强® 处理器是数据中心的核心,运行大部分最重要、最具创新性的工作负载。虽然您数据中心中现有的英特尔® 架构允许您开始进行机器学习和深度学习,但新的英特尔® 至强® 可扩展处理器可以为人工智能提供更敏捷的英特尔平台,有助于将您的人工智能带入更高的阶段。至于实施深度学习训练和推理所需的计算性能,与前一代产品的深度学习训练和推理性能相比,英特尔® 至强® 可扩展处理器要高出 2.2 倍。此外,受益于其他软件的优化——例如,TensorFlow*、Theano* 和 Torch*——其性能要比未经优化、 3 年用龄的深度学习服务器的性能高 113 倍,因而能为人工智能工作负载提供坚实的基础设施1。前代产品拥有 4 个内存通道,而它拥有 6 个,因此可为内存密集型工作负载大幅提升内存带宽和容量。

转型准备就绪

第三个(可能也是最重要的)就绪问题就是:组织能否从人工智能中获取最大价值。无论人工智能是被用于模式识别、形成洞察或流程自动化,一般都会产生以下影响中的一种:

• 有利于高管或部门管理人员做出更好的决策

• 自动完成部分业务流程,或推动实现自动响应

无论是哪种情况,人工智能都会给日常业务运营带来重大影响,而企业也需要能够接受随之而来的改变。

战略领导

虽说不一定要让董事会将数字技术,尤其是人工智能,视作业务增长的推动因素,但是,一旦树立了正确的理念,这无疑将有助于从组织的最高层开始推动交付。如果将人工智能视为战略优势的来源,那么也将据此设定优先级和预算。

商机

同样地,如果能够开启新的业务增长机会、形成与客户交互的新方式,或者采用新型的运营流程,那么人工智能获得成功的机会也会增加。如果情况是这样,那么组织应该自行调整结构,以便利用在人工智能推动下可能存在的商机。务必要明确现有的以及期望的运营模式将如何通过自动化或功能增强来发挥人工智能的成果和优势。

业务案例说明

无论施行哪种业务变革,都要清楚了解这种变革将会带来哪些优势。根据英特尔的经验,处于人工智能之旅早期阶段的组织更加关注总体拥有成本:也就是人工智能能否以适当的成本,达到预期的结果(并通过自动化节省资金)。发展程度较高的项目希望提高人工智能的性能,发展程度最高的项目则希望能够从业务角度看到投资回报,例如,可以省下多少时间用来执行其他任务。业务案例应该清楚给出衡量成功程度的成本标准。

获得业务部门的认可

解决方案应根据业务需求实施调整,并融入一线员工和受影响人员的日常工作。要想获得业务部门的认可并非易事,当工作角色和职责因实施人工智能而发生变化时更是如此。

结论:从现在开始,为实现人工智能成功做准备

无论您的组织是刚开始走上人工智能之旅,还是已经有了某种程度的发展,您都可以问自己一些问题,借此评估您所处的位置,并根据得出的结论进一步做好准备。以下是几个有助于您实施规划的问题:

首次使用人工智能

• 是否明确指出了需要利用人工智能解决的场景、应用案例或问题?

• 是否依据人工智能可在哪些方面发挥最大的业务价值设置了优先级?

• 所规划的基础设施架构是否明晰、合适?

• 是否所有所需的数据源都简单易懂且可以访问?

• 您所选择的软件包能否提供端到端人工智能解决方案?

• 是否具备足够的技能和资源(无论来自内部或者外部)?

• 是否设定了训练目标和学习时间?

• 端到端解决方案的总体拥有成本是否明确,且已获得批准?

纵向扩展人工智能的使用范围

• 所规划的解决方案能否超越初始测试和评估的规模,实现扩展?

• 已明确定义的业务案例是否得到了业务部门的确认?

• 是否具备足够的直接资源,且已分配和预留了时间?

• 网络带宽是否足以确保及时交付大规模数据?

• 是否采用了涉及人工智能交付的运营管理流程?

• 架构是否与行业标准和最佳实践保持一致?

• 是否实施了网络安全风险评估,并据此采取行动?

• 是否制定了切实的部署计划,并做了相应的沟通?

横向扩展人工智能的使用范围

• 是否有团队负责监管基于人工智能的持续改进情况?

• 是否研究和明确了组织所具备的更广泛的人工智能潜能?

• 是否根据最佳敏捷实践开发和部署了人工智能解决方案?

• 是否有监测人工智能解决方案在实际业务中效果的相关措施?

• 关于人工智能的架构,是以平台方式提供,还是作为一次性解决方案提供?

• 业务部门是否完全了解人工智能将如何影响其流程?

• 是否明确了解人工智能解决方案的管理需求?

• 人工智能是否被视为基于 IT 业务战略的核心?

通过解决这些问题,您将提高获得成功的可能性,并且提高组织对基于人工智能的解决方案的接受程度。一切从头开始可能有些不切实际:相反,您应该在了解人工智能的优势之后,开始构建技能和专业知识。

最重要的是,明确了解您需要解决的问题。清楚阐明问题,然后致力于找到切实可行的解决方案。无论是流程自动化还是提供洞察,人工智能的最终目标都是让您和您的组织能够腾出更多时间去推动创新和增长。

从现有的基于英特尔® 至强® 处理器的基础设施中获取最大价值

利用现有的数据中心基础设施,您有机会以灵活、通用的基础来证明人工智能的商业价值。

英特尔® 至强® 处理器在现有的分析流水线中使用一致的基础设施和编程模式,且满足人工智能模型对于大容量内存的需求。前文提到的软件优化意味着基于英特尔® 至强® 处理器的基础设施可以继续为组织的人工智能之旅(从实验到概念验证再到生产)提供支持,具体由工作负载决定。

有关这两种解决方案的更多信息,请查看我们的信息图:人工智能概念验证解析信息图

了解更多信息

欲详细了解英特尔® 人工智能产品组合及其如何为您的人工智能之旅提供支持,请访问:ai.intel.com

有关英特尔的性能优化型机器学习和深度学习库及框架,请访问此处:https://software.intel.com/zh-cn/ai-academy

英特尔技术特性和优势取决于系统配置,并可能需要支持的硬件、软件或服务得以激活。产品性能会基于系统配置有所变化。没有计算机系统是绝对安全的。更多信息,请见 intel.cn,或从原始设备制造商或零售商处获得更多信息。

性能测试中使用的软件和工作负荷可能仅在英特尔微处理器上进行了性能优化。诸如 SYSmark 和 MobileMark 等测试均系基于特定计算机系统、硬件、软件、操作系统及功能。上述任何要素的变动都有可能导致测试结果的变化。请参考其他信息及性能测试(包括结合其他产品使用时的运行性能)以对目标产品进行全面评估。有关更多完整信息,请访问 www.intel.cn/content/www/cn/zh/benchmarks/benchmark.html

基准性能测试结果均在实施近期软件补丁和固件更新(旨在解决称为 “Spectre” 和 “Meltdown” 所造成的漏洞)之前完成。实施更新后,这些结果可能不再适用于您的设备或系统。

此处提供的所有信息可在不通知的情况下随时发生变更。关于英特尔最新的产品规格和路线图,请联系您的英特尔代表。

英特尔、至强、Saffron、英特尔标识是英特尔公司在美国和/或其他国家的商标。

* 其他的名称和品牌可能是其他所有者的资产。

© 英特尔公司版权所有

人工智能,从至强® 开始

人工智能 (AI) 可以帮助您的企业将数据价值发挥到极致。快来一探究竟,看运行在 CPU 架构上的 AI 如何为您做得更多。

了解更多

如何开始人工智能之旅: 技术路径不只一条,您的选择也不只一个

在 AI 之旅的起点上,无论是传统推理、机器学习、深度学习,亦或是它们的融合,都是可选项。

了解更多

如何开始人工智能之旅: 改弦更张不合算,别忽视既有平台

无论是在机房,还是选择公有云服务,企业要充分评估既有的数据存储、处理和分析平台,基于或借助它构建和部署符合自身需求的 AI 应用。

了解更多

如何开始人工智能之旅: 你已拥有 “原力”,只待释放潜能

企业既有 IT 基础设施在 AI 应用上的潜能很强,随着 CPU 在流行深度学习框架上的持续优化和提供更多的软件工具,只需对它稍做升级,即可充分释放潜能。

了解更多

产品和性能信息

1使用 FP32 Batch Size Caffe GoogleNet v1 256 AlexNet 256 实施推理。性能预估值是在实施近期针对 “Spectre” 和 “Meltdown” 漏洞的软件补丁和固件更新之前测得的。实施更新后,这些结果可能不再适用于您的设备或系统。性能测试中使用的软件和工作负荷可能仅在英特尔微处理器上进行了性能优化。诸如 SYSmark 和 MobileMark 等测试均系基于特定计算机系统、硬件、软件、操作系统及功能。上述任何要素的变动都有可能导致测试结果的变化。请参考其他信息及性能测试(包括结合其他产品使用时的运行性能)以对目标产品进行全面评估。有关更多完整信息,请访问 https://www.intel.cn/content/www/cn/zh/benchmarks/intel-product-performance.html 来源:英特尔截至 2017 年 6 月的测量结果 优化声明:英特尔的编译器针对非英特尔微处理器的优化程度可能与英特尔微处理器相同(或不同)。这些优化包括 SSE2,SSE3 和 SSSE3 指令集以及其他优化。对于非英特尔微处理器上的任何优化是否存在、其功能或效力,英特尔不做任何保证。本产品中取决于微处理器的优化是针对英特尔微处理器。不具体针对英特尔微架构的特定优化为英特尔微处理器保留。请参考适用的产品用户与参考指南,获取有关本声明中具体指令集的更多信息。推理吞吐量的配置 处理器:双路英特尔(R) 至强(R) 铂金 8180 CPU,2.50GHz / 28 内核,启用超线程技术,启用睿频加速技术,总内存 376.46GB(12 插槽 / 32 GB / 2666 MHz)。CentOS Linux-7.3.1611-内核,固态盘 sda RS3WC080 HDD 744.1GB,sdb RS3WC080 HDD 1.5TB,sdc RS3WC080 HDD 5.5TB,深度学习框架 caffe 版本:f6d01efbe93f70726ea3796a4b89c612365a6341 拓扑:googlenet_v1 BIOS:SE5C620.86B.00.01.0004.071220170215 MKLDNN:版本:ae00102be506ed0fe2099c6557df2aa88ad57ec1 NoDataLayer。测量结果:1190 张图像/秒,所对比的平台配置:双路英特尔® 至强® CPU E5-2699 v3(2.30GHz, 18 核),启用超线程 (HT),启用睿频,通过 intel_pstate 驱动程序将扩展调节器设定为 “performance”,256GB DDR4-2133 ECC RAM。CentOS Linux 版本 7.3.1611 (Core),Linux 内核 3.10.0-514.el7.x86_64。操作系统驱动器:Seagate* Enterprise ST2000NX0253 2 TB 2.5 英寸内置硬盘。性能评测标准基于:环境变量:KMP_AFFINITY=granularity=fine,compact,1,0‘,OMP_NUM_THREADS=36,CPU 频率设置为 cpupower frequency-set -d 2.3G -u 2.3G -g performance。深度学习框架:英特尔® Caffe:(http://github.com/intel/caffe/),修订版 b0ef3236528a2c7d2988f249d347d5fdae831236。推理能力的测量基于 “caffe time--forward_only” 命令,训练能力的测量基于 “caffe time” 命令。对于 “ConvNet” 拓扑,使用虚拟数据集。对于其他拓扑,数据在本地存储,并且在训练之前在内存中缓存。拓扑规格来源于 https://github.com/intel/caffe/tree/master/models/intel_optimized_models(GoogLeNet、AlexNet 和 ResNet-50)、https://github.com/intel/caffe/tree/master/models/default_vgg_19(VGG-19)和 https://github.com/soumith/convnet-benchmarks/tree/master/caffe/imagenet_winners(ConvNet 基准测试;更新文件以使用最新的 Caffe prototxt 格式,但功能等效)。GCC 4.8.5,MKLML 版本 2017.0.2.20170110。BVLC-Caffe:https://github.com/BVLC/caffe,推理和训练能力测量基于 “caffe time” 命令。对于“ConvNet”  拓扑,使用虚拟数据集。对于其他拓扑,数据在本地存储,并且在训练之前在内存中缓存。BVLC Caffe(http://github.com/BVLC/caffe),修订版 91b09280f5233cafc62954c98ce8bc4c204e7475(提交日期 5/14/2017)。BLAS:atlas 版本3.10.1。训练吞吐量的配置:处理器:双路英特尔(R) 至强(R) 铂金 8180 CPU,2.50GHz / 28 内核,启用超线程技术,启用睿频加速技术,总内存 376.28GB(12 插槽 / 32 GB / 2666 MHz)。CentOS Linux-7.3.1611-内核,固态盘 sda RS3WC080 HDD 744.1GB,sdb RS3WC080 HDD 1.5TB,sdcRS3WC080 HDD 5.5TB,深度学习框架 caffe 版本:f6d01efbe93f70726ea3796a4b89c612365a6341 拓扑:alexnet BIOS:SE5C620.86B.00.01.0009.101920170742 MKLDNN:版本:ae00102be506ed0fe2099c6557df2aa88ad57ec1 NoDataLayer。测量结果:1023 张图像/秒,所对比的平台配置:双路英特尔® 至强® CPU E5-2699 v3(2.30GHz, 18 核),启用超线程 (HT),启用睿频,通过 intel_pstate 驱动程序将扩展调节器设定为 “performance”,256GB DDR4-2133 ECC RAM。CentOS Linux 版本 7.3.1611 (Core),Linux 内核 3.10.0-514.el7.x86_64。操作系统驱动器:Seagate* Enterprise ST2000NX0253 2 TB 2.5 英寸内置硬盘。性能评测标准基于:环境变量:KMP_AFFINITY=granularity=fine, compact,1,0‘,OMP_NUM_THREADS=36,CPU 频率设置为 cpupower frequency-set -d 2.3G -u 2.3G -g performance。深度学习框架:英特尔® Caffe:(http://github.com/intel/caffe/),修订版 b0ef3236528a2c7d2988f249d347d5fdae831236。推理能力的测量基于 “caffe time--forward_only” 命令,训练能力的测量基于 “caffe time” 命令。对于 “ConvNet” 拓扑,使用虚拟数据集。对于其他拓扑,数据在本地存储,并且在训练之前在内存中缓存。拓扑规格来源于 https://github.com/intel/caffe/tree/master/models/intel_optimized_models(GoogLeNet、AlexNet 和 ResNet-50)、https://github.com/intel/caffe/tree/master/models/default_vgg_19(VGG-19)和 https://github.com/soumith/convnet-benchmarks/tree/master/caffe/imagenet_winners(ConvNet 基准测试;更新文件以使用最新的 Caffe prototxt 格式,但功能等效)。GCC 4.8.5,MKLML 版本 2017.0.2.20170110。BVLC-Caffe:https://github.com/BVLC/caffe,推理和训练能力测量基于 “caffe time” 命令。对于“ConvNet”  拓扑,使用虚拟数据集。对于其他拓扑,数据在本地存储,并且在训练之前在内存中缓存。BVLC Caffe(http://github.com/BVLC/caffe),修订版 91b09280f5233cafc62954c98ce8bc4c204e7475(提交日期 5/14/2017)。BLAS:atlas 版本3.10.1。