跳转至主要内容
支持知识库

与 CPU 相比,英特尔® 神经电脑棒 2 (英特尔® NCS2) 上的推理性能更慢

内容类型: 维护与性能   |   文章 ID: 000089522   |   上次审核日期: 2023 年 11 月 20 日

说明

  • 英特尔® 酷睿™ i7处理器用于运行带有 -m model.xml 的 benchmark_app.py,并生成随机输入
  • NCS2 的性能比 CPU 慢:

    对于神经电脑棒 2:
    [ INFO ] First inference took 33.88 ms
    [Step 11/11] Dumping statistics report
    Count: 2596 iterations
    Duration: 60141.63 ms
    Latency: 92.60 ms
    Throughput: 5525.09 FPS

    对于 CPU:
    [ INFO ] First inference took 17.07 ms
    [Step 11/11] Dumping statistics report
    Count: 148124 iterations
    Duration: 60001.79 ms
    Latency: 1.61 ms
    Throughput: 315988.43 FPS

解决方法

由于CPU具有更多的计算能力,因此与英特尔® NCS2相比,CPU的性能有望更好。

英特尔® NCS2是一种加速器设备,在某些情况下会有所帮助,尤其是在需要额外计算能力时。

此外,CPU 需要 FP32 模型格式,而英特尔® NCS2需要 FP16 模型格式。FP16 可能是量化误差,因为它是从全精度模型中挤出来的,使其更小。这将影响准确性和性能。

性能指的是模型在部署中的速度,有两个关键指标:延迟和吞吐量。

在OpenVINO™中,有两种方法可以提高性能:

开发过程中:训练后优化工具 (POT)、神经网络压缩框架 (NNCF)、模型优化器。

部署期间:调优推理参数和优化模型执行。

可以将这两种方法结合起来。

相关产品

本文适用于 4 产品。
英特尔® 至强融核™ 处理器软件 OpenVINO™ 工具包 性能函数库

停产的产品

英特尔® DevCloud for the Edge

免责声明

本页面上的内容是原始英文内容的人工翻译与计算机翻译的组合。我们提供此内容是为了您的便利并且仅供参考,未必完整或准确。如果本页面的英文版与翻译版之间存在任何冲突,应以英文版为准。 查看此页面的英语版本。