跳转至主要内容
支持知识库

模型的复杂性与其推理吞吐量之间有什么关系?

内容类型: 产品信息和文档   |   文章 ID: 000059690   |   上次审核日期: 2026 年 03 月 09 日

环境

神经电脑棒 2

说明

无法确定为什么基准测试工具对两个复杂度相差很大的模型报告相似的推理 FPS(由千兆浮点运算 (GFLOP) 定义)。

解决方法

  • 浮点运算次数越多,每帧数越减少,就成正比。但是,FPS 和 FLOP 之间没有公平的比较。
  • 影响从基准测试工具获得的 FPS 的因素:
    • 以同步和异步模式运行
    • 流的数量
    • 推理请求数

相关产品

本文适用于 1 产品。

免责声明

本页面上的内容是原始英文内容的人工翻译与计算机翻译的组合。我们提供此内容是为了您的便利并且仅供参考,未必完整或准确。如果本页面的英文版与翻译版之间存在任何冲突,应以英文版为准。 查看此页面的英语版本。