老调 “芯” 说 | AI 算力升维,AMX 加速有新方
即将到来的第四代英特尔® 至强® 可扩展处理器,CPU 核心新增 AI 加速单元——高级矩阵扩展,简称 AMX,通过专用的 Tile 寄存器配合 TMUL 矩阵乘法运算,可以高效的处理 bfloat16 和 INT8 类型数据,AI 算力成倍提升。AMX 的出现还让 AVX-512 可以专注于 FP32 和 FP64 的高精度运算,根据具体工作负载的需求分工配合,达成最优的效果。
即将到来的第四代英特尔® 至强® 可扩展处理器,CPU 核心新增 AI 加速单元——高级矩阵扩展,简称 AMX,通过专用的 Tile 寄存器配合 TMUL 矩阵乘法运算,可以高效的处理 bfloat16 和 INT8 类型数据,AI 算力成倍提升。AMX 的出现还让 AVX-512 可以专注于 FP32 和 FP64 的高精度运算,根据具体工作负载的需求分工配合,达成最优的效果。