仅对英特尔可见 — GUID: oxf1549842769178
Ixiasoft
仅对英特尔可见 — GUID: oxf1549842769178
Ixiasoft
3.2.2.6. FP16 Vector Two模式
此模式执行两个半精度乘法运算求和,并馈入chainout。可变精度DSP模块的chainin输入被加入fp32_adder_a或从其中减去后作为输出结果。
Chainin参数 | 带有浮点加法的Vector Two | 带有浮点减法的Vector 两列 |
---|---|---|
Disable | fp32_result = fp32_adder_a fp32_chainout = (fp16_mult_top_a * fp16_mult_top_b) + (fp16_mult_bot_a * fp16_mult_bot_b) |
fp32_result = fp32_adder_a fp32_chainout = (fp16_mult_top_a * fp16_mult_top_b) - (fp16_mult_bot_a * fp16_mult_bot_b) |
Enable | fp32_result = fp32_adder_a + fp32_chainin fp32_chainout = (fp16_mult_top_a * fp16_mult_top_b) + (fp16_mult_bot_a * fp16_mult_bot_b) |
fp32_result = fp32_adder_a - fp32_chainin fp32_chainout = (fp16_mult_top_a * fp16_mult_top_b) - (fp16_mult_bot_a * fp16_mult_bot_b) |
- fp16_mult_top_invalid
- fp16_mult_top_inexact
- fp16_mult_top_overflow
- fp16_mult_top_underflow
- fp16_mult_bot_invalid
- fp16_mult_bot_inexact
- fp16_mult_bot_overflow
- fp16_mult_bot_underflow
- fp16_adder_invalid
- fp16_adder_inexact
- fp16_adder_overflow
- fp16_adder_underflow
- fp32_adder_invalid
- fp32_adder_inexact
- fp32_adder_overflow
- fp32_adder_underflow
- fp16_mult_top_invalid
- fp16_mult_top_inexact
- fp16_mult_top_infinite
- fp16_mult_top_zero
- fp16_mult_bot_invalid
- fp16_mult_bot_inexact
- fp16_mult_bot_infinite
- fp16_mult_bot_zero
- fp16_adder_invalid
- fp16_adder_inexact
- fp16_adder_infinite
- fp16_adder_zero
- fp32_adder_invalid
- fp32_adder_inexact
- fp32_adder_overflow
- fp32_adder_underflow