2 /* { dg-options "-O2 -mavx5124fmaps" } */
3 /* { dg-require-effective-target avx5124fmaps } */
8 #include "avx512f-helper.h"
10 #define SIZE (AVX512F_LEN / 32)
12 #include "avx512f-mask-type.h"
15 CALC (float *src1
, float* src2
, float *src3
,
16 float *src4
, float* prev_dst
, float *mult
, float *dst
)
20 for (i
= 0; i
< SIZE
; i
++)
22 dst
[i
] = (double)prev_dst
[i
]
23 + (double)src1
[i
] * (double)mult
[0]
24 + (double)src2
[i
] * (double)mult
[1]
25 + (double)src3
[i
] * (double)mult
[2]
26 + (double)src4
[i
] * (double)mult
[3];
34 UNION_TYPE (AVX512F_LEN
,) src1
, src2
, src3
, src4
, src5
, dst
, res1
, res2
, res3
;
35 UNION_TYPE (128,) mult
;
36 MASK_TYPE mask
= MASK_VALUE
;
40 for (i
= 0; i
< SIZE
; i
++)
42 src1
.a
[i
] = 1.5 + 34.67 * i
* sign
;
43 src2
.a
[i
] = -22.17 * i
* sign
;
44 src3
.a
[i
] = src1
.a
[i
] * src1
.a
[i
];
45 src4
.a
[i
] = src2
.a
[i
] * src2
.a
[i
];
48 for (i
= 0; i
< 4; i
++)
49 mult
.a
[i
] = 3.1415 + i
* 2.71828;
51 for (i
= 0; i
< SIZE
; i
++)
52 src5
.a
[i
] = DEFAULT_VALUE
;
54 CALC (src1
.a
, src2
.a
, src3
.a
, src4
.a
, src5
.a
, mult
.a
, res_ref
);
56 res1
.x
= INTRINSIC (_4fmadd_ps
) ( src5
.x
, src1
.x
, src2
.x
, src3
.x
, src4
.x
, &mult
.x
);
57 res2
.x
= INTRINSIC (_mask_4fmadd_ps
) (src5
.x
, mask
, src1
.x
, src2
.x
, src3
.x
, src4
.x
, &mult
.x
);
58 res3
.x
= INTRINSIC (_maskz_4fmadd_ps
) (mask
, src5
.x
, src1
.x
, src2
.x
, src3
.x
, src4
.x
, &mult
.x
);
60 if (UNION_FP_CHECK (AVX512F_LEN
,) (res1
, res_ref
))
63 MASK_MERGE () (res_ref
, mask
, SIZE
);
64 if (UNION_FP_CHECK (AVX512F_LEN
,) (res2
, res_ref
))
67 MASK_ZERO () (res_ref
, mask
, SIZE
);
68 if (UNION_FP_CHECK (AVX512F_LEN
,) (res3
, res_ref
))