1 /* { dg-do compile } */
2 /* { dg-options "-mavx512bw -mavx512vl -O2" } */
3 /* { dg-final { scan-assembler-times "vmovdqu16\[ \\t\]+\[^\n\]*%zmm\[0-9\]\[^\n\]*%zmm\[0-9\]\{%k\[1-7\]\}\[^\{\]" 1 } } */
4 /* { dg-final { scan-assembler-times "vmovdqu16\[ \\t\]+\[^\n\]*%ymm\[0-9\]\[^\n\]*%ymm\[0-9\]\{%k\[1-7\]\}\[^\{\]" 1 } } */
5 /* { dg-final { scan-assembler-times "vmovdqu16\[ \\t\]+\[^\n\]*%xmm\[0-9\]\[^\n\]*%xmm\[0-9\]\{%k\[1-7\]\}\[^\{\]" 1 } } */
6 /* { dg-final { scan-assembler-times "vmovdqu16\[ \\t\]+\[^\n\]*%zmm\[0-9\]\[^\n\]*%zmm\[0-9\]\{%k\[1-7\]\}\{z\}" 1 } } */
7 /* { dg-final { scan-assembler-times "vmovdqu16\[ \\t\]+\[^\n\]*%ymm\[0-9\]\[^\n\]*%ymm\[0-9\]\{%k\[1-7\]\}\{z\}" 1 } } */
8 /* { dg-final { scan-assembler-times "vmovdqu16\[ \\t\]+\[^\n\]*%xmm\[0-9\]\[^\n\]*%xmm\[0-9\]\{%k\[1-7\]\}\{z\}" 1 } } */
9 /* { dg-final { scan-assembler-times "vmovdqu16\[ \\t\]+\[^\n\]*\\)\[^\n\]*%zmm\[0-9\]\{%k\[1-7\]\}\[^\{\]" 1 } } */
10 /* { dg-final { scan-assembler-times "vmovdqu16\[ \\t\]+\[^\n\]*\\)\[^\n\]*%ymm\[0-9\]\{%k\[1-7\]\}\[^\{\]" 1 } } */
11 /* { dg-final { scan-assembler-times "vmovdqu16\[ \\t\]+\[^\n\]*\\)\[^\n\]*%xmm\[0-9\]\{%k\[1-7\]\}\[^\{\]" 1 } } */
12 /* { dg-final { scan-assembler-times "vmovdqu16\[ \\t\]+\[^\n\]*\\)\[^\n\]*%zmm\[0-9\]\{%k\[1-7\]\}\{z\}" 1 } } */
13 /* { dg-final { scan-assembler-times "vmovdqu16\[ \\t\]+\[^\n\]*\\)\[^\n\]*%ymm\[0-9\]\{%k\[1-7\]\}\{z\}" 1 } } */
14 /* { dg-final { scan-assembler-times "vmovdqu16\[ \\t\]+\[^\n\]*\\)\[^\n\]*%xmm\[0-9\]\{%k\[1-7\]\}\{z\}" 1 } } */
15 /* { dg-final { scan-assembler-times "vmovdqu16\[ \\t\]+\[^\n\]*%zmm\[0-9\]\[^\n\]*\\)\{%k\[1-7\]\}\[^\{\]" 1 } } */
16 /* { dg-final { scan-assembler-times "vmovdqu16\[ \\t\]+\[^\n\]*%ymm\[0-9\]\[^\n\]*\\)\{%k\[1-7\]\}\[^\{\]" 1 } } */
17 /* { dg-final { scan-assembler-times "vmovdqu16\[ \\t\]+\[^\n\]*%xmm\[0-9\]\[^\n\]*\\)\{%k\[1-7\]\}\[^\{\]" 1 } } */
19 #include <immintrin.h>
22 volatile __m512i x1
, yy
;
23 volatile __m256i x2
, y2
;
24 volatile __m128i x3
, y3
;
25 volatile __mmask32 m32
;
26 volatile __mmask16 m16
;
32 x1
= _mm512_mask_mov_epi16 (x1
, m32
, yy
);
33 x2
= _mm256_mask_mov_epi16 (x2
, m16
, y2
);
34 x3
= _mm_mask_mov_epi16 (x3
, m8
, y3
);
36 x1
= _mm512_maskz_mov_epi16 (m32
, yy
);
37 x2
= _mm256_maskz_mov_epi16 (m16
, y2
);
38 x3
= _mm_maskz_mov_epi16 (m8
, y3
);
40 x1
= _mm512_mask_loadu_epi16 (x1
, m32
, p
);
41 x2
= _mm256_mask_loadu_epi16 (x2
, m16
, p
);
42 x3
= _mm_mask_loadu_epi16 (x3
, m8
, p
);
44 x1
= _mm512_maskz_loadu_epi16 (m32
, p
);
45 x2
= _mm256_maskz_loadu_epi16 (m16
, p
);
46 x3
= _mm_maskz_loadu_epi16 (m8
, p
);
48 _mm512_mask_storeu_epi16 (p
, m32
, x1
);
49 _mm256_mask_storeu_epi16 (p
, m16
, x2
);
50 _mm_mask_storeu_epi16 (p
, m8
, x3
);