[AArch64] Use UNSPEC_MERGE_PTRUE for comparisons
[official-gcc.git] / gcc / config / aarch64 / aarch64-sve.md
blob7a1f58a8091e6b9702048b8a1669bfcdecb65c55
1 ;; Machine description for AArch64 SVE.
2 ;; Copyright (C) 2009-2016 Free Software Foundation, Inc.
3 ;; Contributed by ARM Ltd.
4 ;;
5 ;; This file is part of GCC.
6 ;;
7 ;; GCC is free software; you can redistribute it and/or modify it
8 ;; under the terms of the GNU General Public License as published by
9 ;; the Free Software Foundation; either version 3, or (at your option)
10 ;; any later version.
12 ;; GCC is distributed in the hope that it will be useful, but
13 ;; WITHOUT ANY WARRANTY; without even the implied warranty of
14 ;; MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the GNU
15 ;; General Public License for more details.
17 ;; You should have received a copy of the GNU General Public License
18 ;; along with GCC; see the file COPYING3.  If not see
19 ;; <http://www.gnu.org/licenses/>.
21 ;; Note on the handling of big-endian SVE
22 ;; --------------------------------------
24 ;; On big-endian systems, Advanced SIMD mov<mode> patterns act in the
25 ;; same way as movdi or movti would: the first byte of memory goes
26 ;; into the most significant byte of the register and the last byte
27 ;; of memory goes into the least significant byte of the register.
28 ;; This is the most natural ordering for Advanced SIMD and matches
29 ;; the ABI layout for 64-bit and 128-bit vector types.
31 ;; As a result, the order of bytes within the register is what GCC
32 ;; expects for a big-endian target, and subreg offsets therefore work
33 ;; as expected, with the first element in memory having subreg offset 0
34 ;; and the last element in memory having the subreg offset associated
35 ;; with a big-endian lowpart.  However, this ordering also means that
36 ;; GCC's lane numbering does not match the architecture's numbering:
37 ;; GCC always treats the element at the lowest address in memory
38 ;; (subreg offset 0) as element 0, while the architecture treats
39 ;; the least significant end of the register as element 0.
41 ;; The situation for SVE is different.  We want the layout of the
42 ;; SVE register to be same for mov<mode> as it is for maskload<mode>:
43 ;; logically, a mov<mode> load must be indistinguishable from a
44 ;; maskload<mode> whose mask is all true.  We therefore need the
45 ;; register layout to match LD1 rather than LDR.  The ABI layout of
46 ;; SVE types also matches LD1 byte ordering rather than LDR byte ordering.
48 ;; As a result, the architecture lane numbering matches GCC's lane
49 ;; numbering, with element 0 always being the first in memory.
50 ;; However:
52 ;; - Applying a subreg offset to a register does not give the element
53 ;;   that GCC expects: the first element in memory has the subreg offset
54 ;;   associated with a big-endian lowpart while the last element in memory
55 ;;   has subreg offset 0.  We handle this via TARGET_CAN_CHANGE_MODE_CLASS.
57 ;; - We cannot use LDR and STR for spill slots that might be accessed
58 ;;   via subregs, since although the elements have the order GCC expects,
59 ;;   the order of the bytes within the elements is different.  We instead
60 ;;   access spill slots via LD1 and ST1, using secondary reloads to
61 ;;   reserve a predicate register.
64 ;; SVE data moves.
65 (define_expand "mov<mode>"
66   [(set (match_operand:SVE_ALL 0 "nonimmediate_operand")
67         (match_operand:SVE_ALL 1 "general_operand"))]
68   "TARGET_SVE"
69   {
70     /* Use the predicated load and store patterns where possible.
71        This is required for big-endian targets (see the comment at the
72        head of the file) and increases the addressing choices for
73        little-endian.  */
74     if ((MEM_P (operands[0]) || MEM_P (operands[1]))
75         && can_create_pseudo_p ())
76       {
77         aarch64_expand_sve_mem_move (operands[0], operands[1], <VPRED>mode);
78         DONE;
79       }
81     if (CONSTANT_P (operands[1]))
82       {
83         aarch64_expand_mov_immediate (operands[0], operands[1],
84                                       gen_vec_duplicate<mode>);
85         DONE;
86       }
88     /* Optimize subregs on big-endian targets: we can use REV[BHW]
89        instead of going through memory.  */
90     if (BYTES_BIG_ENDIAN
91         && aarch64_maybe_expand_sve_subreg_move (operands[0], operands[1]))
92       DONE;
93   }
96 ;; A pattern for optimizing SUBREGs that have a reinterpreting effect
97 ;; on big-endian targets; see aarch64_maybe_expand_sve_subreg_move
98 ;; for details.  We use a special predicate for operand 2 to reduce
99 ;; the number of patterns.
100 (define_insn_and_split "*aarch64_sve_mov<mode>_subreg_be"
101   [(set (match_operand:SVE_ALL 0 "aarch64_sve_nonimmediate_operand" "=w")
102         (unspec:SVE_ALL
103           [(match_operand:VNx16BI 1 "register_operand" "Upl")
104            (match_operand 2 "aarch64_any_register_operand" "w")]
105           UNSPEC_REV_SUBREG))]
106   "TARGET_SVE && BYTES_BIG_ENDIAN"
107   "#"
108   "&& reload_completed"
109   [(const_int 0)]
110   {
111     aarch64_split_sve_subreg_move (operands[0], operands[1], operands[2]);
112     DONE;
113   }
116 ;; Unpredicated moves (little-endian).  Only allow memory operations
117 ;; during and after RA; before RA we want the predicated load and
118 ;; store patterns to be used instead.
119 (define_insn "*aarch64_sve_mov<mode>_le"
120   [(set (match_operand:SVE_ALL 0 "aarch64_sve_nonimmediate_operand" "=w, Utr, w, w")
121         (match_operand:SVE_ALL 1 "aarch64_sve_general_operand" "Utr, w, w, Dn"))]
122   "TARGET_SVE
123    && !BYTES_BIG_ENDIAN
124    && ((lra_in_progress || reload_completed)
125        || (register_operand (operands[0], <MODE>mode)
126            && nonmemory_operand (operands[1], <MODE>mode)))"
127   "@
128    ldr\t%0, %1
129    str\t%1, %0
130    mov\t%0.d, %1.d
131    * return aarch64_output_sve_mov_immediate (operands[1]);"
134 ;; Unpredicated moves (big-endian).  Memory accesses require secondary
135 ;; reloads.
136 (define_insn "*aarch64_sve_mov<mode>_be"
137   [(set (match_operand:SVE_ALL 0 "register_operand" "=w, w")
138         (match_operand:SVE_ALL 1 "aarch64_nonmemory_operand" "w, Dn"))]
139   "TARGET_SVE && BYTES_BIG_ENDIAN"
140   "@
141    mov\t%0.d, %1.d
142    * return aarch64_output_sve_mov_immediate (operands[1]);"
145 ;; Handle big-endian memory reloads.  We use byte PTRUE for all modes
146 ;; to try to encourage reuse.
147 (define_expand "aarch64_sve_reload_be"
148   [(parallel
149      [(set (match_operand 0)
150            (match_operand 1))
151       (clobber (match_operand:VNx16BI 2 "register_operand" "=Upl"))])]
152   "TARGET_SVE && BYTES_BIG_ENDIAN"
153   {
154     /* Create a PTRUE.  */
155     emit_move_insn (operands[2], CONSTM1_RTX (VNx16BImode));
157     /* Refer to the PTRUE in the appropriate mode for this move.  */
158     machine_mode mode = GET_MODE (operands[0]);
159     machine_mode pred_mode
160       = aarch64_sve_pred_mode (GET_MODE_UNIT_SIZE (mode)).require ();
161     rtx pred = gen_lowpart (pred_mode, operands[2]);
163     /* Emit a predicated load or store.  */
164     aarch64_emit_sve_pred_move (operands[0], pred, operands[1]);
165     DONE;
166   }
169 ;; A predicated load or store for which the predicate is known to be
170 ;; all-true.  Note that this pattern is generated directly by
171 ;; aarch64_emit_sve_pred_move, so changes to this pattern will
172 ;; need changes there as well.
173 (define_insn "*pred_mov<mode>"
174   [(set (match_operand:SVE_ALL 0 "nonimmediate_operand" "=w, m")
175         (unspec:SVE_ALL
176           [(match_operand:<VPRED> 1 "register_operand" "Upl, Upl")
177            (match_operand:SVE_ALL 2 "nonimmediate_operand" "m, w")]
178           UNSPEC_MERGE_PTRUE))]
179   "TARGET_SVE
180    && (register_operand (operands[0], <MODE>mode)
181        || register_operand (operands[2], <MODE>mode))"
182   "@
183    ld1<Vesize>\t%0.<Vetype>, %1/z, %2
184    st1<Vesize>\t%2.<Vetype>, %1, %0"
187 (define_expand "movmisalign<mode>"
188   [(set (match_operand:SVE_ALL 0 "nonimmediate_operand")
189         (match_operand:SVE_ALL 1 "general_operand"))]
190   "TARGET_SVE"
191   {
192     /* Equivalent to a normal move for our purpooses.  */
193     emit_move_insn (operands[0], operands[1]);
194     DONE;
195   }
198 (define_insn "maskload<mode><vpred>"
199   [(set (match_operand:SVE_ALL 0 "register_operand" "=w")
200         (unspec:SVE_ALL
201           [(match_operand:<VPRED> 2 "register_operand" "Upl")
202            (match_operand:SVE_ALL 1 "memory_operand" "m")]
203           UNSPEC_LD1_SVE))]
204   "TARGET_SVE"
205   "ld1<Vesize>\t%0.<Vetype>, %2/z, %1"
208 (define_insn "maskstore<mode><vpred>"
209   [(set (match_operand:SVE_ALL 0 "memory_operand" "+m")
210         (unspec:SVE_ALL [(match_operand:<VPRED> 2 "register_operand" "Upl")
211                          (match_operand:SVE_ALL 1 "register_operand" "w")
212                          (match_dup 0)]
213                         UNSPEC_ST1_SVE))]
214   "TARGET_SVE"
215   "st1<Vesize>\t%1.<Vetype>, %2, %0"
218 ;; Unpredicated gather loads.
219 (define_expand "gather_load<mode>"
220   [(set (match_operand:SVE_SD 0 "register_operand")
221         (unspec:SVE_SD
222           [(match_dup 5)
223            (match_operand:DI 1 "aarch64_reg_or_zero")
224            (match_operand:<V_INT_EQUIV> 2 "register_operand")
225            (match_operand:DI 3 "const_int_operand")
226            (match_operand:DI 4 "aarch64_gather_scale_operand_<Vesize>")
227            (mem:BLK (scratch))]
228           UNSPEC_LD1_GATHER))]
229   "TARGET_SVE"
230   {
231     operands[5] = force_reg (<VPRED>mode, CONSTM1_RTX (<VPRED>mode));
232   }
235 ;; Predicated gather loads for 32-bit elements.  Operand 3 is true for
236 ;; unsigned extension and false for signed extension.
237 (define_insn "mask_gather_load<mode>"
238   [(set (match_operand:SVE_S 0 "register_operand" "=w, w, w, w, w")
239         (unspec:SVE_S
240           [(match_operand:<VPRED> 5 "register_operand" "Upl, Upl, Upl, Upl, Upl")
241            (match_operand:DI 1 "aarch64_reg_or_zero" "Z, rk, rk, rk, rk")
242            (match_operand:<V_INT_EQUIV> 2 "register_operand" "w, w, w, w, w")
243            (match_operand:DI 3 "const_int_operand" "i, Z, Ui1, Z, Ui1")
244            (match_operand:DI 4 "aarch64_gather_scale_operand_w" "Ui1, Ui1, Ui1, i, i")
245            (mem:BLK (scratch))]
246           UNSPEC_LD1_GATHER))]
247   "TARGET_SVE"
248   "@
249    ld1w\t%0.s, %5/z, [%2.s]
250    ld1w\t%0.s, %5/z, [%1, %2.s, sxtw]
251    ld1w\t%0.s, %5/z, [%1, %2.s, uxtw]
252    ld1w\t%0.s, %5/z, [%1, %2.s, sxtw %p4]
253    ld1w\t%0.s, %5/z, [%1, %2.s, uxtw %p4]"
256 ;; Predicated gather loads for 64-bit elements.  The value of operand 3
257 ;; doesn't matter in this case.
258 (define_insn "mask_gather_load<mode>"
259   [(set (match_operand:SVE_D 0 "register_operand" "=w, w, w")
260         (unspec:SVE_D
261           [(match_operand:<VPRED> 5 "register_operand" "Upl, Upl, Upl")
262            (match_operand:DI 1 "aarch64_reg_or_zero" "Z, rk, rk")
263            (match_operand:<V_INT_EQUIV> 2 "register_operand" "w, w, w")
264            (match_operand:DI 3 "const_int_operand")
265            (match_operand:DI 4 "aarch64_gather_scale_operand_d" "Ui1, Ui1, i")
266            (mem:BLK (scratch))]
267           UNSPEC_LD1_GATHER))]
268   "TARGET_SVE"
269   "@
270    ld1d\t%0.d, %5/z, [%2.d]
271    ld1d\t%0.d, %5/z, [%1, %2.d]
272    ld1d\t%0.d, %5/z, [%1, %2.d, lsl %p4]"
275 ;; Unpredicated scatter store.
276 (define_expand "scatter_store<mode>"
277   [(set (mem:BLK (scratch))
278         (unspec:BLK
279           [(match_dup 5)
280            (match_operand:DI 0 "aarch64_reg_or_zero")
281            (match_operand:<V_INT_EQUIV> 1 "register_operand")
282            (match_operand:DI 2 "const_int_operand")
283            (match_operand:DI 3 "aarch64_gather_scale_operand_<Vesize>")
284            (match_operand:SVE_SD 4 "register_operand")]
285           UNSPEC_ST1_SCATTER))]
286   "TARGET_SVE"
287   {
288     operands[5] = force_reg (<VPRED>mode, CONSTM1_RTX (<VPRED>mode));
289   }
292 ;; Predicated scatter stores for 32-bit elements.  Operand 2 is true for
293 ;; unsigned extension and false for signed extension.
294 (define_insn "mask_scatter_store<mode>"
295   [(set (mem:BLK (scratch))
296         (unspec:BLK
297           [(match_operand:<VPRED> 5 "register_operand" "Upl, Upl, Upl, Upl, Upl")
298            (match_operand:DI 0 "aarch64_reg_or_zero" "Z, rk, rk, rk, rk")
299            (match_operand:<V_INT_EQUIV> 1 "register_operand" "w, w, w, w, w")
300            (match_operand:DI 2 "const_int_operand" "i, Z, Ui1, Z, Ui1")
301            (match_operand:DI 3 "aarch64_gather_scale_operand_w" "Ui1, Ui1, Ui1, i, i")
302            (match_operand:SVE_S 4 "register_operand" "w, w, w, w, w")]
303           UNSPEC_ST1_SCATTER))]
304   "TARGET_SVE"
305   "@
306    st1w\t%4.s, %5, [%1.s]
307    st1w\t%4.s, %5, [%0, %1.s, sxtw]
308    st1w\t%4.s, %5, [%0, %1.s, uxtw]
309    st1w\t%4.s, %5, [%0, %1.s, sxtw %p3]
310    st1w\t%4.s, %5, [%0, %1.s, uxtw %p3]"
313 ;; Predicated scatter stores for 64-bit elements.  The value of operand 2
314 ;; doesn't matter in this case.
315 (define_insn "mask_scatter_store<mode>"
316   [(set (mem:BLK (scratch))
317         (unspec:BLK
318           [(match_operand:<VPRED> 5 "register_operand" "Upl, Upl, Upl")
319            (match_operand:DI 0 "aarch64_reg_or_zero" "Z, rk, rk")
320            (match_operand:<V_INT_EQUIV> 1 "register_operand" "w, w, w")
321            (match_operand:DI 2 "const_int_operand")
322            (match_operand:DI 3 "aarch64_gather_scale_operand_d" "Ui1, Ui1, i")
323            (match_operand:SVE_D 4 "register_operand" "w, w, w")]
324           UNSPEC_ST1_SCATTER))]
325   "TARGET_SVE"
326   "@
327    st1d\t%4.d, %5, [%1.d]
328    st1d\t%4.d, %5, [%0, %1.d]
329    st1d\t%4.d, %5, [%0, %1.d, lsl %p3]"
332 ;; SVE structure moves.
333 (define_expand "mov<mode>"
334   [(set (match_operand:SVE_STRUCT 0 "nonimmediate_operand")
335         (match_operand:SVE_STRUCT 1 "general_operand"))]
336   "TARGET_SVE"
337   {
338     /* Big-endian loads and stores need to be done via LD1 and ST1;
339        see the comment at the head of the file for details.  */
340     if ((MEM_P (operands[0]) || MEM_P (operands[1]))
341         && BYTES_BIG_ENDIAN)
342       {
343         gcc_assert (can_create_pseudo_p ());
344         aarch64_expand_sve_mem_move (operands[0], operands[1], <VPRED>mode);
345         DONE;
346       }
348     if (CONSTANT_P (operands[1]))
349       {
350         aarch64_expand_mov_immediate (operands[0], operands[1]);
351         DONE;
352       }
353   }
356 ;; Unpredicated structure moves (little-endian).
357 (define_insn "*aarch64_sve_mov<mode>_le"
358   [(set (match_operand:SVE_STRUCT 0 "aarch64_sve_nonimmediate_operand" "=w, Utr, w, w")
359         (match_operand:SVE_STRUCT 1 "aarch64_sve_general_operand" "Utr, w, w, Dn"))]
360   "TARGET_SVE && !BYTES_BIG_ENDIAN"
361   "#"
362   [(set_attr "length" "<insn_length>")]
365 ;; Unpredicated structure moves (big-endian).  Memory accesses require
366 ;; secondary reloads.
367 (define_insn "*aarch64_sve_mov<mode>_le"
368   [(set (match_operand:SVE_STRUCT 0 "register_operand" "=w, w")
369         (match_operand:SVE_STRUCT 1 "aarch64_nonmemory_operand" "w, Dn"))]
370   "TARGET_SVE && BYTES_BIG_ENDIAN"
371   "#"
372   [(set_attr "length" "<insn_length>")]
375 ;; Split unpredicated structure moves into pieces.  This is the same
376 ;; for both big-endian and little-endian code, although it only needs
377 ;; to handle memory operands for little-endian code.
378 (define_split
379   [(set (match_operand:SVE_STRUCT 0 "aarch64_sve_nonimmediate_operand")
380         (match_operand:SVE_STRUCT 1 "aarch64_sve_general_operand"))]
381   "TARGET_SVE && reload_completed"
382   [(const_int 0)]
383   {
384     rtx dest = operands[0];
385     rtx src = operands[1];
386     if (REG_P (dest) && REG_P (src))
387       aarch64_simd_emit_reg_reg_move (operands, <VSINGLE>mode, <vector_count>);
388     else
389       for (unsigned int i = 0; i < <vector_count>; ++i)
390         {
391           rtx subdest = simplify_gen_subreg (<VSINGLE>mode, dest, <MODE>mode,
392                                              i * BYTES_PER_SVE_VECTOR);
393           rtx subsrc = simplify_gen_subreg (<VSINGLE>mode, src, <MODE>mode,
394                                             i * BYTES_PER_SVE_VECTOR);
395           emit_insn (gen_rtx_SET (subdest, subsrc));
396         }
397     DONE;
398   }
401 ;; Predicated structure moves.  This works for both endiannesses but in
402 ;; practice is only useful for big-endian.
403 (define_insn_and_split "pred_mov<mode>"
404   [(set (match_operand:SVE_STRUCT 0 "aarch64_sve_struct_nonimmediate_operand" "=w, Utx")
405         (unspec:SVE_STRUCT
406           [(match_operand:<VPRED> 1 "register_operand" "Upl, Upl")
407            (match_operand:SVE_STRUCT 2 "aarch64_sve_struct_nonimmediate_operand" "Utx, w")]
408           UNSPEC_MERGE_PTRUE))]
409   "TARGET_SVE
410    && (register_operand (operands[0], <MODE>mode)
411        || register_operand (operands[2], <MODE>mode))"
412   "#"
413   "&& reload_completed"
414   [(const_int 0)]
415   {
416     for (unsigned int i = 0; i < <vector_count>; ++i)
417       {
418         rtx subdest = simplify_gen_subreg (<VSINGLE>mode, operands[0],
419                                            <MODE>mode,
420                                            i * BYTES_PER_SVE_VECTOR);
421         rtx subsrc = simplify_gen_subreg (<VSINGLE>mode, operands[2],
422                                           <MODE>mode,
423                                           i * BYTES_PER_SVE_VECTOR);
424         aarch64_emit_sve_pred_move (subdest, operands[1], subsrc);
425       }
426     DONE;
427   }
428   [(set_attr "length" "<insn_length>")]
431 (define_expand "mov<mode>"
432   [(set (match_operand:PRED_ALL 0 "nonimmediate_operand")
433         (match_operand:PRED_ALL 1 "general_operand"))]
434   "TARGET_SVE"
435   {
436     if (GET_CODE (operands[0]) == MEM)
437       operands[1] = force_reg (<MODE>mode, operands[1]);
438   }
441 (define_insn "*aarch64_sve_mov<mode>"
442   [(set (match_operand:PRED_ALL 0 "nonimmediate_operand" "=Upa, m, Upa, Upa, Upa")
443         (match_operand:PRED_ALL 1 "general_operand" "Upa, Upa, m, Dz, Dm"))]
444   "TARGET_SVE
445    && (register_operand (operands[0], <MODE>mode)
446        || register_operand (operands[1], <MODE>mode))"
447   "@
448    mov\t%0.b, %1.b
449    str\t%1, %0
450    ldr\t%0, %1
451    pfalse\t%0.b
452    * return aarch64_output_ptrue (<MODE>mode, '<Vetype>');"
455 ;; Handle extractions from a predicate by converting to an integer vector
456 ;; and extracting from there.
457 (define_expand "vec_extract<vpred><Vel>"
458   [(match_operand:<VEL> 0 "register_operand")
459    (match_operand:<VPRED> 1 "register_operand")
460    (match_operand:SI 2 "nonmemory_operand")
461    ;; Dummy operand to which we can attach the iterator.
462    (reg:SVE_I V0_REGNUM)]
463   "TARGET_SVE"
464   {
465     rtx tmp = gen_reg_rtx (<MODE>mode);
466     emit_insn (gen_aarch64_sve_dup<mode>_const (tmp, operands[1],
467                                                 CONST1_RTX (<MODE>mode),
468                                                 CONST0_RTX (<MODE>mode)));
469     emit_insn (gen_vec_extract<mode><Vel> (operands[0], tmp, operands[2]));
470     DONE;
471   }
474 (define_expand "vec_extract<mode><Vel>"
475   [(set (match_operand:<VEL> 0 "register_operand")
476         (vec_select:<VEL>
477           (match_operand:SVE_ALL 1 "register_operand")
478           (parallel [(match_operand:SI 2 "nonmemory_operand")])))]
479   "TARGET_SVE"
480   {
481     poly_int64 val;
482     if (poly_int_rtx_p (operands[2], &val)
483         && known_eq (val, GET_MODE_NUNITS (<MODE>mode) - 1))
484       {
485         /* The last element can be extracted with a LASTB and a false
486            predicate.  */
487         rtx sel = force_reg (<VPRED>mode, CONST0_RTX (<VPRED>mode));
488         emit_insn (gen_extract_last_<mode> (operands[0], sel, operands[1]));
489         DONE;
490       }
491     if (!CONST_INT_P (operands[2]))
492       {
493         /* Create an index with operand[2] as the base and -1 as the step.
494            It will then be zero for the element we care about.  */
495         rtx index = gen_lowpart (<VEL_INT>mode, operands[2]);
496         index = force_reg (<VEL_INT>mode, index);
497         rtx series = gen_reg_rtx (<V_INT_EQUIV>mode);
498         emit_insn (gen_vec_series<v_int_equiv> (series, index, constm1_rtx));
500         /* Get a predicate that is true for only that element.  */
501         rtx zero = CONST0_RTX (<V_INT_EQUIV>mode);
502         rtx cmp = gen_rtx_EQ (<V_INT_EQUIV>mode, series, zero);
503         rtx sel = gen_reg_rtx (<VPRED>mode);
504         emit_insn (gen_vec_cmp<v_int_equiv><vpred> (sel, cmp, series, zero));
506         /* Select the element using LASTB.  */
507         emit_insn (gen_extract_last_<mode> (operands[0], sel, operands[1]));
508         DONE;
509       }
510   }
513 ;; Extract element zero.  This is a special case because we want to force
514 ;; the registers to be the same for the second alternative, and then
515 ;; split the instruction into nothing after RA.
516 (define_insn_and_split "*vec_extract<mode><Vel>_0"
517   [(set (match_operand:<VEL> 0 "aarch64_simd_nonimmediate_operand" "=r, w, Utv")
518         (vec_select:<VEL>
519           (match_operand:SVE_ALL 1 "register_operand" "w, 0, w")
520           (parallel [(const_int 0)])))]
521   "TARGET_SVE"
522   {
523     operands[1] = gen_rtx_REG (<V128>mode, REGNO (operands[1]));
524     switch (which_alternative)
525       {
526         case 0:
527           return "umov\\t%<vwcore>0, %1.<Vetype>[0]";
528         case 1:
529           return "#";
530         case 2:
531           return "st1\\t{%1.<Vetype>}[0], %0";
532         default:
533           gcc_unreachable ();
534       }
535   }
536   "&& reload_completed
537    && REG_P (operands[0])
538    && REGNO (operands[0]) == REGNO (operands[1])"
539   [(const_int 0)]
540   {
541     emit_note (NOTE_INSN_DELETED);
542     DONE;
543   }
544   [(set_attr "type" "neon_to_gp_q, untyped, neon_store1_one_lane_q")]
547 ;; Extract an element from the Advanced SIMD portion of the register.
548 ;; We don't just reuse the aarch64-simd.md pattern because we don't
549 ;; want any change in lane number on big-endian targets.
550 (define_insn "*vec_extract<mode><Vel>_v128"
551   [(set (match_operand:<VEL> 0 "aarch64_simd_nonimmediate_operand" "=r, w, Utv")
552         (vec_select:<VEL>
553           (match_operand:SVE_ALL 1 "register_operand" "w, w, w")
554           (parallel [(match_operand:SI 2 "const_int_operand")])))]
555   "TARGET_SVE
556    && IN_RANGE (INTVAL (operands[2]) * GET_MODE_SIZE (<VEL>mode), 1, 15)"
557   {
558     operands[1] = gen_rtx_REG (<V128>mode, REGNO (operands[1]));
559     switch (which_alternative)
560       {
561         case 0:
562           return "umov\\t%<vwcore>0, %1.<Vetype>[%2]";
563         case 1:
564           return "dup\\t%<Vetype>0, %1.<Vetype>[%2]";
565         case 2:
566           return "st1\\t{%1.<Vetype>}[%2], %0";
567         default:
568           gcc_unreachable ();
569       }
570   }
571   [(set_attr "type" "neon_to_gp_q, neon_dup_q, neon_store1_one_lane_q")]
574 ;; Extract an element in the range of DUP.  This pattern allows the
575 ;; source and destination to be different.
576 (define_insn "*vec_extract<mode><Vel>_dup"
577   [(set (match_operand:<VEL> 0 "register_operand" "=w")
578         (vec_select:<VEL>
579           (match_operand:SVE_ALL 1 "register_operand" "w")
580           (parallel [(match_operand:SI 2 "const_int_operand")])))]
581   "TARGET_SVE
582    && IN_RANGE (INTVAL (operands[2]) * GET_MODE_SIZE (<VEL>mode), 16, 63)"
583   {
584     operands[0] = gen_rtx_REG (<MODE>mode, REGNO (operands[0]));
585     return "dup\t%0.<Vetype>, %1.<Vetype>[%2]";
586   }
589 ;; Extract an element outside the range of DUP.  This pattern requires the
590 ;; source and destination to be the same.
591 (define_insn "*vec_extract<mode><Vel>_ext"
592   [(set (match_operand:<VEL> 0 "register_operand" "=w")
593         (vec_select:<VEL>
594           (match_operand:SVE_ALL 1 "register_operand" "0")
595           (parallel [(match_operand:SI 2 "const_int_operand")])))]
596   "TARGET_SVE && INTVAL (operands[2]) * GET_MODE_SIZE (<VEL>mode) >= 64"
597   {
598     operands[0] = gen_rtx_REG (<MODE>mode, REGNO (operands[0]));
599     operands[2] = GEN_INT (INTVAL (operands[2]) * GET_MODE_SIZE (<VEL>mode));
600     return "ext\t%0.b, %0.b, %0.b, #%2";
601   }
604 ;; Extract the last active element of operand 1 into operand 0.
605 ;; If no elements are active, extract the last inactive element instead.
606 (define_insn "extract_last_<mode>"
607   [(set (match_operand:<VEL> 0 "register_operand" "=r, w")
608         (unspec:<VEL>
609           [(match_operand:<VPRED> 1 "register_operand" "Upl, Upl")
610            (match_operand:SVE_ALL 2 "register_operand" "w, w")]
611           UNSPEC_LASTB))]
612   "TARGET_SVE"
613   "@
614    lastb\t%<vwcore>0, %1, %2.<Vetype>
615    lastb\t%<Vetype>0, %1, %2.<Vetype>"
618 (define_expand "vec_duplicate<mode>"
619   [(parallel
620     [(set (match_operand:SVE_ALL 0 "register_operand")
621           (vec_duplicate:SVE_ALL
622             (match_operand:<VEL> 1 "aarch64_sve_dup_operand")))
623      (clobber (scratch:<VPRED>))])]
624   "TARGET_SVE"
625   {
626     if (MEM_P (operands[1]))
627       {
628         rtx ptrue = force_reg (<VPRED>mode, CONSTM1_RTX (<VPRED>mode));
629         emit_insn (gen_sve_ld1r<mode> (operands[0], ptrue, operands[1],
630                                        CONST0_RTX (<MODE>mode)));
631         DONE;
632       }
633   }
636 ;; Accept memory operands for the benefit of combine, and also in case
637 ;; the scalar input gets spilled to memory during RA.  We want to split
638 ;; the load at the first opportunity in order to allow the PTRUE to be
639 ;; optimized with surrounding code.
640 (define_insn_and_split "*vec_duplicate<mode>_reg"
641   [(set (match_operand:SVE_ALL 0 "register_operand" "=w, w, w")
642         (vec_duplicate:SVE_ALL
643           (match_operand:<VEL> 1 "aarch64_sve_dup_operand" "r, w, Uty")))
644    (clobber (match_scratch:<VPRED> 2 "=X, X, Upl"))]
645   "TARGET_SVE"
646   "@
647    mov\t%0.<Vetype>, %<vwcore>1
648    mov\t%0.<Vetype>, %<Vetype>1
649    #"
650   "&& MEM_P (operands[1])"
651   [(const_int 0)]
652   {
653     if (GET_CODE (operands[2]) == SCRATCH)
654       operands[2] = gen_reg_rtx (<VPRED>mode);
655     emit_move_insn (operands[2], CONSTM1_RTX (<VPRED>mode));
656     emit_insn (gen_sve_ld1r<mode> (operands[0], operands[2], operands[1],
657                                    CONST0_RTX (<MODE>mode)));
658     DONE;
659   }
660   [(set_attr "length" "4,4,8")]
663 ;; This is used for vec_duplicate<mode>s from memory, but can also
664 ;; be used by combine to optimize selects of a a vec_duplicate<mode>
665 ;; with zero.
666 (define_insn "sve_ld1r<mode>"
667   [(set (match_operand:SVE_ALL 0 "register_operand" "=w")
668         (unspec:SVE_ALL
669           [(match_operand:<VPRED> 1 "register_operand" "Upl")
670            (vec_duplicate:SVE_ALL
671              (match_operand:<VEL> 2 "aarch64_sve_ld1r_operand" "Uty"))
672            (match_operand:SVE_ALL 3 "aarch64_simd_imm_zero")]
673           UNSPEC_SEL))]
674   "TARGET_SVE"
675   "ld1r<Vesize>\t%0.<Vetype>, %1/z, %2"
678 ;; Load 128 bits from memory and duplicate to fill a vector.  Since there
679 ;; are so few operations on 128-bit "elements", we don't define a VNx1TI
680 ;; and simply use vectors of bytes instead.
681 (define_insn "*sve_ld1rq<Vesize>"
682   [(set (match_operand:SVE_ALL 0 "register_operand" "=w")
683         (unspec:SVE_ALL
684           [(match_operand:<VPRED> 1 "register_operand" "Upl")
685            (match_operand:TI 2 "aarch64_sve_ld1r_operand" "Uty")]
686           UNSPEC_LD1RQ))]
687   "TARGET_SVE"
688   "ld1rq<Vesize>\t%0.<Vetype>, %1/z, %2"
691 ;; Implement a predicate broadcast by shifting the low bit of the scalar
692 ;; input into the top bit and using a WHILELO.  An alternative would be to
693 ;; duplicate the input and do a compare with zero.
694 (define_expand "vec_duplicate<mode>"
695   [(set (match_operand:PRED_ALL 0 "register_operand")
696         (vec_duplicate:PRED_ALL (match_operand 1 "register_operand")))]
697   "TARGET_SVE"
698   {
699     rtx tmp = gen_reg_rtx (DImode);
700     rtx op1 = gen_lowpart (DImode, operands[1]);
701     emit_insn (gen_ashldi3 (tmp, op1, gen_int_mode (63, DImode)));
702     emit_insn (gen_while_ultdi<mode> (operands[0], const0_rtx, tmp));
703     DONE;
704   }
707 (define_insn "vec_series<mode>"
708   [(set (match_operand:SVE_I 0 "register_operand" "=w, w, w")
709         (vec_series:SVE_I
710           (match_operand:<VEL> 1 "aarch64_sve_index_operand" "Usi, r, r")
711           (match_operand:<VEL> 2 "aarch64_sve_index_operand" "r, Usi, r")))]
712   "TARGET_SVE"
713   "@
714    index\t%0.<Vetype>, #%1, %<vw>2
715    index\t%0.<Vetype>, %<vw>1, #%2
716    index\t%0.<Vetype>, %<vw>1, %<vw>2"
719 ;; Optimize {x, x, x, x, ...} + {0, n, 2*n, 3*n, ...} if n is in range
720 ;; of an INDEX instruction.
721 (define_insn "*vec_series<mode>_plus"
722   [(set (match_operand:SVE_I 0 "register_operand" "=w")
723         (plus:SVE_I
724           (vec_duplicate:SVE_I
725             (match_operand:<VEL> 1 "register_operand" "r"))
726           (match_operand:SVE_I 2 "immediate_operand")))]
727   "TARGET_SVE && aarch64_check_zero_based_sve_index_immediate (operands[2])"
728   {
729     operands[2] = aarch64_check_zero_based_sve_index_immediate (operands[2]);
730     return "index\t%0.<Vetype>, %<vw>1, #%2";
731   }
734 ;; Unpredicated LD[234].
735 (define_expand "vec_load_lanes<mode><vsingle>"
736   [(set (match_operand:SVE_STRUCT 0 "register_operand")
737         (unspec:SVE_STRUCT
738           [(match_dup 2)
739            (match_operand:SVE_STRUCT 1 "memory_operand")]
740           UNSPEC_LDN))]
741   "TARGET_SVE"
742   {
743     operands[2] = force_reg (<VPRED>mode, CONSTM1_RTX (<VPRED>mode));
744   }
747 ;; Predicated LD[234].
748 (define_insn "vec_mask_load_lanes<mode><vsingle>"
749   [(set (match_operand:SVE_STRUCT 0 "register_operand" "=w")
750         (unspec:SVE_STRUCT
751           [(match_operand:<VPRED> 2 "register_operand" "Upl")
752            (match_operand:SVE_STRUCT 1 "memory_operand" "m")]
753           UNSPEC_LDN))]
754   "TARGET_SVE"
755   "ld<vector_count><Vesize>\t%0, %2/z, %1"
758 ;; Unpredicated ST[234].  This is always a full update, so the dependence
759 ;; on the old value of the memory location (via (match_dup 0)) is redundant.
760 ;; There doesn't seem to be any obvious benefit to treating the all-true
761 ;; case differently though.  In particular, it's very unlikely that we'll
762 ;; only find out during RTL that a store_lanes is dead.
763 (define_expand "vec_store_lanes<mode><vsingle>"
764   [(set (match_operand:SVE_STRUCT 0 "memory_operand")
765         (unspec:SVE_STRUCT
766           [(match_dup 2)
767            (match_operand:SVE_STRUCT 1 "register_operand")
768            (match_dup 0)]
769           UNSPEC_STN))]
770   "TARGET_SVE"
771   {
772     operands[2] = force_reg (<VPRED>mode, CONSTM1_RTX (<VPRED>mode));
773   }
776 ;; Predicated ST[234].
777 (define_insn "vec_mask_store_lanes<mode><vsingle>"
778   [(set (match_operand:SVE_STRUCT 0 "memory_operand" "+m")
779         (unspec:SVE_STRUCT
780           [(match_operand:<VPRED> 2 "register_operand" "Upl")
781            (match_operand:SVE_STRUCT 1 "register_operand" "w")
782            (match_dup 0)]
783           UNSPEC_STN))]
784   "TARGET_SVE"
785   "st<vector_count><Vesize>\t%1, %2, %0"
788 (define_expand "vec_perm<mode>"
789   [(match_operand:SVE_ALL 0 "register_operand")
790    (match_operand:SVE_ALL 1 "register_operand")
791    (match_operand:SVE_ALL 2 "register_operand")
792    (match_operand:<V_INT_EQUIV> 3 "aarch64_sve_vec_perm_operand")]
793   "TARGET_SVE && GET_MODE_NUNITS (<MODE>mode).is_constant ()"
794   {
795     aarch64_expand_sve_vec_perm (operands[0], operands[1],
796                                  operands[2], operands[3]);
797     DONE;
798   }
801 (define_insn "*aarch64_sve_tbl<mode>"
802   [(set (match_operand:SVE_ALL 0 "register_operand" "=w")
803         (unspec:SVE_ALL
804           [(match_operand:SVE_ALL 1 "register_operand" "w")
805            (match_operand:<V_INT_EQUIV> 2 "register_operand" "w")]
806           UNSPEC_TBL))]
807   "TARGET_SVE"
808   "tbl\t%0.<Vetype>, %1.<Vetype>, %2.<Vetype>"
811 (define_insn "*aarch64_sve_<perm_insn><perm_hilo><mode>"
812   [(set (match_operand:PRED_ALL 0 "register_operand" "=Upa")
813         (unspec:PRED_ALL [(match_operand:PRED_ALL 1 "register_operand" "Upa")
814                           (match_operand:PRED_ALL 2 "register_operand" "Upa")]
815                          PERMUTE))]
816   "TARGET_SVE"
817   "<perm_insn><perm_hilo>\t%0.<Vetype>, %1.<Vetype>, %2.<Vetype>"
820 (define_insn "aarch64_sve_<perm_insn><perm_hilo><mode>"
821   [(set (match_operand:SVE_ALL 0 "register_operand" "=w")
822         (unspec:SVE_ALL [(match_operand:SVE_ALL 1 "register_operand" "w")
823                          (match_operand:SVE_ALL 2 "register_operand" "w")]
824                         PERMUTE))]
825   "TARGET_SVE"
826   "<perm_insn><perm_hilo>\t%0.<Vetype>, %1.<Vetype>, %2.<Vetype>"
829 (define_insn "*aarch64_sve_rev64<mode>"
830   [(set (match_operand:SVE_BHS 0 "register_operand" "=w")
831         (unspec:SVE_BHS
832           [(match_operand:VNx2BI 1 "register_operand" "Upl")
833            (unspec:SVE_BHS [(match_operand:SVE_BHS 2 "register_operand" "w")]
834                            UNSPEC_REV64)]
835           UNSPEC_MERGE_PTRUE))]
836   "TARGET_SVE"
837   "rev<Vesize>\t%0.d, %1/m, %2.d"
840 (define_insn "*aarch64_sve_rev32<mode>"
841   [(set (match_operand:SVE_BH 0 "register_operand" "=w")
842         (unspec:SVE_BH
843           [(match_operand:VNx4BI 1 "register_operand" "Upl")
844            (unspec:SVE_BH [(match_operand:SVE_BH 2 "register_operand" "w")]
845                           UNSPEC_REV32)]
846           UNSPEC_MERGE_PTRUE))]
847   "TARGET_SVE"
848   "rev<Vesize>\t%0.s, %1/m, %2.s"
851 (define_insn "*aarch64_sve_rev16vnx16qi"
852   [(set (match_operand:VNx16QI 0 "register_operand" "=w")
853         (unspec:VNx16QI
854           [(match_operand:VNx8BI 1 "register_operand" "Upl")
855            (unspec:VNx16QI [(match_operand:VNx16QI 2 "register_operand" "w")]
856                            UNSPEC_REV16)]
857           UNSPEC_MERGE_PTRUE))]
858   "TARGET_SVE"
859   "revb\t%0.h, %1/m, %2.h"
862 (define_insn "*aarch64_sve_rev<mode>"
863   [(set (match_operand:SVE_ALL 0 "register_operand" "=w")
864         (unspec:SVE_ALL [(match_operand:SVE_ALL 1 "register_operand" "w")]
865                         UNSPEC_REV))]
866   "TARGET_SVE"
867   "rev\t%0.<Vetype>, %1.<Vetype>")
869 (define_insn "*aarch64_sve_dup_lane<mode>"
870   [(set (match_operand:SVE_ALL 0 "register_operand" "=w")
871         (vec_duplicate:SVE_ALL
872           (vec_select:<VEL>
873             (match_operand:SVE_ALL 1 "register_operand" "w")
874             (parallel [(match_operand:SI 2 "const_int_operand")]))))]
875   "TARGET_SVE
876    && IN_RANGE (INTVAL (operands[2]) * GET_MODE_SIZE (<VEL>mode), 0, 63)"
877   "dup\t%0.<Vetype>, %1.<Vetype>[%2]"
880 ;; Note that the immediate (third) operand is the lane index not
881 ;; the byte index.
882 (define_insn "*aarch64_sve_ext<mode>"
883   [(set (match_operand:SVE_ALL 0 "register_operand" "=w")
884         (unspec:SVE_ALL [(match_operand:SVE_ALL 1 "register_operand" "0")
885                          (match_operand:SVE_ALL 2 "register_operand" "w")
886                          (match_operand:SI 3 "const_int_operand")]
887                         UNSPEC_EXT))]
888   "TARGET_SVE
889    && IN_RANGE (INTVAL (operands[3]) * GET_MODE_SIZE (<VEL>mode), 0, 255)"
890   {
891     operands[3] = GEN_INT (INTVAL (operands[3]) * GET_MODE_SIZE (<VEL>mode));
892     return "ext\\t%0.b, %0.b, %2.b, #%3";
893   }
896 (define_insn "add<mode>3"
897   [(set (match_operand:SVE_I 0 "register_operand" "=w, w, w, w")
898         (plus:SVE_I
899           (match_operand:SVE_I 1 "register_operand" "%0, 0, 0, w")
900           (match_operand:SVE_I 2 "aarch64_sve_add_operand" "vsa, vsn, vsi, w")))]
901   "TARGET_SVE"
902   "@
903    add\t%0.<Vetype>, %0.<Vetype>, #%D2
904    sub\t%0.<Vetype>, %0.<Vetype>, #%N2
905    * return aarch64_output_sve_inc_dec_immediate (\"%0.<Vetype>\", operands[2]);
906    add\t%0.<Vetype>, %1.<Vetype>, %2.<Vetype>"
909 (define_insn "sub<mode>3"
910   [(set (match_operand:SVE_I 0 "register_operand" "=w, w")
911         (minus:SVE_I
912           (match_operand:SVE_I 1 "aarch64_sve_arith_operand" "w, vsa")
913           (match_operand:SVE_I 2 "register_operand" "w, 0")))]
914   "TARGET_SVE"
915   "@
916    sub\t%0.<Vetype>, %1.<Vetype>, %2.<Vetype>
917    subr\t%0.<Vetype>, %0.<Vetype>, #%D1"
920 ;; Unpredicated multiplication.
921 (define_expand "mul<mode>3"
922   [(set (match_operand:SVE_I 0 "register_operand")
923         (unspec:SVE_I
924           [(match_dup 3)
925            (mult:SVE_I
926              (match_operand:SVE_I 1 "register_operand")
927              (match_operand:SVE_I 2 "aarch64_sve_mul_operand"))]
928           UNSPEC_MERGE_PTRUE))]
929   "TARGET_SVE"
930   {
931     operands[3] = force_reg (<VPRED>mode, CONSTM1_RTX (<VPRED>mode));
932   }
935 ;; Multiplication predicated with a PTRUE.  We don't actually need the
936 ;; predicate for the first alternative, but using Upa or X isn't likely
937 ;; to gain much and would make the instruction seem less uniform to the
938 ;; register allocator.
939 (define_insn "*mul<mode>3"
940   [(set (match_operand:SVE_I 0 "register_operand" "=w, w")
941         (unspec:SVE_I
942           [(match_operand:<VPRED> 1 "register_operand" "Upl, Upl")
943            (mult:SVE_I
944              (match_operand:SVE_I 2 "register_operand" "%0, 0")
945              (match_operand:SVE_I 3 "aarch64_sve_mul_operand" "vsm, w"))]
946           UNSPEC_MERGE_PTRUE))]
947   "TARGET_SVE"
948   "@
949    mul\t%0.<Vetype>, %0.<Vetype>, #%3
950    mul\t%0.<Vetype>, %1/m, %0.<Vetype>, %3.<Vetype>"
953 (define_insn "*madd<mode>"
954   [(set (match_operand:SVE_I 0 "register_operand" "=w, w")
955         (plus:SVE_I
956           (unspec:SVE_I
957             [(match_operand:<VPRED> 1 "register_operand" "Upl, Upl")
958              (mult:SVE_I (match_operand:SVE_I 2 "register_operand" "%0, w")
959                          (match_operand:SVE_I 3 "register_operand" "w, w"))]
960             UNSPEC_MERGE_PTRUE)
961           (match_operand:SVE_I 4 "register_operand" "w, 0")))]
962   "TARGET_SVE"
963   "@
964    mad\t%0.<Vetype>, %1/m, %3.<Vetype>, %4.<Vetype>
965    mla\t%0.<Vetype>, %1/m, %2.<Vetype>, %3.<Vetype>"
968 (define_insn "*msub<mode>3"
969   [(set (match_operand:SVE_I 0 "register_operand" "=w, w")
970         (minus:SVE_I
971           (match_operand:SVE_I 4 "register_operand" "w, 0")
972           (unspec:SVE_I
973             [(match_operand:<VPRED> 1 "register_operand" "Upl, Upl")
974              (mult:SVE_I (match_operand:SVE_I 2 "register_operand" "%0, w")
975                          (match_operand:SVE_I 3 "register_operand" "w, w"))]
976             UNSPEC_MERGE_PTRUE)))]
977   "TARGET_SVE"
978   "@
979    msb\t%0.<Vetype>, %1/m, %3.<Vetype>, %4.<Vetype>
980    mls\t%0.<Vetype>, %1/m, %2.<Vetype>, %3.<Vetype>"
983 ;; Unpredicated highpart multiplication.
984 (define_expand "<su>mul<mode>3_highpart"
985   [(set (match_operand:SVE_I 0 "register_operand")
986         (unspec:SVE_I
987           [(match_dup 3)
988            (unspec:SVE_I [(match_operand:SVE_I 1 "register_operand")
989                           (match_operand:SVE_I 2 "register_operand")]
990                          MUL_HIGHPART)]
991           UNSPEC_MERGE_PTRUE))]
992   "TARGET_SVE"
993   {
994     operands[3] = force_reg (<VPRED>mode, CONSTM1_RTX (<VPRED>mode));
995   }
998 ;; Predicated highpart multiplication.
999 (define_insn "*<su>mul<mode>3_highpart"
1000   [(set (match_operand:SVE_I 0 "register_operand" "=w")
1001         (unspec:SVE_I
1002           [(match_operand:<VPRED> 1 "register_operand" "Upl")
1003            (unspec:SVE_I [(match_operand:SVE_I 2 "register_operand" "%0")
1004                           (match_operand:SVE_I 3 "register_operand" "w")]
1005                          MUL_HIGHPART)]
1006           UNSPEC_MERGE_PTRUE))]
1007   "TARGET_SVE"
1008   "<su>mulh\t%0.<Vetype>, %1/m, %0.<Vetype>, %3.<Vetype>"
1011 ;; Unpredicated NEG, NOT and POPCOUNT.
1012 (define_expand "<optab><mode>2"
1013   [(set (match_operand:SVE_I 0 "register_operand")
1014         (unspec:SVE_I
1015           [(match_dup 2)
1016            (SVE_INT_UNARY:SVE_I (match_operand:SVE_I 1 "register_operand"))]
1017           UNSPEC_MERGE_PTRUE))]
1018   "TARGET_SVE"
1019   {
1020     operands[2] = force_reg (<VPRED>mode, CONSTM1_RTX (<VPRED>mode));
1021   }
1024 ;; NEG, NOT and POPCOUNT predicated with a PTRUE.
1025 (define_insn "*<optab><mode>2"
1026   [(set (match_operand:SVE_I 0 "register_operand" "=w")
1027         (unspec:SVE_I
1028           [(match_operand:<VPRED> 1 "register_operand" "Upl")
1029            (SVE_INT_UNARY:SVE_I
1030              (match_operand:SVE_I 2 "register_operand" "w"))]
1031           UNSPEC_MERGE_PTRUE))]
1032   "TARGET_SVE"
1033   "<sve_int_op>\t%0.<Vetype>, %1/m, %2.<Vetype>"
1036 ;; Vector AND, ORR and XOR.
1037 (define_insn "<optab><mode>3"
1038   [(set (match_operand:SVE_I 0 "register_operand" "=w, w")
1039         (LOGICAL:SVE_I
1040           (match_operand:SVE_I 1 "register_operand" "%0, w")
1041           (match_operand:SVE_I 2 "aarch64_sve_logical_operand" "vsl, w")))]
1042   "TARGET_SVE"
1043   "@
1044    <logical>\t%0.<Vetype>, %0.<Vetype>, #%C2
1045    <logical>\t%0.d, %1.d, %2.d"
1048 ;; Vector AND, ORR and XOR on floating-point modes.  We avoid subregs
1049 ;; by providing this, but we need to use UNSPECs since rtx logical ops
1050 ;; aren't defined for floating-point modes.
1051 (define_insn "*<optab><mode>3"
1052   [(set (match_operand:SVE_F 0 "register_operand" "=w")
1053         (unspec:SVE_F [(match_operand:SVE_F 1 "register_operand" "w")
1054                        (match_operand:SVE_F 2 "register_operand" "w")]
1055                       LOGICALF))]
1056   "TARGET_SVE"
1057   "<logicalf_op>\t%0.d, %1.d, %2.d"
1060 ;; REG_EQUAL notes on "not<mode>3" should ensure that we can generate
1061 ;; this pattern even though the NOT instruction itself is predicated.
1062 (define_insn "bic<mode>3"
1063   [(set (match_operand:SVE_I 0 "register_operand" "=w")
1064         (and:SVE_I
1065           (not:SVE_I (match_operand:SVE_I 1 "register_operand" "w"))
1066           (match_operand:SVE_I 2 "register_operand" "w")))]
1067   "TARGET_SVE"
1068   "bic\t%0.d, %2.d, %1.d"
1071 ;; Predicate AND.  We can reuse one of the inputs as the GP.
1072 (define_insn "and<mode>3"
1073   [(set (match_operand:PRED_ALL 0 "register_operand" "=Upa")
1074         (and:PRED_ALL (match_operand:PRED_ALL 1 "register_operand" "Upa")
1075                       (match_operand:PRED_ALL 2 "register_operand" "Upa")))]
1076   "TARGET_SVE"
1077   "and\t%0.b, %1/z, %1.b, %2.b"
1080 ;; Unpredicated predicate ORR and XOR.
1081 (define_expand "<optab><mode>3"
1082   [(set (match_operand:PRED_ALL 0 "register_operand")
1083         (and:PRED_ALL
1084           (LOGICAL_OR:PRED_ALL
1085             (match_operand:PRED_ALL 1 "register_operand")
1086             (match_operand:PRED_ALL 2 "register_operand"))
1087           (match_dup 3)))]
1088   "TARGET_SVE"
1089   {
1090     operands[3] = force_reg (<MODE>mode, CONSTM1_RTX (<MODE>mode));
1091   }
1094 ;; Predicated predicate ORR and XOR.
1095 (define_insn "pred_<optab><mode>3"
1096   [(set (match_operand:PRED_ALL 0 "register_operand" "=Upa")
1097         (and:PRED_ALL
1098           (LOGICAL:PRED_ALL
1099             (match_operand:PRED_ALL 2 "register_operand" "Upa")
1100             (match_operand:PRED_ALL 3 "register_operand" "Upa"))
1101           (match_operand:PRED_ALL 1 "register_operand" "Upa")))]
1102   "TARGET_SVE"
1103   "<logical>\t%0.b, %1/z, %2.b, %3.b"
1106 ;; Perform a logical operation on operands 2 and 3, using operand 1 as
1107 ;; the GP (which is known to be a PTRUE).  Store the result in operand 0
1108 ;; and set the flags in the same way as for PTEST.  The (and ...) in the
1109 ;; UNSPEC_PTEST_PTRUE is logically redundant, but means that the tested
1110 ;; value is structurally equivalent to rhs of the second set.
1111 (define_insn "*<optab><mode>3_cc"
1112   [(set (reg:CC CC_REGNUM)
1113         (compare:CC
1114           (unspec:SI [(match_operand:PRED_ALL 1 "register_operand" "Upa")
1115                       (and:PRED_ALL
1116                         (LOGICAL:PRED_ALL
1117                           (match_operand:PRED_ALL 2 "register_operand" "Upa")
1118                           (match_operand:PRED_ALL 3 "register_operand" "Upa"))
1119                         (match_dup 1))]
1120                      UNSPEC_PTEST_PTRUE)
1121           (const_int 0)))
1122    (set (match_operand:PRED_ALL 0 "register_operand" "=Upa")
1123         (and:PRED_ALL (LOGICAL:PRED_ALL (match_dup 2) (match_dup 3))
1124                       (match_dup 1)))]
1125   "TARGET_SVE"
1126   "<logical>s\t%0.b, %1/z, %2.b, %3.b"
1129 ;; Unpredicated predicate inverse.
1130 (define_expand "one_cmpl<mode>2"
1131   [(set (match_operand:PRED_ALL 0 "register_operand")
1132         (and:PRED_ALL
1133           (not:PRED_ALL (match_operand:PRED_ALL 1 "register_operand"))
1134           (match_dup 2)))]
1135   "TARGET_SVE"
1136   {
1137     operands[2] = force_reg (<MODE>mode, CONSTM1_RTX (<MODE>mode));
1138   }
1141 ;; Predicated predicate inverse.
1142 (define_insn "*one_cmpl<mode>3"
1143   [(set (match_operand:PRED_ALL 0 "register_operand" "=Upa")
1144         (and:PRED_ALL
1145           (not:PRED_ALL (match_operand:PRED_ALL 2 "register_operand" "Upa"))
1146           (match_operand:PRED_ALL 1 "register_operand" "Upa")))]
1147   "TARGET_SVE"
1148   "not\t%0.b, %1/z, %2.b"
1151 ;; Predicated predicate BIC and ORN.
1152 (define_insn "*<nlogical><mode>3"
1153   [(set (match_operand:PRED_ALL 0 "register_operand" "=Upa")
1154         (and:PRED_ALL
1155           (NLOGICAL:PRED_ALL
1156             (not:PRED_ALL (match_operand:PRED_ALL 2 "register_operand" "Upa"))
1157             (match_operand:PRED_ALL 3 "register_operand" "Upa"))
1158           (match_operand:PRED_ALL 1 "register_operand" "Upa")))]
1159   "TARGET_SVE"
1160   "<nlogical>\t%0.b, %1/z, %3.b, %2.b"
1163 ;; Predicated predicate NAND and NOR.
1164 (define_insn "*<logical_nn><mode>3"
1165   [(set (match_operand:PRED_ALL 0 "register_operand" "=Upa")
1166         (and:PRED_ALL
1167           (NLOGICAL:PRED_ALL
1168             (not:PRED_ALL (match_operand:PRED_ALL 2 "register_operand" "Upa"))
1169             (not:PRED_ALL (match_operand:PRED_ALL 3 "register_operand" "Upa")))
1170           (match_operand:PRED_ALL 1 "register_operand" "Upa")))]
1171   "TARGET_SVE"
1172   "<logical_nn>\t%0.b, %1/z, %2.b, %3.b"
1175 ;; Unpredicated LSL, LSR and ASR by a vector.
1176 (define_expand "v<optab><mode>3"
1177   [(set (match_operand:SVE_I 0 "register_operand")
1178         (unspec:SVE_I
1179           [(match_dup 3)
1180            (ASHIFT:SVE_I
1181              (match_operand:SVE_I 1 "register_operand")
1182              (match_operand:SVE_I 2 "aarch64_sve_<lr>shift_operand"))]
1183           UNSPEC_MERGE_PTRUE))]
1184   "TARGET_SVE"
1185   {
1186     operands[3] = force_reg (<VPRED>mode, CONSTM1_RTX (<VPRED>mode));
1187   }
1190 ;; LSL, LSR and ASR by a vector, predicated with a PTRUE.  We don't
1191 ;; actually need the predicate for the first alternative, but using Upa
1192 ;; or X isn't likely to gain much and would make the instruction seem
1193 ;; less uniform to the register allocator.
1194 (define_insn "*v<optab><mode>3"
1195   [(set (match_operand:SVE_I 0 "register_operand" "=w, w")
1196         (unspec:SVE_I
1197           [(match_operand:<VPRED> 1 "register_operand" "Upl, Upl")
1198            (ASHIFT:SVE_I
1199              (match_operand:SVE_I 2 "register_operand" "w, 0")
1200              (match_operand:SVE_I 3 "aarch64_sve_<lr>shift_operand" "D<lr>, w"))]
1201           UNSPEC_MERGE_PTRUE))]
1202   "TARGET_SVE"
1203   "@
1204    <shift>\t%0.<Vetype>, %2.<Vetype>, #%3
1205    <shift>\t%0.<Vetype>, %1/m, %0.<Vetype>, %3.<Vetype>"
1208 ;; LSL, LSR and ASR by a scalar, which expands into one of the vector
1209 ;; shifts above.
1210 (define_expand "<ASHIFT:optab><mode>3"
1211   [(set (match_operand:SVE_I 0 "register_operand")
1212         (ASHIFT:SVE_I (match_operand:SVE_I 1 "register_operand")
1213                       (match_operand:<VEL> 2 "general_operand")))]
1214   "TARGET_SVE"
1215   {
1216     rtx amount;
1217     if (CONST_INT_P (operands[2]))
1218       {
1219         amount = gen_const_vec_duplicate (<MODE>mode, operands[2]);
1220         if (!aarch64_sve_<lr>shift_operand (operands[2], <MODE>mode))
1221           amount = force_reg (<MODE>mode, amount);
1222       }
1223     else
1224       {
1225         amount = gen_reg_rtx (<MODE>mode);
1226         emit_insn (gen_vec_duplicate<mode> (amount,
1227                                             convert_to_mode (<VEL>mode,
1228                                                              operands[2], 0)));
1229       }
1230     emit_insn (gen_v<optab><mode>3 (operands[0], operands[1], amount));
1231     DONE;
1232   }
1235 ;; Test all bits of operand 1.  Operand 0 is a GP that is known to hold PTRUE.
1237 ;; Using UNSPEC_PTEST_PTRUE allows combine patterns to assume that the GP
1238 ;; is a PTRUE even if the optimizers haven't yet been able to propagate
1239 ;; the constant.  We would use a separate unspec code for PTESTs involving
1240 ;; GPs that might not be PTRUEs.
1241 (define_insn "ptest_ptrue<mode>"
1242   [(set (reg:CC CC_REGNUM)
1243         (compare:CC
1244           (unspec:SI [(match_operand:PRED_ALL 0 "register_operand" "Upa")
1245                       (match_operand:PRED_ALL 1 "register_operand" "Upa")]
1246                      UNSPEC_PTEST_PTRUE)
1247           (const_int 0)))]
1248   "TARGET_SVE"
1249   "ptest\t%0, %1.b"
1252 ;; Set element I of the result if operand1 + J < operand2 for all J in [0, I].
1253 ;; with the comparison being unsigned.
1254 (define_insn "while_ult<GPI:mode><PRED_ALL:mode>"
1255   [(set (match_operand:PRED_ALL 0 "register_operand" "=Upa")
1256         (unspec:PRED_ALL [(match_operand:GPI 1 "aarch64_reg_or_zero" "rZ")
1257                           (match_operand:GPI 2 "aarch64_reg_or_zero" "rZ")]
1258                          UNSPEC_WHILE_LO))
1259    (clobber (reg:CC CC_REGNUM))]
1260   "TARGET_SVE"
1261   "whilelo\t%0.<PRED_ALL:Vetype>, %<w>1, %<w>2"
1264 ;; WHILELO sets the flags in the same way as a PTEST with a PTRUE GP.
1265 ;; Handle the case in which both results are useful.  The GP operand
1266 ;; to the PTEST isn't needed, so we allow it to be anything.
1267 (define_insn_and_split "while_ult<GPI:mode><PRED_ALL:mode>_cc"
1268   [(set (reg:CC CC_REGNUM)
1269         (compare:CC
1270           (unspec:SI [(match_operand:PRED_ALL 1)
1271                       (unspec:PRED_ALL
1272                         [(match_operand:GPI 2 "aarch64_reg_or_zero" "rZ")
1273                          (match_operand:GPI 3 "aarch64_reg_or_zero" "rZ")]
1274                         UNSPEC_WHILE_LO)]
1275                      UNSPEC_PTEST_PTRUE)
1276           (const_int 0)))
1277    (set (match_operand:PRED_ALL 0 "register_operand" "=Upa")
1278         (unspec:PRED_ALL [(match_dup 2)
1279                           (match_dup 3)]
1280                          UNSPEC_WHILE_LO))]
1281   "TARGET_SVE"
1282   "whilelo\t%0.<PRED_ALL:Vetype>, %<w>2, %<w>3"
1283   ;; Force the compiler to drop the unused predicate operand, so that we
1284   ;; don't have an unnecessary PTRUE.
1285   "&& !CONSTANT_P (operands[1])"
1286   [(const_int 0)]
1287   {
1288     emit_insn (gen_while_ult<GPI:mode><PRED_ALL:mode>_cc
1289                (operands[0], CONSTM1_RTX (<MODE>mode),
1290                 operands[2], operands[3]));
1291     DONE;
1292   }
1295 ;; Integer comparisons predicated with a PTRUE.
1296 (define_insn "*cmp<cmp_op><mode>"
1297   [(set (match_operand:<VPRED> 0 "register_operand" "=Upa, Upa")
1298         (unspec:<VPRED>
1299           [(match_operand:<VPRED> 1 "register_operand" "Upl, Upl")
1300            (SVE_INT_CMP:<VPRED>
1301              (match_operand:SVE_I 2 "register_operand" "w, w")
1302              (match_operand:SVE_I 3 "aarch64_sve_cmp_<sve_imm_con>_operand" "<sve_imm_con>, w"))]
1303           UNSPEC_MERGE_PTRUE))
1304    (clobber (reg:CC CC_REGNUM))]
1305   "TARGET_SVE"
1306   "@
1307    cmp<cmp_op>\t%0.<Vetype>, %1/z, %2.<Vetype>, #%3
1308    cmp<cmp_op>\t%0.<Vetype>, %1/z, %2.<Vetype>, %3.<Vetype>"
1311 ;; Integer comparisons predicated with a PTRUE in which only the flags result
1312 ;; is interesting.
1313 (define_insn "*cmp<cmp_op><mode>_ptest"
1314   [(set (reg:CC CC_REGNUM)
1315         (compare:CC
1316           (unspec:SI
1317             [(match_operand:<VPRED> 1 "register_operand" "Upl, Upl")
1318              (unspec:<VPRED>
1319                [(match_dup 1)
1320                 (SVE_INT_CMP:<VPRED>
1321                   (match_operand:SVE_I 2 "register_operand" "w, w")
1322                   (match_operand:SVE_I 3 "aarch64_sve_cmp_<sve_imm_con>_operand" "<sve_imm_con>, w"))]
1323                UNSPEC_MERGE_PTRUE)]
1324             UNSPEC_PTEST_PTRUE)
1325           (const_int 0)))
1326    (clobber (match_scratch:<VPRED> 0 "=Upa, Upa"))]
1327   "TARGET_SVE"
1328   "@
1329    cmp<cmp_op>\t%0.<Vetype>, %1/z, %2.<Vetype>, #%3
1330    cmp<cmp_op>\t%0.<Vetype>, %1/z, %2.<Vetype>, %3.<Vetype>"
1333 ;; Integer comparisons predicated with a PTRUE in which both the flag and
1334 ;; predicate results are interesting.
1335 (define_insn "*cmp<cmp_op><mode>_cc"
1336   [(set (reg:CC CC_REGNUM)
1337         (compare:CC
1338           (unspec:SI
1339             [(match_operand:<VPRED> 1 "register_operand" "Upl, Upl")
1340              (unspec:<VPRED>
1341                [(match_dup 1)
1342                 (SVE_INT_CMP:<VPRED>
1343                   (match_operand:SVE_I 2 "register_operand" "w, w")
1344                   (match_operand:SVE_I 3 "aarch64_sve_cmp_<sve_imm_con>_operand" "<sve_imm_con>, w"))]
1345                UNSPEC_MERGE_PTRUE)]
1346             UNSPEC_PTEST_PTRUE)
1347           (const_int 0)))
1348    (set (match_operand:<VPRED> 0 "register_operand" "=Upa, Upa")
1349         (unspec:<VPRED>
1350           [(match_dup 1)
1351            (SVE_INT_CMP:<VPRED>
1352              (match_dup 2)
1353              (match_dup 3))]
1354           UNSPEC_MERGE_PTRUE))]
1355   "TARGET_SVE"
1356   "@
1357    cmp<cmp_op>\t%0.<Vetype>, %1/z, %2.<Vetype>, #%3
1358    cmp<cmp_op>\t%0.<Vetype>, %1/z, %2.<Vetype>, %3.<Vetype>"
1361 ;; Floating-point comparisons predicated with a PTRUE.
1362 (define_insn "*fcm<cmp_op><mode>"
1363   [(set (match_operand:<VPRED> 0 "register_operand" "=Upa, Upa")
1364         (unspec:<VPRED>
1365           [(match_operand:<VPRED> 1 "register_operand" "Upl, Upl")
1366            (SVE_FP_CMP:<VPRED>
1367              (match_operand:SVE_F 2 "register_operand" "w, w")
1368              (match_operand:SVE_F 3 "aarch64_simd_reg_or_zero" "Dz, w"))]
1369           UNSPEC_MERGE_PTRUE))]
1370   "TARGET_SVE"
1371   "@
1372    fcm<cmp_op>\t%0.<Vetype>, %1/z, %2.<Vetype>, #0.0
1373    fcm<cmp_op>\t%0.<Vetype>, %1/z, %2.<Vetype>, %3.<Vetype>"
1376 (define_insn "*fcmuo<mode>"
1377   [(set (match_operand:<VPRED> 0 "register_operand" "=Upa")
1378         (unspec:<VPRED>
1379           [(match_operand:<VPRED> 1 "register_operand" "Upl")
1380            (unordered:<VPRED>
1381              (match_operand:SVE_F 2 "register_operand" "w")
1382              (match_operand:SVE_F 3 "register_operand" "w"))]
1383           UNSPEC_MERGE_PTRUE))]
1384   "TARGET_SVE"
1385   "fcmuo\t%0.<Vetype>, %1/z, %2.<Vetype>, %3.<Vetype>"
1388 ;; Predicated floating-point comparisons.  We don't need a version
1389 ;; of this for unordered comparisons.
1390 (define_insn "*pred_fcm<cmp_op><mode>"
1391   [(set (match_operand:<VPRED> 0 "register_operand" "=Upa, Upa")
1392         (unspec:<VPRED>
1393           [(match_operand:<VPRED> 1 "register_operand" "Upl, Upl")
1394            (match_operand:SVE_F 2 "register_operand" "w, w")
1395            (match_operand:SVE_F 3 "aarch64_simd_reg_or_zero" "Dz, w")]
1396           SVE_COND_FP_CMP))]
1397   "TARGET_SVE"
1398   "@
1399    fcm<cmp_op>\t%0.<Vetype>, %1/z, %2.<Vetype>, #0.0
1400    fcm<cmp_op>\t%0.<Vetype>, %1/z, %2.<Vetype>, %3.<Vetype>"
1403 ;; vcond_mask operand order: true, false, mask
1404 ;; UNSPEC_SEL operand order: mask, true, false (as for VEC_COND_EXPR)
1405 ;; SEL operand order:        mask, true, false
1406 (define_insn "vcond_mask_<mode><vpred>"
1407   [(set (match_operand:SVE_ALL 0 "register_operand" "=w")
1408         (unspec:SVE_ALL
1409           [(match_operand:<VPRED> 3 "register_operand" "Upa")
1410            (match_operand:SVE_ALL 1 "register_operand" "w")
1411            (match_operand:SVE_ALL 2 "register_operand" "w")]
1412           UNSPEC_SEL))]
1413   "TARGET_SVE"
1414   "sel\t%0.<Vetype>, %3, %1.<Vetype>, %2.<Vetype>"
1417 ;; Selects between a duplicated immediate and zero.
1418 (define_insn "aarch64_sve_dup<mode>_const"
1419   [(set (match_operand:SVE_I 0 "register_operand" "=w")
1420         (unspec:SVE_I
1421           [(match_operand:<VPRED> 1 "register_operand" "Upl")
1422            (match_operand:SVE_I 2 "aarch64_sve_dup_immediate")
1423            (match_operand:SVE_I 3 "aarch64_simd_imm_zero")]
1424           UNSPEC_SEL))]
1425   "TARGET_SVE"
1426   "mov\t%0.<Vetype>, %1/z, #%2"
1429 ;; Integer (signed) vcond.  Don't enforce an immediate range here, since it
1430 ;; depends on the comparison; leave it to aarch64_expand_sve_vcond instead.
1431 (define_expand "vcond<mode><v_int_equiv>"
1432   [(set (match_operand:SVE_ALL 0 "register_operand")
1433         (if_then_else:SVE_ALL
1434           (match_operator 3 "comparison_operator"
1435             [(match_operand:<V_INT_EQUIV> 4 "register_operand")
1436              (match_operand:<V_INT_EQUIV> 5 "nonmemory_operand")])
1437           (match_operand:SVE_ALL 1 "register_operand")
1438           (match_operand:SVE_ALL 2 "register_operand")))]
1439   "TARGET_SVE"
1440   {
1441     aarch64_expand_sve_vcond (<MODE>mode, <V_INT_EQUIV>mode, operands);
1442     DONE;
1443   }
1446 ;; Integer vcondu.  Don't enforce an immediate range here, since it
1447 ;; depends on the comparison; leave it to aarch64_expand_sve_vcond instead.
1448 (define_expand "vcondu<mode><v_int_equiv>"
1449   [(set (match_operand:SVE_ALL 0 "register_operand")
1450         (if_then_else:SVE_ALL
1451           (match_operator 3 "comparison_operator"
1452             [(match_operand:<V_INT_EQUIV> 4 "register_operand")
1453              (match_operand:<V_INT_EQUIV> 5 "nonmemory_operand")])
1454           (match_operand:SVE_ALL 1 "register_operand")
1455           (match_operand:SVE_ALL 2 "register_operand")))]
1456   "TARGET_SVE"
1457   {
1458     aarch64_expand_sve_vcond (<MODE>mode, <V_INT_EQUIV>mode, operands);
1459     DONE;
1460   }
1463 ;; Floating-point vcond.  All comparisons except FCMUO allow a zero
1464 ;; operand; aarch64_expand_sve_vcond handles the case of an FCMUO
1465 ;; with zero.
1466 (define_expand "vcond<mode><v_fp_equiv>"
1467   [(set (match_operand:SVE_SD 0 "register_operand")
1468         (if_then_else:SVE_SD
1469           (match_operator 3 "comparison_operator"
1470             [(match_operand:<V_FP_EQUIV> 4 "register_operand")
1471              (match_operand:<V_FP_EQUIV> 5 "aarch64_simd_reg_or_zero")])
1472           (match_operand:SVE_SD 1 "register_operand")
1473           (match_operand:SVE_SD 2 "register_operand")))]
1474   "TARGET_SVE"
1475   {
1476     aarch64_expand_sve_vcond (<MODE>mode, <V_FP_EQUIV>mode, operands);
1477     DONE;
1478   }
1481 ;; Signed integer comparisons.  Don't enforce an immediate range here, since
1482 ;; it depends on the comparison; leave it to aarch64_expand_sve_vec_cmp_int
1483 ;; instead.
1484 (define_expand "vec_cmp<mode><vpred>"
1485   [(parallel
1486     [(set (match_operand:<VPRED> 0 "register_operand")
1487           (match_operator:<VPRED> 1 "comparison_operator"
1488             [(match_operand:SVE_I 2 "register_operand")
1489              (match_operand:SVE_I 3 "nonmemory_operand")]))
1490      (clobber (reg:CC CC_REGNUM))])]
1491   "TARGET_SVE"
1492   {
1493     aarch64_expand_sve_vec_cmp_int (operands[0], GET_CODE (operands[1]),
1494                                     operands[2], operands[3]);
1495     DONE;
1496   }
1499 ;; Unsigned integer comparisons.  Don't enforce an immediate range here, since
1500 ;; it depends on the comparison; leave it to aarch64_expand_sve_vec_cmp_int
1501 ;; instead.
1502 (define_expand "vec_cmpu<mode><vpred>"
1503   [(parallel
1504     [(set (match_operand:<VPRED> 0 "register_operand")
1505           (match_operator:<VPRED> 1 "comparison_operator"
1506             [(match_operand:SVE_I 2 "register_operand")
1507              (match_operand:SVE_I 3 "nonmemory_operand")]))
1508      (clobber (reg:CC CC_REGNUM))])]
1509   "TARGET_SVE"
1510   {
1511     aarch64_expand_sve_vec_cmp_int (operands[0], GET_CODE (operands[1]),
1512                                     operands[2], operands[3]);
1513     DONE;
1514   }
1517 ;; Floating-point comparisons.  All comparisons except FCMUO allow a zero
1518 ;; operand; aarch64_expand_sve_vec_cmp_float handles the case of an FCMUO
1519 ;; with zero.
1520 (define_expand "vec_cmp<mode><vpred>"
1521   [(set (match_operand:<VPRED> 0 "register_operand")
1522         (match_operator:<VPRED> 1 "comparison_operator"
1523           [(match_operand:SVE_F 2 "register_operand")
1524            (match_operand:SVE_F 3 "aarch64_simd_reg_or_zero")]))]
1525   "TARGET_SVE"
1526   {
1527     aarch64_expand_sve_vec_cmp_float (operands[0], GET_CODE (operands[1]),
1528                                       operands[2], operands[3], false);
1529     DONE;
1530   }
1533 ;; Branch based on predicate equality or inequality.
1534 (define_expand "cbranch<mode>4"
1535   [(set (pc)
1536         (if_then_else
1537           (match_operator 0 "aarch64_equality_operator"
1538             [(match_operand:PRED_ALL 1 "register_operand")
1539              (match_operand:PRED_ALL 2 "aarch64_simd_reg_or_zero")])
1540           (label_ref (match_operand 3 ""))
1541           (pc)))]
1542   ""
1543   {
1544     rtx ptrue = force_reg (<MODE>mode, CONSTM1_RTX (<MODE>mode));
1545     rtx pred;
1546     if (operands[2] == CONST0_RTX (<MODE>mode))
1547       pred = operands[1];
1548     else
1549       {
1550         pred = gen_reg_rtx (<MODE>mode);
1551         emit_insn (gen_pred_xor<mode>3 (pred, ptrue, operands[1],
1552                                         operands[2]));
1553       }
1554     emit_insn (gen_ptest_ptrue<mode> (ptrue, pred));
1555     operands[1] = gen_rtx_REG (CCmode, CC_REGNUM);
1556     operands[2] = const0_rtx;
1557   }
1560 ;; Unpredicated integer MIN/MAX.
1561 (define_expand "<su><maxmin><mode>3"
1562   [(set (match_operand:SVE_I 0 "register_operand")
1563         (unspec:SVE_I
1564           [(match_dup 3)
1565            (MAXMIN:SVE_I (match_operand:SVE_I 1 "register_operand")
1566                          (match_operand:SVE_I 2 "register_operand"))]
1567           UNSPEC_MERGE_PTRUE))]
1568   "TARGET_SVE"
1569   {
1570     operands[3] = force_reg (<VPRED>mode, CONSTM1_RTX (<VPRED>mode));
1571   }
1574 ;; Integer MIN/MAX predicated with a PTRUE.
1575 (define_insn "*<su><maxmin><mode>3"
1576   [(set (match_operand:SVE_I 0 "register_operand" "=w")
1577         (unspec:SVE_I
1578           [(match_operand:<VPRED> 1 "register_operand" "Upl")
1579            (MAXMIN:SVE_I (match_operand:SVE_I 2 "register_operand" "%0")
1580                          (match_operand:SVE_I 3 "register_operand" "w"))]
1581           UNSPEC_MERGE_PTRUE))]
1582   "TARGET_SVE"
1583   "<su><maxmin>\t%0.<Vetype>, %1/m, %0.<Vetype>, %3.<Vetype>"
1586 ;; Unpredicated floating-point MIN/MAX.
1587 (define_expand "<su><maxmin><mode>3"
1588   [(set (match_operand:SVE_F 0 "register_operand")
1589         (unspec:SVE_F
1590           [(match_dup 3)
1591            (FMAXMIN:SVE_F (match_operand:SVE_F 1 "register_operand")
1592                           (match_operand:SVE_F 2 "register_operand"))]
1593           UNSPEC_MERGE_PTRUE))]
1594   "TARGET_SVE"
1595   {
1596     operands[3] = force_reg (<VPRED>mode, CONSTM1_RTX (<VPRED>mode));
1597   }
1600 ;; Floating-point MIN/MAX predicated with a PTRUE.
1601 (define_insn "*<su><maxmin><mode>3"
1602   [(set (match_operand:SVE_F 0 "register_operand" "=w")
1603         (unspec:SVE_F
1604           [(match_operand:<VPRED> 1 "register_operand" "Upl")
1605            (FMAXMIN:SVE_F (match_operand:SVE_F 2 "register_operand" "%0")
1606                           (match_operand:SVE_F 3 "register_operand" "w"))]
1607           UNSPEC_MERGE_PTRUE))]
1608   "TARGET_SVE"
1609   "f<maxmin>nm\t%0.<Vetype>, %1/m, %0.<Vetype>, %3.<Vetype>"
1612 ;; Unpredicated fmin/fmax.
1613 (define_expand "<maxmin_uns><mode>3"
1614   [(set (match_operand:SVE_F 0 "register_operand")
1615         (unspec:SVE_F
1616           [(match_dup 3)
1617            (unspec:SVE_F [(match_operand:SVE_F 1 "register_operand")
1618                           (match_operand:SVE_F 2 "register_operand")]
1619                          FMAXMIN_UNS)]
1620           UNSPEC_MERGE_PTRUE))]
1621   "TARGET_SVE"
1622   {
1623     operands[3] = force_reg (<VPRED>mode, CONSTM1_RTX (<VPRED>mode));
1624   }
1627 ;; fmin/fmax predicated with a PTRUE.
1628 (define_insn "*<maxmin_uns><mode>3"
1629   [(set (match_operand:SVE_F 0 "register_operand" "=w")
1630         (unspec:SVE_F
1631           [(match_operand:<VPRED> 1 "register_operand" "Upl")
1632            (unspec:SVE_F [(match_operand:SVE_F 2 "register_operand" "%0")
1633                           (match_operand:SVE_F 3 "register_operand" "w")]
1634                          FMAXMIN_UNS)]
1635           UNSPEC_MERGE_PTRUE))]
1636   "TARGET_SVE"
1637   "<maxmin_uns_op>\t%0.<Vetype>, %1/m, %0.<Vetype>, %3.<Vetype>"
1640 ;; Predicated integer operations.
1641 (define_insn "cond_<optab><mode>"
1642   [(set (match_operand:SVE_I 0 "register_operand" "=w")
1643         (unspec:SVE_I
1644           [(match_operand:<VPRED> 1 "register_operand" "Upl")
1645            (match_operand:SVE_I 2 "register_operand" "0")
1646            (match_operand:SVE_I 3 "register_operand" "w")]
1647           SVE_COND_INT_OP))]
1648   "TARGET_SVE"
1649   "<sve_int_op>\t%0.<Vetype>, %1/m, %0.<Vetype>, %3.<Vetype>"
1652 ;; Set operand 0 to the last active element in operand 3, or to tied
1653 ;; operand 1 if no elements are active.
1654 (define_insn "fold_extract_last_<mode>"
1655   [(set (match_operand:<VEL> 0 "register_operand" "=r, w")
1656         (unspec:<VEL>
1657           [(match_operand:<VEL> 1 "register_operand" "0, 0")
1658            (match_operand:<VPRED> 2 "register_operand" "Upl, Upl")
1659            (match_operand:SVE_ALL 3 "register_operand" "w, w")]
1660           UNSPEC_CLASTB))]
1661   "TARGET_SVE"
1662   "@
1663    clastb\t%<vwcore>0, %2, %<vwcore>0, %3.<Vetype>
1664    clastb\t%<vw>0, %2, %<vw>0, %3.<Vetype>"
1667 ;; Unpredicated integer add reduction.
1668 (define_expand "reduc_plus_scal_<mode>"
1669   [(set (match_operand:<VEL> 0 "register_operand")
1670         (unspec:<VEL> [(match_dup 2)
1671                        (match_operand:SVE_I 1 "register_operand")]
1672                       UNSPEC_ADDV))]
1673   "TARGET_SVE"
1674   {
1675     operands[2] = force_reg (<VPRED>mode, CONSTM1_RTX (<VPRED>mode));
1676   }
1679 ;; Predicated integer add reduction.  The result is always 64-bits.
1680 (define_insn "*reduc_plus_scal_<mode>"
1681   [(set (match_operand:<VEL> 0 "register_operand" "=w")
1682         (unspec:<VEL> [(match_operand:<VPRED> 1 "register_operand" "Upl")
1683                        (match_operand:SVE_I 2 "register_operand" "w")]
1684                       UNSPEC_ADDV))]
1685   "TARGET_SVE"
1686   "uaddv\t%d0, %1, %2.<Vetype>"
1689 ;; Unpredicated floating-point add reduction.
1690 (define_expand "reduc_plus_scal_<mode>"
1691   [(set (match_operand:<VEL> 0 "register_operand")
1692         (unspec:<VEL> [(match_dup 2)
1693                        (match_operand:SVE_F 1 "register_operand")]
1694                       UNSPEC_FADDV))]
1695   "TARGET_SVE"
1696   {
1697     operands[2] = force_reg (<VPRED>mode, CONSTM1_RTX (<VPRED>mode));
1698   }
1701 ;; Predicated floating-point add reduction.
1702 (define_insn "*reduc_plus_scal_<mode>"
1703   [(set (match_operand:<VEL> 0 "register_operand" "=w")
1704         (unspec:<VEL> [(match_operand:<VPRED> 1 "register_operand" "Upl")
1705                        (match_operand:SVE_F 2 "register_operand" "w")]
1706                       UNSPEC_FADDV))]
1707   "TARGET_SVE"
1708   "faddv\t%<Vetype>0, %1, %2.<Vetype>"
1711 ;; Unpredicated integer MIN/MAX reduction.
1712 (define_expand "reduc_<maxmin_uns>_scal_<mode>"
1713   [(set (match_operand:<VEL> 0 "register_operand")
1714         (unspec:<VEL> [(match_dup 2)
1715                        (match_operand:SVE_I 1 "register_operand")]
1716                       MAXMINV))]
1717   "TARGET_SVE"
1718   {
1719     operands[2] = force_reg (<VPRED>mode, CONSTM1_RTX (<VPRED>mode));
1720   }
1723 ;; Predicated integer MIN/MAX reduction.
1724 (define_insn "*reduc_<maxmin_uns>_scal_<mode>"
1725   [(set (match_operand:<VEL> 0 "register_operand" "=w")
1726         (unspec:<VEL> [(match_operand:<VPRED> 1 "register_operand" "Upl")
1727                        (match_operand:SVE_I 2 "register_operand" "w")]
1728                       MAXMINV))]
1729   "TARGET_SVE"
1730   "<maxmin_uns_op>v\t%<Vetype>0, %1, %2.<Vetype>"
1733 ;; Unpredicated floating-point MIN/MAX reduction.
1734 (define_expand "reduc_<maxmin_uns>_scal_<mode>"
1735   [(set (match_operand:<VEL> 0 "register_operand")
1736         (unspec:<VEL> [(match_dup 2)
1737                        (match_operand:SVE_F 1 "register_operand")]
1738                       FMAXMINV))]
1739   "TARGET_SVE"
1740   {
1741     operands[2] = force_reg (<VPRED>mode, CONSTM1_RTX (<VPRED>mode));
1742   }
1745 ;; Predicated floating-point MIN/MAX reduction.
1746 (define_insn "*reduc_<maxmin_uns>_scal_<mode>"
1747   [(set (match_operand:<VEL> 0 "register_operand" "=w")
1748         (unspec:<VEL> [(match_operand:<VPRED> 1 "register_operand" "Upl")
1749                        (match_operand:SVE_F 2 "register_operand" "w")]
1750                       FMAXMINV))]
1751   "TARGET_SVE"
1752   "<maxmin_uns_op>v\t%<Vetype>0, %1, %2.<Vetype>"
1755 (define_expand "reduc_<optab>_scal_<mode>"
1756   [(set (match_operand:<VEL> 0 "register_operand")
1757         (unspec:<VEL> [(match_dup 2)
1758                        (match_operand:SVE_I 1 "register_operand")]
1759                       BITWISEV))]
1760   "TARGET_SVE"
1761   {
1762     operands[2] = force_reg (<VPRED>mode, CONSTM1_RTX (<VPRED>mode));
1763   }
1766 (define_insn "*reduc_<optab>_scal_<mode>"
1767   [(set (match_operand:<VEL> 0 "register_operand" "=w")
1768         (unspec:<VEL> [(match_operand:<VPRED> 1 "register_operand" "Upl")
1769                        (match_operand:SVE_I 2 "register_operand" "w")]
1770                       BITWISEV))]
1771   "TARGET_SVE"
1772   "<bit_reduc_op>\t%<Vetype>0, %1, %2.<Vetype>"
1775 ;; Unpredicated in-order FP reductions.
1776 (define_expand "fold_left_plus_<mode>"
1777   [(set (match_operand:<VEL> 0 "register_operand")
1778         (unspec:<VEL> [(match_dup 3)
1779                        (match_operand:<VEL> 1 "register_operand")
1780                        (match_operand:SVE_F 2 "register_operand")]
1781                       UNSPEC_FADDA))]
1782   "TARGET_SVE"
1783   {
1784     operands[3] = force_reg (<VPRED>mode, CONSTM1_RTX (<VPRED>mode));
1785   }
1788 ;; In-order FP reductions predicated with PTRUE.
1789 (define_insn "*fold_left_plus_<mode>"
1790   [(set (match_operand:<VEL> 0 "register_operand" "=w")
1791         (unspec:<VEL> [(match_operand:<VPRED> 1 "register_operand" "Upl")
1792                        (match_operand:<VEL> 2 "register_operand" "0")
1793                        (match_operand:SVE_F 3 "register_operand" "w")]
1794                       UNSPEC_FADDA))]
1795   "TARGET_SVE"
1796   "fadda\t%<Vetype>0, %1, %<Vetype>0, %3.<Vetype>"
1799 ;; Predicated form of the above in-order reduction.
1800 (define_insn "*pred_fold_left_plus_<mode>"
1801   [(set (match_operand:<VEL> 0 "register_operand" "=w")
1802         (unspec:<VEL>
1803           [(match_operand:<VEL> 1 "register_operand" "0")
1804            (unspec:SVE_F
1805              [(match_operand:<VPRED> 2 "register_operand" "Upl")
1806               (match_operand:SVE_F 3 "register_operand" "w")
1807               (match_operand:SVE_F 4 "aarch64_simd_imm_zero")]
1808              UNSPEC_SEL)]
1809           UNSPEC_FADDA))]
1810   "TARGET_SVE"
1811   "fadda\t%<Vetype>0, %2, %<Vetype>0, %3.<Vetype>"
1814 ;; Unpredicated floating-point addition.
1815 (define_expand "add<mode>3"
1816   [(set (match_operand:SVE_F 0 "register_operand")
1817         (unspec:SVE_F
1818           [(match_dup 3)
1819            (plus:SVE_F
1820              (match_operand:SVE_F 1 "register_operand")
1821              (match_operand:SVE_F 2 "aarch64_sve_float_arith_with_sub_operand"))]
1822           UNSPEC_MERGE_PTRUE))]
1823   "TARGET_SVE"
1824   {
1825     operands[3] = force_reg (<VPRED>mode, CONSTM1_RTX (<VPRED>mode));
1826   }
1829 ;; Floating-point addition predicated with a PTRUE.
1830 (define_insn "*add<mode>3"
1831   [(set (match_operand:SVE_F 0 "register_operand" "=w, w, w")
1832         (unspec:SVE_F
1833           [(match_operand:<VPRED> 1 "register_operand" "Upl, Upl, Upl")
1834            (plus:SVE_F
1835               (match_operand:SVE_F 2 "register_operand" "%0, 0, w")
1836               (match_operand:SVE_F 3 "aarch64_sve_float_arith_with_sub_operand" "vsA, vsN, w"))]
1837           UNSPEC_MERGE_PTRUE))]
1838   "TARGET_SVE"
1839   "@
1840    fadd\t%0.<Vetype>, %1/m, %0.<Vetype>, #%3
1841    fsub\t%0.<Vetype>, %1/m, %0.<Vetype>, #%N3
1842    fadd\t%0.<Vetype>, %2.<Vetype>, %3.<Vetype>"
1845 ;; Unpredicated floating-point subtraction.
1846 (define_expand "sub<mode>3"
1847   [(set (match_operand:SVE_F 0 "register_operand")
1848         (unspec:SVE_F
1849           [(match_dup 3)
1850            (minus:SVE_F
1851              (match_operand:SVE_F 1 "aarch64_sve_float_arith_operand")
1852              (match_operand:SVE_F 2 "register_operand"))]
1853           UNSPEC_MERGE_PTRUE))]
1854   "TARGET_SVE"
1855   {
1856     operands[3] = force_reg (<VPRED>mode, CONSTM1_RTX (<VPRED>mode));
1857   }
1860 ;; Floating-point subtraction predicated with a PTRUE.
1861 (define_insn "*sub<mode>3"
1862   [(set (match_operand:SVE_F 0 "register_operand" "=w, w, w, w")
1863         (unspec:SVE_F
1864           [(match_operand:<VPRED> 1 "register_operand" "Upl, Upl, Upl, Upl")
1865            (minus:SVE_F
1866              (match_operand:SVE_F 2 "aarch64_sve_float_arith_operand" "0, 0, vsA, w")
1867              (match_operand:SVE_F 3 "aarch64_sve_float_arith_with_sub_operand" "vsA, vsN, 0, w"))]
1868           UNSPEC_MERGE_PTRUE))]
1869   "TARGET_SVE
1870    && (register_operand (operands[2], <MODE>mode)
1871        || register_operand (operands[3], <MODE>mode))"
1872   "@
1873    fsub\t%0.<Vetype>, %1/m, %0.<Vetype>, #%3
1874    fadd\t%0.<Vetype>, %1/m, %0.<Vetype>, #%N3
1875    fsubr\t%0.<Vetype>, %1/m, %0.<Vetype>, #%2
1876    fsub\t%0.<Vetype>, %2.<Vetype>, %3.<Vetype>"
1879 ;; Unpredicated floating-point multiplication.
1880 (define_expand "mul<mode>3"
1881   [(set (match_operand:SVE_F 0 "register_operand")
1882         (unspec:SVE_F
1883           [(match_dup 3)
1884            (mult:SVE_F
1885              (match_operand:SVE_F 1 "register_operand")
1886              (match_operand:SVE_F 2 "aarch64_sve_float_mul_operand"))]
1887           UNSPEC_MERGE_PTRUE))]
1888   "TARGET_SVE"
1889   {
1890     operands[3] = force_reg (<VPRED>mode, CONSTM1_RTX (<VPRED>mode));
1891   }
1894 ;; Floating-point multiplication predicated with a PTRUE.
1895 (define_insn "*mul<mode>3"
1896   [(set (match_operand:SVE_F 0 "register_operand" "=w, w")
1897         (unspec:SVE_F
1898           [(match_operand:<VPRED> 1 "register_operand" "Upl, Upl")
1899            (mult:SVE_F
1900              (match_operand:SVE_F 2 "register_operand" "%0, w")
1901              (match_operand:SVE_F 3 "aarch64_sve_float_mul_operand" "vsM, w"))]
1902           UNSPEC_MERGE_PTRUE))]
1903   "TARGET_SVE"
1904   "@
1905    fmul\t%0.<Vetype>, %1/m, %0.<Vetype>, #%3
1906    fmul\t%0.<Vetype>, %2.<Vetype>, %3.<Vetype>"
1909 ;; Unpredicated fma (%0 = (%1 * %2) + %3).
1910 (define_expand "fma<mode>4"
1911   [(set (match_operand:SVE_F 0 "register_operand")
1912         (unspec:SVE_F
1913           [(match_dup 4)
1914            (fma:SVE_F (match_operand:SVE_F 1 "register_operand")
1915                       (match_operand:SVE_F 2 "register_operand")
1916                       (match_operand:SVE_F 3 "register_operand"))]
1917           UNSPEC_MERGE_PTRUE))]
1918   "TARGET_SVE"
1919   {
1920     operands[4] = force_reg (<VPRED>mode, CONSTM1_RTX (<VPRED>mode));
1921   }
1924 ;; fma predicated with a PTRUE.
1925 (define_insn "*fma<mode>4"
1926   [(set (match_operand:SVE_F 0 "register_operand" "=w, w")
1927         (unspec:SVE_F
1928           [(match_operand:<VPRED> 1 "register_operand" "Upl, Upl")
1929            (fma:SVE_F (match_operand:SVE_F 3 "register_operand" "%0, w")
1930                       (match_operand:SVE_F 4 "register_operand" "w, w")
1931                       (match_operand:SVE_F 2 "register_operand" "w, 0"))]
1932           UNSPEC_MERGE_PTRUE))]
1933   "TARGET_SVE"
1934   "@
1935    fmad\t%0.<Vetype>, %1/m, %4.<Vetype>, %2.<Vetype>
1936    fmla\t%0.<Vetype>, %1/m, %3.<Vetype>, %4.<Vetype>"
1939 ;; Unpredicated fnma (%0 = (-%1 * %2) + %3).
1940 (define_expand "fnma<mode>4"
1941   [(set (match_operand:SVE_F 0 "register_operand")
1942         (unspec:SVE_F
1943           [(match_dup 4)
1944            (fma:SVE_F (neg:SVE_F
1945                         (match_operand:SVE_F 1 "register_operand"))
1946                       (match_operand:SVE_F 2 "register_operand")
1947                       (match_operand:SVE_F 3 "register_operand"))]
1948           UNSPEC_MERGE_PTRUE))]
1949   "TARGET_SVE"
1950   {
1951     operands[4] = force_reg (<VPRED>mode, CONSTM1_RTX (<VPRED>mode));
1952   }
1955 ;; fnma predicated with a PTRUE.
1956 (define_insn "*fnma<mode>4"
1957   [(set (match_operand:SVE_F 0 "register_operand" "=w, w")
1958         (unspec:SVE_F
1959           [(match_operand:<VPRED> 1 "register_operand" "Upl, Upl")
1960            (fma:SVE_F (neg:SVE_F
1961                         (match_operand:SVE_F 3 "register_operand" "%0, w"))
1962                       (match_operand:SVE_F 4 "register_operand" "w, w")
1963                       (match_operand:SVE_F 2 "register_operand" "w, 0"))]
1964           UNSPEC_MERGE_PTRUE))]
1965   "TARGET_SVE"
1966   "@
1967    fmsb\t%0.<Vetype>, %1/m, %4.<Vetype>, %2.<Vetype>
1968    fmls\t%0.<Vetype>, %1/m, %3.<Vetype>, %4.<Vetype>"
1971 ;; Unpredicated fms (%0 = (%1 * %2) - %3).
1972 (define_expand "fms<mode>4"
1973   [(set (match_operand:SVE_F 0 "register_operand")
1974         (unspec:SVE_F
1975           [(match_dup 4)
1976            (fma:SVE_F (match_operand:SVE_F 1 "register_operand")
1977                       (match_operand:SVE_F 2 "register_operand")
1978                       (neg:SVE_F
1979                         (match_operand:SVE_F 3 "register_operand")))]
1980           UNSPEC_MERGE_PTRUE))]
1981   "TARGET_SVE"
1982   {
1983     operands[4] = force_reg (<VPRED>mode, CONSTM1_RTX (<VPRED>mode));
1984   }
1987 ;; fms predicated with a PTRUE.
1988 (define_insn "*fms<mode>4"
1989   [(set (match_operand:SVE_F 0 "register_operand" "=w, w")
1990         (unspec:SVE_F
1991           [(match_operand:<VPRED> 1 "register_operand" "Upl, Upl")
1992            (fma:SVE_F (match_operand:SVE_F 3 "register_operand" "%0, w")
1993                       (match_operand:SVE_F 4 "register_operand" "w, w")
1994                       (neg:SVE_F
1995                         (match_operand:SVE_F 2 "register_operand" "w, 0")))]
1996           UNSPEC_MERGE_PTRUE))]
1997   "TARGET_SVE"
1998   "@
1999    fnmsb\t%0.<Vetype>, %1/m, %4.<Vetype>, %2.<Vetype>
2000    fnmls\t%0.<Vetype>, %1/m, %3.<Vetype>, %4.<Vetype>"
2003 ;; Unpredicated fnms (%0 = (-%1 * %2) - %3).
2004 (define_expand "fnms<mode>4"
2005   [(set (match_operand:SVE_F 0 "register_operand")
2006         (unspec:SVE_F
2007           [(match_dup 4)
2008            (fma:SVE_F (neg:SVE_F
2009                         (match_operand:SVE_F 1 "register_operand"))
2010                       (match_operand:SVE_F 2 "register_operand")
2011                       (neg:SVE_F
2012                         (match_operand:SVE_F 3 "register_operand")))]
2013           UNSPEC_MERGE_PTRUE))]
2014   "TARGET_SVE"
2015   {
2016     operands[4] = force_reg (<VPRED>mode, CONSTM1_RTX (<VPRED>mode));
2017   }
2020 ;; fnms predicated with a PTRUE.
2021 (define_insn "*fnms<mode>4"
2022   [(set (match_operand:SVE_F 0 "register_operand" "=w, w")
2023         (unspec:SVE_F
2024           [(match_operand:<VPRED> 1 "register_operand" "Upl, Upl")
2025            (fma:SVE_F (neg:SVE_F
2026                         (match_operand:SVE_F 3 "register_operand" "%0, w"))
2027                       (match_operand:SVE_F 4 "register_operand" "w, w")
2028                       (neg:SVE_F
2029                         (match_operand:SVE_F 2 "register_operand" "w, 0")))]
2030           UNSPEC_MERGE_PTRUE))]
2031   "TARGET_SVE"
2032   "@
2033    fnmad\t%0.<Vetype>, %1/m, %4.<Vetype>, %2.<Vetype>
2034    fnmla\t%0.<Vetype>, %1/m, %3.<Vetype>, %4.<Vetype>"
2037 ;; Unpredicated floating-point division.
2038 (define_expand "div<mode>3"
2039   [(set (match_operand:SVE_F 0 "register_operand")
2040         (unspec:SVE_F
2041           [(match_dup 3)
2042            (div:SVE_F (match_operand:SVE_F 1 "register_operand")
2043                       (match_operand:SVE_F 2 "register_operand"))]
2044           UNSPEC_MERGE_PTRUE))]
2045   "TARGET_SVE"
2046   {
2047     operands[3] = force_reg (<VPRED>mode, CONSTM1_RTX (<VPRED>mode));
2048   }
2051 ;; Floating-point division predicated with a PTRUE.
2052 (define_insn "*div<mode>3"
2053   [(set (match_operand:SVE_F 0 "register_operand" "=w, w")
2054         (unspec:SVE_F
2055           [(match_operand:<VPRED> 1 "register_operand" "Upl, Upl")
2056            (div:SVE_F (match_operand:SVE_F 2 "register_operand" "0, w")
2057                       (match_operand:SVE_F 3 "register_operand" "w, 0"))]
2058           UNSPEC_MERGE_PTRUE))]
2059   "TARGET_SVE"
2060   "@
2061    fdiv\t%0.<Vetype>, %1/m, %0.<Vetype>, %3.<Vetype>
2062    fdivr\t%0.<Vetype>, %1/m, %0.<Vetype>, %2.<Vetype>"
2065 ;; Unpredicated FNEG, FABS and FSQRT.
2066 (define_expand "<optab><mode>2"
2067   [(set (match_operand:SVE_F 0 "register_operand")
2068         (unspec:SVE_F
2069           [(match_dup 2)
2070            (SVE_FP_UNARY:SVE_F (match_operand:SVE_F 1 "register_operand"))]
2071           UNSPEC_MERGE_PTRUE))]
2072   "TARGET_SVE"
2073   {
2074     operands[2] = force_reg (<VPRED>mode, CONSTM1_RTX (<VPRED>mode));
2075   }
2078 ;; FNEG, FABS and FSQRT predicated with a PTRUE.
2079 (define_insn "*<optab><mode>2"
2080   [(set (match_operand:SVE_F 0 "register_operand" "=w")
2081         (unspec:SVE_F
2082           [(match_operand:<VPRED> 1 "register_operand" "Upl")
2083            (SVE_FP_UNARY:SVE_F (match_operand:SVE_F 2 "register_operand" "w"))]
2084           UNSPEC_MERGE_PTRUE))]
2085   "TARGET_SVE"
2086   "<sve_fp_op>\t%0.<Vetype>, %1/m, %2.<Vetype>"
2089 ;; Unpredicated FRINTy.
2090 (define_expand "<frint_pattern><mode>2"
2091   [(set (match_operand:SVE_F 0 "register_operand")
2092         (unspec:SVE_F
2093           [(match_dup 2)
2094            (unspec:SVE_F [(match_operand:SVE_F 1 "register_operand")]
2095                          FRINT)]
2096           UNSPEC_MERGE_PTRUE))]
2097   "TARGET_SVE"
2098   {
2099     operands[2] = force_reg (<VPRED>mode, CONSTM1_RTX (<VPRED>mode));
2100   }
2103 ;; FRINTy predicated with a PTRUE.
2104 (define_insn "*<frint_pattern><mode>2"
2105   [(set (match_operand:SVE_F 0 "register_operand" "=w")
2106         (unspec:SVE_F
2107           [(match_operand:<VPRED> 1 "register_operand" "Upl")
2108            (unspec:SVE_F [(match_operand:SVE_F 2 "register_operand" "w")]
2109                          FRINT)]
2110           UNSPEC_MERGE_PTRUE))]
2111   "TARGET_SVE"
2112   "frint<frint_suffix>\t%0.<Vetype>, %1/m, %2.<Vetype>"
2115 ;; Unpredicated conversion of floats to integers of the same size (HF to HI,
2116 ;; SF to SI or DF to DI).
2117 (define_expand "<fix_trunc_optab><mode><v_int_equiv>2"
2118   [(set (match_operand:<V_INT_EQUIV> 0 "register_operand")
2119         (unspec:<V_INT_EQUIV>
2120           [(match_dup 2)
2121            (FIXUORS:<V_INT_EQUIV>
2122              (match_operand:SVE_F 1 "register_operand"))]
2123           UNSPEC_MERGE_PTRUE))]
2124   "TARGET_SVE"
2125   {
2126     operands[2] = force_reg (<VPRED>mode, CONSTM1_RTX (<VPRED>mode));
2127   }
2130 ;; Conversion of SF to DI, SI or HI, predicated with a PTRUE.
2131 (define_insn "*<fix_trunc_optab>v16hsf<mode>2"
2132   [(set (match_operand:SVE_HSDI 0 "register_operand" "=w")
2133         (unspec:SVE_HSDI
2134           [(match_operand:<VPRED> 1 "register_operand" "Upl")
2135            (FIXUORS:SVE_HSDI
2136              (match_operand:VNx8HF 2 "register_operand" "w"))]
2137           UNSPEC_MERGE_PTRUE))]
2138   "TARGET_SVE"
2139   "fcvtz<su>\t%0.<Vetype>, %1/m, %2.h"
2142 ;; Conversion of SF to DI or SI, predicated with a PTRUE.
2143 (define_insn "*<fix_trunc_optab>vnx4sf<mode>2"
2144   [(set (match_operand:SVE_SDI 0 "register_operand" "=w")
2145         (unspec:SVE_SDI
2146           [(match_operand:<VPRED> 1 "register_operand" "Upl")
2147            (FIXUORS:SVE_SDI
2148              (match_operand:VNx4SF 2 "register_operand" "w"))]
2149           UNSPEC_MERGE_PTRUE))]
2150   "TARGET_SVE"
2151   "fcvtz<su>\t%0.<Vetype>, %1/m, %2.s"
2154 ;; Conversion of DF to DI or SI, predicated with a PTRUE.
2155 (define_insn "*<fix_trunc_optab>vnx2df<mode>2"
2156   [(set (match_operand:SVE_SDI 0 "register_operand" "=w")
2157         (unspec:SVE_SDI
2158           [(match_operand:VNx2BI 1 "register_operand" "Upl")
2159            (FIXUORS:SVE_SDI
2160              (match_operand:VNx2DF 2 "register_operand" "w"))]
2161           UNSPEC_MERGE_PTRUE))]
2162   "TARGET_SVE"
2163   "fcvtz<su>\t%0.<Vetype>, %1/m, %2.d"
2166 ;; Unpredicated conversion of integers to floats of the same size
2167 ;; (HI to HF, SI to SF or DI to DF).
2168 (define_expand "<optab><v_int_equiv><mode>2"
2169   [(set (match_operand:SVE_F 0 "register_operand")
2170         (unspec:SVE_F
2171           [(match_dup 2)
2172            (FLOATUORS:SVE_F
2173              (match_operand:<V_INT_EQUIV> 1 "register_operand"))]
2174           UNSPEC_MERGE_PTRUE))]
2175   "TARGET_SVE"
2176   {
2177     operands[2] = force_reg (<VPRED>mode, CONSTM1_RTX (<VPRED>mode));
2178   }
2181 ;; Conversion of DI, SI or HI to the same number of HFs, predicated
2182 ;; with a PTRUE.
2183 (define_insn "*<optab><mode>vnx8hf2"
2184   [(set (match_operand:VNx8HF 0 "register_operand" "=w")
2185         (unspec:VNx8HF
2186           [(match_operand:<VPRED> 1 "register_operand" "Upl")
2187            (FLOATUORS:VNx8HF
2188              (match_operand:SVE_HSDI 2 "register_operand" "w"))]
2189           UNSPEC_MERGE_PTRUE))]
2190   "TARGET_SVE"
2191   "<su_optab>cvtf\t%0.h, %1/m, %2.<Vetype>"
2194 ;; Conversion of DI or SI to the same number of SFs, predicated with a PTRUE.
2195 (define_insn "*<optab><mode>vnx4sf2"
2196   [(set (match_operand:VNx4SF 0 "register_operand" "=w")
2197         (unspec:VNx4SF
2198           [(match_operand:<VPRED> 1 "register_operand" "Upl")
2199            (FLOATUORS:VNx4SF
2200              (match_operand:SVE_SDI 2 "register_operand" "w"))]
2201           UNSPEC_MERGE_PTRUE))]
2202   "TARGET_SVE"
2203   "<su_optab>cvtf\t%0.s, %1/m, %2.<Vetype>"
2206 ;; Conversion of DI or SI to DF, predicated with a PTRUE.
2207 (define_insn "aarch64_sve_<optab><mode>vnx2df2"
2208   [(set (match_operand:VNx2DF 0 "register_operand" "=w")
2209         (unspec:VNx2DF
2210           [(match_operand:VNx2BI 1 "register_operand" "Upl")
2211            (FLOATUORS:VNx2DF
2212              (match_operand:SVE_SDI 2 "register_operand" "w"))]
2213           UNSPEC_MERGE_PTRUE))]
2214   "TARGET_SVE"
2215   "<su_optab>cvtf\t%0.d, %1/m, %2.<Vetype>"
2218 ;; Conversion of DFs to the same number of SFs, or SFs to the same number
2219 ;; of HFs.
2220 (define_insn "*trunc<Vwide><mode>2"
2221   [(set (match_operand:SVE_HSF 0 "register_operand" "=w")
2222         (unspec:SVE_HSF
2223           [(match_operand:<VWIDE_PRED> 1 "register_operand" "Upl")
2224            (unspec:SVE_HSF
2225              [(match_operand:<VWIDE> 2 "register_operand" "w")]
2226              UNSPEC_FLOAT_CONVERT)]
2227           UNSPEC_MERGE_PTRUE))]
2228   "TARGET_SVE"
2229   "fcvt\t%0.<Vetype>, %1/m, %2.<Vewtype>"
2232 ;; Conversion of SFs to the same number of DFs, or HFs to the same number
2233 ;; of SFs.
2234 (define_insn "aarch64_sve_extend<mode><Vwide>2"
2235   [(set (match_operand:<VWIDE> 0 "register_operand" "=w")
2236         (unspec:<VWIDE>
2237           [(match_operand:<VWIDE_PRED> 1 "register_operand" "Upl")
2238            (unspec:<VWIDE>
2239              [(match_operand:SVE_HSF 2 "register_operand" "w")]
2240              UNSPEC_FLOAT_CONVERT)]
2241           UNSPEC_MERGE_PTRUE))]
2242   "TARGET_SVE"
2243   "fcvt\t%0.<Vewtype>, %1/m, %2.<Vetype>"
2246 ;; Unpack the low or high half of a predicate, where "high" refers to
2247 ;; the low-numbered lanes for big-endian and the high-numbered lanes
2248 ;; for little-endian.
2249 (define_expand "vec_unpack<su>_<perm_hilo>_<mode>"
2250   [(match_operand:<VWIDE> 0 "register_operand")
2251    (unspec:<VWIDE> [(match_operand:PRED_BHS 1 "register_operand")]
2252                    UNPACK)]
2253   "TARGET_SVE"
2254   {
2255     emit_insn ((<hi_lanes_optab>
2256                 ? gen_aarch64_sve_punpkhi_<PRED_BHS:mode>
2257                 : gen_aarch64_sve_punpklo_<PRED_BHS:mode>)
2258                (operands[0], operands[1]));
2259     DONE;
2260   }
2263 ;; PUNPKHI and PUNPKLO.
2264 (define_insn "aarch64_sve_punpk<perm_hilo>_<mode>"
2265   [(set (match_operand:<VWIDE> 0 "register_operand" "=Upa")
2266         (unspec:<VWIDE> [(match_operand:PRED_BHS 1 "register_operand" "Upa")]
2267                         UNPACK_UNSIGNED))]
2268   "TARGET_SVE"
2269   "punpk<perm_hilo>\t%0.h, %1.b"
2272 ;; Unpack the low or high half of a vector, where "high" refers to
2273 ;; the low-numbered lanes for big-endian and the high-numbered lanes
2274 ;; for little-endian.
2275 (define_expand "vec_unpack<su>_<perm_hilo>_<SVE_BHSI:mode>"
2276   [(match_operand:<VWIDE> 0 "register_operand")
2277    (unspec:<VWIDE> [(match_operand:SVE_BHSI 1 "register_operand")] UNPACK)]
2278   "TARGET_SVE"
2279   {
2280     emit_insn ((<hi_lanes_optab>
2281                 ? gen_aarch64_sve_<su>unpkhi_<SVE_BHSI:mode>
2282                 : gen_aarch64_sve_<su>unpklo_<SVE_BHSI:mode>)
2283                (operands[0], operands[1]));
2284     DONE;
2285   }
2288 ;; SUNPKHI, UUNPKHI, SUNPKLO and UUNPKLO.
2289 (define_insn "aarch64_sve_<su>unpk<perm_hilo>_<SVE_BHSI:mode>"
2290   [(set (match_operand:<VWIDE> 0 "register_operand" "=w")
2291         (unspec:<VWIDE> [(match_operand:SVE_BHSI 1 "register_operand" "w")]
2292                         UNPACK))]
2293   "TARGET_SVE"
2294   "<su>unpk<perm_hilo>\t%0.<Vewtype>, %1.<Vetype>"
2297 ;; Unpack one half of a VNx4SF to VNx2DF, or one half of a VNx8HF to VNx4SF.
2298 ;; First unpack the source without conversion, then float-convert the
2299 ;; unpacked source.
2300 (define_expand "vec_unpacks_<perm_hilo>_<mode>"
2301   [(match_operand:<VWIDE> 0 "register_operand")
2302    (unspec:SVE_HSF [(match_operand:SVE_HSF 1 "register_operand")]
2303                    UNPACK_UNSIGNED)]
2304   "TARGET_SVE"
2305   {
2306     /* Use ZIP to do the unpack, since we don't care about the upper halves
2307        and since it has the nice property of not needing any subregs.
2308        If using UUNPK* turns out to be preferable, we could model it as
2309        a ZIP whose first operand is zero.  */
2310     rtx temp = gen_reg_rtx (<MODE>mode);
2311     emit_insn ((<hi_lanes_optab>
2312                 ? gen_aarch64_sve_zip2<mode>
2313                 : gen_aarch64_sve_zip1<mode>)
2314                 (temp, operands[1], operands[1]));
2315     rtx ptrue = force_reg (<VWIDE_PRED>mode, CONSTM1_RTX (<VWIDE_PRED>mode));
2316     emit_insn (gen_aarch64_sve_extend<mode><Vwide>2 (operands[0],
2317                                                      ptrue, temp));
2318     DONE;
2319   }
2322 ;; Unpack one half of a VNx4SI to VNx2DF.  First unpack from VNx4SI
2323 ;; to VNx2DI, reinterpret the VNx2DI as a VNx4SI, then convert the
2324 ;; unpacked VNx4SI to VNx2DF.
2325 (define_expand "vec_unpack<su_optab>_float_<perm_hilo>_vnx4si"
2326   [(match_operand:VNx2DF 0 "register_operand")
2327    (FLOATUORS:VNx2DF
2328      (unspec:VNx2DI [(match_operand:VNx4SI 1 "register_operand")]
2329                     UNPACK_UNSIGNED))]
2330   "TARGET_SVE"
2331   {
2332     /* Use ZIP to do the unpack, since we don't care about the upper halves
2333        and since it has the nice property of not needing any subregs.
2334        If using UUNPK* turns out to be preferable, we could model it as
2335        a ZIP whose first operand is zero.  */
2336     rtx temp = gen_reg_rtx (VNx4SImode);
2337     emit_insn ((<hi_lanes_optab>
2338                 ? gen_aarch64_sve_zip2vnx4si
2339                 : gen_aarch64_sve_zip1vnx4si)
2340                (temp, operands[1], operands[1]));
2341     rtx ptrue = force_reg (VNx2BImode, CONSTM1_RTX (VNx2BImode));
2342     emit_insn (gen_aarch64_sve_<FLOATUORS:optab>vnx4sivnx2df2 (operands[0],
2343                                                                ptrue, temp));
2344     DONE;
2345   }
2348 ;; Predicate pack.  Use UZP1 on the narrower type, which discards
2349 ;; the high part of each wide element.
2350 (define_insn "vec_pack_trunc_<Vwide>"
2351   [(set (match_operand:PRED_BHS 0 "register_operand" "=Upa")
2352         (unspec:PRED_BHS
2353           [(match_operand:<VWIDE> 1 "register_operand" "Upa")
2354            (match_operand:<VWIDE> 2 "register_operand" "Upa")]
2355           UNSPEC_PACK))]
2356   "TARGET_SVE"
2357   "uzp1\t%0.<Vetype>, %1.<Vetype>, %2.<Vetype>"
2360 ;; Integer pack.  Use UZP1 on the narrower type, which discards
2361 ;; the high part of each wide element.
2362 (define_insn "vec_pack_trunc_<Vwide>"
2363   [(set (match_operand:SVE_BHSI 0 "register_operand" "=w")
2364         (unspec:SVE_BHSI
2365           [(match_operand:<VWIDE> 1 "register_operand" "w")
2366            (match_operand:<VWIDE> 2 "register_operand" "w")]
2367           UNSPEC_PACK))]
2368   "TARGET_SVE"
2369   "uzp1\t%0.<Vetype>, %1.<Vetype>, %2.<Vetype>"
2372 ;; Convert two vectors of DF to SF, or two vectors of SF to HF, and pack
2373 ;; the results into a single vector.
2374 (define_expand "vec_pack_trunc_<Vwide>"
2375   [(set (match_dup 4)
2376         (unspec:SVE_HSF
2377           [(match_dup 3)
2378            (unspec:SVE_HSF [(match_operand:<VWIDE> 1 "register_operand")]
2379                            UNSPEC_FLOAT_CONVERT)]
2380           UNSPEC_MERGE_PTRUE))
2381    (set (match_dup 5)
2382         (unspec:SVE_HSF
2383           [(match_dup 3)
2384            (unspec:SVE_HSF [(match_operand:<VWIDE> 2 "register_operand")]
2385                            UNSPEC_FLOAT_CONVERT)]
2386           UNSPEC_MERGE_PTRUE))
2387    (set (match_operand:SVE_HSF 0 "register_operand")
2388         (unspec:SVE_HSF [(match_dup 4) (match_dup 5)] UNSPEC_UZP1))]
2389   "TARGET_SVE"
2390   {
2391     operands[3] = force_reg (<VWIDE_PRED>mode, CONSTM1_RTX (<VWIDE_PRED>mode));
2392     operands[4] = gen_reg_rtx (<MODE>mode);
2393     operands[5] = gen_reg_rtx (<MODE>mode);
2394   }
2397 ;; Convert two vectors of DF to SI and pack the results into a single vector.
2398 (define_expand "vec_pack_<su>fix_trunc_vnx2df"
2399   [(set (match_dup 4)
2400         (unspec:VNx4SI
2401           [(match_dup 3)
2402            (FIXUORS:VNx4SI (match_operand:VNx2DF 1 "register_operand"))]
2403           UNSPEC_MERGE_PTRUE))
2404    (set (match_dup 5)
2405         (unspec:VNx4SI
2406           [(match_dup 3)
2407            (FIXUORS:VNx4SI (match_operand:VNx2DF 2 "register_operand"))]
2408           UNSPEC_MERGE_PTRUE))
2409    (set (match_operand:VNx4SI 0 "register_operand")
2410         (unspec:VNx4SI [(match_dup 4) (match_dup 5)] UNSPEC_UZP1))]
2411   "TARGET_SVE"
2412   {
2413     operands[3] = force_reg (VNx2BImode, CONSTM1_RTX (VNx2BImode));
2414     operands[4] = gen_reg_rtx (VNx4SImode);
2415     operands[5] = gen_reg_rtx (VNx4SImode);
2416   }
2419 ;; Predicated floating-point operations.
2420 (define_insn "cond_<optab><mode>"
2421   [(set (match_operand:SVE_F 0 "register_operand" "=w")
2422         (unspec:SVE_F
2423           [(match_operand:<VPRED> 1 "register_operand" "Upl")
2424            (match_operand:SVE_F 2 "register_operand" "0")
2425            (match_operand:SVE_F 3 "register_operand" "w")]
2426           SVE_COND_FP_OP))]
2427   "TARGET_SVE"
2428   "<sve_fp_op>\t%0.<Vetype>, %1/m, %0.<Vetype>, %3.<Vetype>"
2431 ;; Shift an SVE vector left and insert a scalar into element 0.
2432 (define_insn "vec_shl_insert_<mode>"
2433   [(set (match_operand:SVE_ALL 0 "register_operand" "=w, w")
2434         (unspec:SVE_ALL
2435           [(match_operand:SVE_ALL 1 "register_operand" "0, 0")
2436            (match_operand:<VEL> 2 "register_operand" "rZ, w")]
2437           UNSPEC_INSR))]
2438   "TARGET_SVE"
2439   "@
2440    insr\t%0.<Vetype>, %<vwcore>2
2441    insr\t%0.<Vetype>, %<Vetype>2"