gcc/config/rs6000/vsx.md

   1 ;; VSX patterns.
   2 ;; Copyright (C) 2009, 2010, 2011, 2012
   3 ;; Free Software Foundation, Inc.
   4 ;; Contributed by Michael Meissner <meissner@linux.vnet.ibm.com>
   5
   6 ;; This file is part of GCC.
   7
   8 ;; GCC is free software; you can redistribute it and/or modify it
   9 ;; under the terms of the GNU General Public License as published
  10 ;; by the Free Software Foundation; either version 3, or (at your
  11 ;; option) any later version.
  12
  13 ;; GCC is distributed in the hope that it will be useful, but WITHOUT
  14 ;; ANY WARRANTY; without even the implied warranty of MERCHANTABILITY
  15 ;; or FITNESS FOR A PARTICULAR PURPOSE.  See the GNU General Public
  16 ;; License for more details.
  17
  18 ;; You should have received a copy of the GNU General Public License
  19 ;; along with GCC; see the file COPYING3.  If not see
  20 ;; <http://www.gnu.org/licenses/>.
  21
  22 ;; Iterator for both scalar and vector floating point types supported by VSX
  23 (define_mode_iterator VSX_B [DF V4SF V2DF])
  24
  25 ;; Iterator for the 2 64-bit vector types
  26 (define_mode_iterator VSX_D [V2DF V2DI])
  27
  28 ;; Iterator for the 2 32-bit vector types
  29 (define_mode_iterator VSX_W [V4SF V4SI])
  30
  31 ;; Iterator for the DF types
  32 (define_mode_iterator VSX_DF [V2DF DF])
  33
  34 ;; Iterator for vector floating point types supported by VSX
  35 (define_mode_iterator VSX_F [V4SF V2DF])
  36
  37 ;; Iterator for logical types supported by VSX
  38 (define_mode_iterator VSX_L [V16QI V8HI V4SI V2DI V4SF V2DF TI])
  39
  40 ;; Iterator for memory move.  Handle TImode specially to allow
  41 ;; it to use gprs as well as vsx registers.
  42 (define_mode_iterator VSX_M [V16QI V8HI V4SI V2DI V4SF V2DF])
  43
  44 ;; Map into the appropriate load/store name based on the type
  45 (define_mode_attr VSm  [(V16QI "vw4")
  46                         (V8HI  "vw4")
  47                         (V4SI  "vw4")
  48                         (V4SF  "vw4")
  49                         (V2DF  "vd2")
  50                         (V2DI  "vd2")
  51                         (DF    "d")
  52                         (TI    "vw4")])
  53
  54 ;; Map into the appropriate suffix based on the type
  55 (define_mode_attr VSs   [(V16QI "sp")
  56                          (V8HI  "sp")
  57                          (V4SI  "sp")
  58                          (V4SF  "sp")
  59                          (V2DF  "dp")
  60                          (V2DI  "dp")
  61                          (DF    "dp")
  62                          (SF    "sp")
  63                          (TI    "sp")])
  64
  65 ;; Map the register class used
  66 (define_mode_attr VSr   [(V16QI "v")
  67                          (V8HI  "v")
  68                          (V4SI  "v")
  69                          (V4SF  "wf")
  70                          (V2DI  "wd")
  71                          (V2DF  "wd")
  72                          (DF    "ws")
  73                          (SF    "d")
  74                          (TI    "wd")])
  75
  76 ;; Map the register class used for float<->int conversions
  77 (define_mode_attr VSr2  [(V2DF  "wd")
  78                          (V4SF  "wf")
  79                          (DF    "ws")])
  80
  81 (define_mode_attr VSr3  [(V2DF  "wa")
  82                          (V4SF  "wa")
  83                          (DF    "ws")])
  84
  85 ;; Map the register class for sp<->dp float conversions, destination
  86 (define_mode_attr VSr4  [(SF    "ws")
  87                          (DF    "f")
  88                          (V2DF  "wd")
  89                          (V4SF  "v")])
  90
  91 ;; Map the register class for sp<->dp float conversions, destination
  92 (define_mode_attr VSr5  [(SF    "ws")
  93                          (DF    "f")
  94                          (V2DF  "v")
  95                          (V4SF  "wd")])
  96
  97 ;; Same size integer type for floating point data
  98 (define_mode_attr VSi [(V4SF  "v4si")
  99                        (V2DF  "v2di")
 100                        (DF    "di")])
 101
 102 (define_mode_attr VSI [(V4SF  "V4SI")
 103                        (V2DF  "V2DI")
 104                        (DF    "DI")])
 105
 106 ;; Word size for same size conversion
 107 (define_mode_attr VSc [(V4SF "w")
 108                        (V2DF "d")
 109                        (DF   "d")])
 110
 111 ;; Map into either s or v, depending on whether this is a scalar or vector
 112 ;; operation
 113 (define_mode_attr VSv   [(V16QI "v")
 114                          (V8HI  "v")
 115                          (V4SI  "v")
 116                          (V4SF  "v")
 117                          (V2DI  "v")
 118                          (V2DF  "v")
 119                          (TI    "v")
 120                          (DF    "s")])
 121
 122 ;; Appropriate type for add ops (and other simple FP ops)
 123 (define_mode_attr VStype_simple [(V2DF "vecdouble")
 124                                  (V4SF "vecfloat")
 125                                  (DF   "fp")])
 126
 127 (define_mode_attr VSfptype_simple [(V2DF "fp_addsub_d")
 128                                    (V4SF "fp_addsub_s")
 129                                    (DF   "fp_addsub_d")])
 130
 131 ;; Appropriate type for multiply ops
 132 (define_mode_attr VStype_mul    [(V2DF "vecdouble")
 133                                  (V4SF "vecfloat")
 134                                  (DF   "dmul")])
 135
 136 (define_mode_attr VSfptype_mul  [(V2DF "fp_mul_d")
 137                                  (V4SF "fp_mul_s")
 138                                  (DF   "fp_mul_d")])
 139
 140 ;; Appropriate type for divide ops.
 141 (define_mode_attr VStype_div    [(V2DF "vecdiv")
 142                                  (V4SF "vecfdiv")
 143                                  (DF   "ddiv")])
 144
 145 (define_mode_attr VSfptype_div  [(V2DF "fp_div_d")
 146                                  (V4SF "fp_div_s")
 147                                  (DF   "fp_div_d")])
 148
 149 ;; Appropriate type for sqrt ops.  For now, just lump the vector sqrt with
 150 ;; the scalar sqrt
 151 (define_mode_attr VStype_sqrt   [(V2DF "dsqrt")
 152                                  (V4SF "ssqrt")
 153                                  (DF   "dsqrt")])
 154
 155 (define_mode_attr VSfptype_sqrt [(V2DF "fp_sqrt_d")
 156                                  (V4SF "fp_sqrt_s")
 157                                  (DF   "fp_sqrt_d")])
 158
 159 ;; Iterator and modes for sp<->dp conversions
 160 ;; Because scalar SF values are represented internally as double, use the
 161 ;; V4SF type to represent this than SF.
 162 (define_mode_iterator VSX_SPDP [DF V4SF V2DF])
 163
 164 (define_mode_attr VS_spdp_res [(DF      "V4SF")
 165                                (V4SF    "V2DF")
 166                                (V2DF    "V4SF")])
 167
 168 (define_mode_attr VS_spdp_insn [(DF     "xscvdpsp")
 169                                 (V4SF   "xvcvspdp")
 170                                 (V2DF   "xvcvdpsp")])
 171
 172 (define_mode_attr VS_spdp_type [(DF     "fp")
 173                                 (V4SF   "vecdouble")
 174                                 (V2DF   "vecdouble")])
 175
 176 ;; Map the scalar mode for a vector type
 177 (define_mode_attr VS_scalar [(V2DF      "DF")
 178                              (V2DI      "DI")
 179                              (V4SF      "SF")
 180                              (V4SI      "SI")
 181                              (V8HI      "HI")
 182                              (V16QI     "QI")])
 183
 184 ;; Map to a double-sized vector mode
 185 (define_mode_attr VS_double [(V4SI      "V8SI")
 186                              (V4SF      "V8SF")
 187                              (V2DI      "V4DI")
 188                              (V2DF      "V4DF")])
 189
 190 ;; Constants for creating unspecs
 191 (define_c_enum "unspec"
 192   [UNSPEC_VSX_CONCAT
 193    UNSPEC_VSX_CVDPSXWS
 194    UNSPEC_VSX_CVDPUXWS
 195    UNSPEC_VSX_CVSPDP
 196    UNSPEC_VSX_CVSXWDP
 197    UNSPEC_VSX_CVUXWDP
 198    UNSPEC_VSX_CVSXDSP
 199    UNSPEC_VSX_CVUXDSP
 200    UNSPEC_VSX_CVSPSXDS
 201    UNSPEC_VSX_CVSPUXDS
 202    UNSPEC_VSX_TDIV
 203    UNSPEC_VSX_TSQRT
 204    UNSPEC_VSX_SET
 205    UNSPEC_VSX_ROUND_I
 206    UNSPEC_VSX_ROUND_IC
 207    UNSPEC_VSX_SLDWI
 208   ])
 209
 210 ;; VSX moves
 211 (define_insn "*vsx_mov<mode>"
 212   [(set (match_operand:VSX_M 0 "nonimmediate_operand" "=Z,<VSr>,<VSr>,?Z,?wa,?wa,*o,*r,*r,<VSr>,?wa,v,wZ,v")
 213         (match_operand:VSX_M 1 "input_operand" "<VSr>,Z,<VSr>,wa,Z,wa,r,o,r,j,j,W,v,wZ"))]
 214   "VECTOR_MEM_VSX_P (<MODE>mode)
 215    && (register_operand (operands[0], <MODE>mode)
 216        || register_operand (operands[1], <MODE>mode))"
 217 {
 218   switch (which_alternative)
 219     {
 220     case 0:
 221     case 3:
 222       gcc_assert (MEM_P (operands[0])
 223                   && GET_CODE (XEXP (operands[0], 0)) != PRE_INC
 224                   && GET_CODE (XEXP (operands[0], 0)) != PRE_DEC
 225                   && GET_CODE (XEXP (operands[0], 0)) != PRE_MODIFY);
 226       return "stx<VSm>x %x1,%y0";
 227
 228     case 1:
 229     case 4:
 230       gcc_assert (MEM_P (operands[1])
 231                   && GET_CODE (XEXP (operands[1], 0)) != PRE_INC
 232                   && GET_CODE (XEXP (operands[1], 0)) != PRE_DEC
 233                   && GET_CODE (XEXP (operands[1], 0)) != PRE_MODIFY);
 234       return "lx<VSm>x %x0,%y1";
 235
 236     case 2:
 237     case 5:
 238       return "xxlor %x0,%x1,%x1";
 239
 240     case 6:
 241     case 7:
 242     case 8:
 243       return "#";
 244
 245     case 9:
 246     case 10:
 247       return "xxlxor %x0,%x0,%x0";
 248
 249     case 11:
 250       return output_vec_const_move (operands);
 251
 252     case 12:
 253       gcc_assert (MEM_P (operands[0])
 254                   && GET_CODE (XEXP (operands[0], 0)) != PRE_INC
 255                   && GET_CODE (XEXP (operands[0], 0)) != PRE_DEC
 256                   && GET_CODE (XEXP (operands[0], 0)) != PRE_MODIFY);
 257       return "stvx %1,%y0";
 258
 259     case 13:
 260       gcc_assert (MEM_P (operands[0])
 261                   && GET_CODE (XEXP (operands[0], 0)) != PRE_INC
 262                   && GET_CODE (XEXP (operands[0], 0)) != PRE_DEC
 263                   && GET_CODE (XEXP (operands[0], 0)) != PRE_MODIFY);
 264       return "lvx %0,%y1";
 265
 266     default:
 267       gcc_unreachable ();
 268     }
 269 }
 270   [(set_attr "type" "vecstore,vecload,vecsimple,vecstore,vecload,vecsimple,*,*,*,vecsimple,vecsimple,*,vecstore,vecload")])
 271
 272 ;; Unlike other VSX moves, allow the GPRs, since a normal use of TImode is for
 273 ;; unions.  However for plain data movement, slightly favor the vector loads
 274 (define_insn "*vsx_movti"
 275   [(set (match_operand:TI 0 "nonimmediate_operand" "=Z,wa,wa,?o,?r,?r,wa,v,v,wZ")
 276         (match_operand:TI 1 "input_operand" "wa,Z,wa,r,o,r,j,W,wZ,v"))]
 277   "VECTOR_MEM_VSX_P (TImode)
 278    && (register_operand (operands[0], TImode)
 279        || register_operand (operands[1], TImode))"
 280 {
 281   switch (which_alternative)
 282     {
 283     case 0:
 284       return "stxvd2x %x1,%y0";
 285
 286     case 1:
 287       return "lxvd2x %x0,%y1";
 288
 289     case 2:
 290       return "xxlor %x0,%x1,%x1";
 291
 292     case 3:
 293     case 4:
 294     case 5:
 295       return "#";
 296
 297     case 6:
 298       return "xxlxor %x0,%x0,%x0";
 299
 300     case 7:
 301       return output_vec_const_move (operands);
 302
 303     case 8:
 304       return "stvx %1,%y0";
 305
 306     case 9:
 307       return "lvx %0,%y1";
 308
 309     default:
 310       gcc_unreachable ();
 311     }
 312 }
 313   [(set_attr "type" "vecstore,vecload,vecsimple,*,*,*,vecsimple,*,vecstore,vecload")])
 314
 315 ;; Explicit  load/store expanders for the builtin functions
 316 (define_expand "vsx_load_<mode>"
 317   [(set (match_operand:VSX_M 0 "vsx_register_operand" "")
 318         (match_operand:VSX_M 1 "memory_operand" ""))]
 319   "VECTOR_MEM_VSX_P (<MODE>mode)"
 320   "")
 321
 322 (define_expand "vsx_store_<mode>"
 323   [(set (match_operand:VEC_M 0 "memory_operand" "")
 324         (match_operand:VEC_M 1 "vsx_register_operand" ""))]
 325   "VECTOR_MEM_VSX_P (<MODE>mode)"
 326   "")
 327
 328 \f
 329 ;; VSX scalar and vector floating point arithmetic instructions
 330 (define_insn "*vsx_add<mode>3"
 331   [(set (match_operand:VSX_B 0 "vsx_register_operand" "=<VSr>,?wa")
 332         (plus:VSX_B (match_operand:VSX_B 1 "vsx_register_operand" "<VSr>,wa")
 333                     (match_operand:VSX_B 2 "vsx_register_operand" "<VSr>,wa")))]
 334   "VECTOR_UNIT_VSX_P (<MODE>mode)"
 335   "x<VSv>add<VSs> %x0,%x1,%x2"
 336   [(set_attr "type" "<VStype_simple>")
 337    (set_attr "fp_type" "<VSfptype_simple>")])
 338
 339 (define_insn "*vsx_sub<mode>3"
 340   [(set (match_operand:VSX_B 0 "vsx_register_operand" "=<VSr>,?wa")
 341         (minus:VSX_B (match_operand:VSX_B 1 "vsx_register_operand" "<VSr>,wa")
 342                      (match_operand:VSX_B 2 "vsx_register_operand" "<VSr>,wa")))]
 343   "VECTOR_UNIT_VSX_P (<MODE>mode)"
 344   "x<VSv>sub<VSs> %x0,%x1,%x2"
 345   [(set_attr "type" "<VStype_simple>")
 346    (set_attr "fp_type" "<VSfptype_simple>")])
 347
 348 (define_insn "*vsx_mul<mode>3"
 349   [(set (match_operand:VSX_B 0 "vsx_register_operand" "=<VSr>,?wa")
 350         (mult:VSX_B (match_operand:VSX_B 1 "vsx_register_operand" "<VSr>,wa")
 351                     (match_operand:VSX_B 2 "vsx_register_operand" "<VSr>,wa")))]
 352   "VECTOR_UNIT_VSX_P (<MODE>mode)"
 353   "x<VSv>mul<VSs> %x0,%x1,%x2"
 354   [(set_attr "type" "<VStype_mul>")
 355    (set_attr "fp_type" "<VSfptype_mul>")])
 356
 357 (define_insn "*vsx_div<mode>3"
 358   [(set (match_operand:VSX_B 0 "vsx_register_operand" "=<VSr>,?wa")
 359         (div:VSX_B (match_operand:VSX_B 1 "vsx_register_operand" "<VSr>,wa")
 360                    (match_operand:VSX_B 2 "vsx_register_operand" "<VSr>,wa")))]
 361   "VECTOR_UNIT_VSX_P (<MODE>mode)"
 362   "x<VSv>div<VSs> %x0,%x1,%x2"
 363   [(set_attr "type" "<VStype_div>")
 364    (set_attr "fp_type" "<VSfptype_div>")])
 365
 366 ;; *tdiv* instruction returning the FG flag
 367 (define_expand "vsx_tdiv<mode>3_fg"
 368   [(set (match_dup 3)
 369         (unspec:CCFP [(match_operand:VSX_B 1 "vsx_register_operand" "")
 370                       (match_operand:VSX_B 2 "vsx_register_operand" "")]
 371                      UNSPEC_VSX_TDIV))
 372    (set (match_operand:SI 0 "gpc_reg_operand" "")
 373         (gt:SI (match_dup 3)
 374                (const_int 0)))]
 375   "VECTOR_UNIT_VSX_P (<MODE>mode)"
 376 {
 377   operands[3] = gen_reg_rtx (CCFPmode);
 378 })
 379
 380 ;; *tdiv* instruction returning the FE flag
 381 (define_expand "vsx_tdiv<mode>3_fe"
 382   [(set (match_dup 3)
 383         (unspec:CCFP [(match_operand:VSX_B 1 "vsx_register_operand" "")
 384                       (match_operand:VSX_B 2 "vsx_register_operand" "")]
 385                      UNSPEC_VSX_TDIV))
 386    (set (match_operand:SI 0 "gpc_reg_operand" "")
 387         (eq:SI (match_dup 3)
 388                (const_int 0)))]
 389   "VECTOR_UNIT_VSX_P (<MODE>mode)"
 390 {
 391   operands[3] = gen_reg_rtx (CCFPmode);
 392 })
 393
 394 (define_insn "*vsx_tdiv<mode>3_internal"
 395   [(set (match_operand:CCFP 0 "cc_reg_operand" "=x,x")
 396         (unspec:CCFP [(match_operand:VSX_B 1 "vsx_register_operand" "<VSr>,wa")
 397                       (match_operand:VSX_B 2 "vsx_register_operand" "<VSr>,wa")]
 398                    UNSPEC_VSX_TDIV))]
 399   "VECTOR_UNIT_VSX_P (<MODE>mode)"
 400   "x<VSv>tdiv<VSs> %0,%x1,%x2"
 401   [(set_attr "type" "<VStype_simple>")
 402    (set_attr "fp_type" "<VSfptype_simple>")])
 403
 404 (define_insn "vsx_fre<mode>2"
 405   [(set (match_operand:VSX_B 0 "vsx_register_operand" "=<VSr>,?wa")
 406         (unspec:VSX_B [(match_operand:VSX_B 1 "vsx_register_operand" "<VSr>,wa")]
 407                       UNSPEC_FRES))]
 408   "VECTOR_UNIT_VSX_P (<MODE>mode)"
 409   "x<VSv>re<VSs> %x0,%x1"
 410   [(set_attr "type" "<VStype_simple>")
 411    (set_attr "fp_type" "<VSfptype_simple>")])
 412
 413 (define_insn "*vsx_neg<mode>2"
 414   [(set (match_operand:VSX_B 0 "vsx_register_operand" "=<VSr>,?wa")
 415         (neg:VSX_B (match_operand:VSX_B 1 "vsx_register_operand" "<VSr>,wa")))]
 416   "VECTOR_UNIT_VSX_P (<MODE>mode)"
 417   "x<VSv>neg<VSs> %x0,%x1"
 418   [(set_attr "type" "<VStype_simple>")
 419    (set_attr "fp_type" "<VSfptype_simple>")])
 420
 421 (define_insn "*vsx_abs<mode>2"
 422   [(set (match_operand:VSX_B 0 "vsx_register_operand" "=<VSr>,?wa")
 423         (abs:VSX_B (match_operand:VSX_B 1 "vsx_register_operand" "<VSr>,wa")))]
 424   "VECTOR_UNIT_VSX_P (<MODE>mode)"
 425   "x<VSv>abs<VSs> %x0,%x1"
 426   [(set_attr "type" "<VStype_simple>")
 427    (set_attr "fp_type" "<VSfptype_simple>")])
 428
 429 (define_insn "vsx_nabs<mode>2"
 430   [(set (match_operand:VSX_B 0 "vsx_register_operand" "=<VSr>,?wa")
 431         (neg:VSX_B
 432          (abs:VSX_B
 433           (match_operand:VSX_B 1 "vsx_register_operand" "<VSr>,wa"))))]
 434   "VECTOR_UNIT_VSX_P (<MODE>mode)"
 435   "x<VSv>nabs<VSs> %x0,%x1"
 436   [(set_attr "type" "<VStype_simple>")
 437    (set_attr "fp_type" "<VSfptype_simple>")])
 438
 439 (define_insn "vsx_smax<mode>3"
 440   [(set (match_operand:VSX_B 0 "vsx_register_operand" "=<VSr>,?wa")
 441         (smax:VSX_B (match_operand:VSX_B 1 "vsx_register_operand" "<VSr>,wa")
 442                     (match_operand:VSX_B 2 "vsx_register_operand" "<VSr>,wa")))]
 443   "VECTOR_UNIT_VSX_P (<MODE>mode)"
 444   "x<VSv>max<VSs> %x0,%x1,%x2"
 445   [(set_attr "type" "<VStype_simple>")
 446    (set_attr "fp_type" "<VSfptype_simple>")])
 447
 448 (define_insn "*vsx_smin<mode>3"
 449   [(set (match_operand:VSX_B 0 "vsx_register_operand" "=<VSr>,?wa")
 450         (smin:VSX_B (match_operand:VSX_B 1 "vsx_register_operand" "<VSr>,wa")
 451                     (match_operand:VSX_B 2 "vsx_register_operand" "<VSr>,wa")))]
 452   "VECTOR_UNIT_VSX_P (<MODE>mode)"
 453   "x<VSv>min<VSs> %x0,%x1,%x2"
 454   [(set_attr "type" "<VStype_simple>")
 455    (set_attr "fp_type" "<VSfptype_simple>")])
 456
 457 ;; Special VSX version of smin/smax for single precision floating point.  Since
 458 ;; both numbers are rounded to single precision, we can just use the DP version
 459 ;; of the instruction.
 460
 461 (define_insn "*vsx_smaxsf3"
 462   [(set (match_operand:SF 0 "vsx_register_operand" "=f")
 463         (smax:SF (match_operand:SF 1 "vsx_register_operand" "f")
 464                  (match_operand:SF 2 "vsx_register_operand" "f")))]
 465   "VECTOR_UNIT_VSX_P (DFmode)"
 466   "xsmaxdp %x0,%x1,%x2"
 467   [(set_attr "type" "fp")
 468    (set_attr "fp_type" "fp_addsub_d")])
 469
 470 (define_insn "*vsx_sminsf3"
 471   [(set (match_operand:SF 0 "vsx_register_operand" "=f")
 472         (smin:SF (match_operand:SF 1 "vsx_register_operand" "f")
 473                  (match_operand:SF 2 "vsx_register_operand" "f")))]
 474   "VECTOR_UNIT_VSX_P (DFmode)"
 475   "xsmindp %x0,%x1,%x2"
 476   [(set_attr "type" "fp")
 477    (set_attr "fp_type" "fp_addsub_d")])
 478
 479 (define_insn "*vsx_sqrt<mode>2"
 480   [(set (match_operand:VSX_B 0 "vsx_register_operand" "=<VSr>,?wa")
 481         (sqrt:VSX_B (match_operand:VSX_B 1 "vsx_register_operand" "<VSr>,wa")))]
 482   "VECTOR_UNIT_VSX_P (<MODE>mode)"
 483   "x<VSv>sqrt<VSs> %x0,%x1"
 484   [(set_attr "type" "<VStype_sqrt>")
 485    (set_attr "fp_type" "<VSfptype_sqrt>")])
 486
 487 (define_insn "*vsx_rsqrte<mode>2"
 488   [(set (match_operand:VSX_B 0 "vsx_register_operand" "=<VSr>,?wa")
 489         (unspec:VSX_B [(match_operand:VSX_B 1 "vsx_register_operand" "<VSr>,wa")]
 490                       UNSPEC_RSQRT))]
 491   "VECTOR_UNIT_VSX_P (<MODE>mode)"
 492   "x<VSv>rsqrte<VSs> %x0,%x1"
 493   [(set_attr "type" "<VStype_simple>")
 494    (set_attr "fp_type" "<VSfptype_simple>")])
 495
 496 ;; *tsqrt* returning the fg flag
 497 (define_expand "vsx_tsqrt<mode>2_fg"
 498   [(set (match_dup 3)
 499         (unspec:CCFP [(match_operand:VSX_B 1 "vsx_register_operand" "")]
 500                      UNSPEC_VSX_TSQRT))
 501    (set (match_operand:SI 0 "gpc_reg_operand" "")
 502         (gt:SI (match_dup 3)
 503                (const_int 0)))]
 504   "VECTOR_UNIT_VSX_P (<MODE>mode)"
 505 {
 506   operands[3] = gen_reg_rtx (CCFPmode);
 507 })
 508
 509 ;; *tsqrt* returning the fe flag
 510 (define_expand "vsx_tsqrt<mode>2_fe"
 511   [(set (match_dup 3)
 512         (unspec:CCFP [(match_operand:VSX_B 1 "vsx_register_operand" "")]
 513                      UNSPEC_VSX_TSQRT))
 514    (set (match_operand:SI 0 "gpc_reg_operand" "")
 515         (eq:SI (match_dup 3)
 516                (const_int 0)))]
 517   "VECTOR_UNIT_VSX_P (<MODE>mode)"
 518 {
 519   operands[3] = gen_reg_rtx (CCFPmode);
 520 })
 521
 522 (define_insn "*vsx_tsqrt<mode>2_internal"
 523   [(set (match_operand:CCFP 0 "cc_reg_operand" "=x,x")
 524         (unspec:CCFP [(match_operand:VSX_B 1 "vsx_register_operand" "<VSr>,wa")]
 525                      UNSPEC_VSX_TSQRT))]
 526   "VECTOR_UNIT_VSX_P (<MODE>mode)"
 527   "x<VSv>tsqrt<VSs> %0,%x1"
 528   [(set_attr "type" "<VStype_simple>")
 529    (set_attr "fp_type" "<VSfptype_simple>")])
 530
 531 ;; Fused vector multiply/add instructions Support the classical DF versions of
 532 ;; fma, which allows the target to be a separate register from the 3 inputs.
 533 ;; Under VSX, the target must be either the addend or the first multiply.
 534 ;; Where we can, also do the same for the Altivec V4SF fmas.
 535
 536 (define_insn "*vsx_fmadf4"
 537   [(set (match_operand:DF 0 "vsx_register_operand" "=ws,ws,?wa,?wa,d")
 538         (fma:DF
 539           (match_operand:DF 1 "vsx_register_operand" "%ws,ws,wa,wa,d")
 540           (match_operand:DF 2 "vsx_register_operand" "ws,0,wa,0,d")
 541           (match_operand:DF 3 "vsx_register_operand" "0,ws,0,wa,d")))]
 542   "VECTOR_UNIT_VSX_P (DFmode)"
 543   "@
 544    xsmaddadp %x0,%x1,%x2
 545    xsmaddmdp %x0,%x1,%x3
 546    xsmaddadp %x0,%x1,%x2
 547    xsmaddmdp %x0,%x1,%x3
 548    fmadd %0,%1,%2,%3"
 549   [(set_attr "type" "fp")
 550    (set_attr "fp_type" "fp_maddsub_d")])
 551
 552 (define_insn "*vsx_fmav4sf4"
 553   [(set (match_operand:V4SF 0 "vsx_register_operand" "=ws,ws,?wa,?wa,v")
 554         (fma:V4SF
 555           (match_operand:V4SF 1 "vsx_register_operand" "%ws,ws,wa,wa,v")
 556           (match_operand:V4SF 2 "vsx_register_operand" "ws,0,wa,0,v")
 557           (match_operand:V4SF 3 "vsx_register_operand" "0,ws,0,wa,v")))]
 558   "VECTOR_UNIT_VSX_P (V4SFmode)"
 559   "@
 560    xvmaddasp %x0,%x1,%x2
 561    xvmaddmsp %x0,%x1,%x3
 562    xvmaddasp %x0,%x1,%x2
 563    xvmaddmsp %x0,%x1,%x3
 564    vmaddfp %0,%1,%2,%3"
 565   [(set_attr "type" "vecfloat")])
 566
 567 (define_insn "*vsx_fmav2df4"
 568   [(set (match_operand:V2DF 0 "vsx_register_operand" "=ws,ws,?wa,?wa")
 569         (fma:V2DF
 570           (match_operand:V2DF 1 "vsx_register_operand" "%ws,ws,wa,wa")
 571           (match_operand:V2DF 2 "vsx_register_operand" "ws,0,wa,0")
 572           (match_operand:V2DF 3 "vsx_register_operand" "0,ws,0,wa")))]
 573   "VECTOR_UNIT_VSX_P (V2DFmode)"
 574   "@
 575    xvmaddadp %x0,%x1,%x2
 576    xvmaddmdp %x0,%x1,%x3
 577    xvmaddadp %x0,%x1,%x2
 578    xvmaddmdp %x0,%x1,%x3"
 579   [(set_attr "type" "vecdouble")])
 580
 581 (define_insn "*vsx_fmsdf4"
 582   [(set (match_operand:DF 0 "vsx_register_operand" "=ws,ws,?wa,?wa,d")
 583         (fma:DF
 584           (match_operand:DF 1 "vsx_register_operand" "%ws,ws,wa,wa,d")
 585           (match_operand:DF 2 "vsx_register_operand" "ws,0,wa,0,d")
 586           (neg:DF
 587             (match_operand:DF 3 "vsx_register_operand" "0,ws,0,wa,d"))))]
 588   "VECTOR_UNIT_VSX_P (DFmode)"
 589   "@
 590    xsmsubadp %x0,%x1,%x2
 591    xsmsubmdp %x0,%x1,%x3
 592    xsmsubadp %x0,%x1,%x2
 593    xsmsubmdp %x0,%x1,%x3
 594    fmsub %0,%1,%2,%3"
 595   [(set_attr "type" "fp")
 596    (set_attr "fp_type" "fp_maddsub_d")])
 597
 598 (define_insn "*vsx_fms<mode>4"
 599   [(set (match_operand:VSX_F 0 "vsx_register_operand" "=<VSr>,<VSr>,?wa,?wa")
 600         (fma:VSX_F
 601           (match_operand:VSX_F 1 "vsx_register_operand" "%<VSr>,<VSr>,wa,wa")
 602           (match_operand:VSX_F 2 "vsx_register_operand" "<VSr>,0,wa,0")
 603           (neg:VSX_F
 604             (match_operand:VSX_F 3 "vsx_register_operand" "0,<VSr>,0,wa"))))]
 605   "VECTOR_UNIT_VSX_P (<MODE>mode)"
 606   "@
 607    x<VSv>msuba<VSs> %x0,%x1,%x2
 608    x<VSv>msubm<VSs> %x0,%x1,%x3
 609    x<VSv>msuba<VSs> %x0,%x1,%x2
 610    x<VSv>msubm<VSs> %x0,%x1,%x3"
 611   [(set_attr "type" "<VStype_mul>")])
 612
 613 (define_insn "*vsx_nfmadf4"
 614   [(set (match_operand:DF 0 "vsx_register_operand" "=ws,ws,?wa,?wa,d")
 615         (neg:DF
 616          (fma:DF
 617           (match_operand:DF 1 "vsx_register_operand" "ws,ws,wa,wa,d")
 618           (match_operand:DF 2 "vsx_register_operand" "ws,0,wa,0,d")
 619           (match_operand:DF 3 "vsx_register_operand" "0,ws,0,wa,d"))))]
 620   "VECTOR_UNIT_VSX_P (DFmode)"
 621   "@
 622    xsnmaddadp %x0,%x1,%x2
 623    xsnmaddmdp %x0,%x1,%x3
 624    xsnmaddadp %x0,%x1,%x2
 625    xsnmaddmdp %x0,%x1,%x3
 626    fnmadd %0,%1,%2,%3"
 627   [(set_attr "type" "fp")
 628    (set_attr "fp_type" "fp_maddsub_d")])
 629
 630 (define_insn "*vsx_nfma<mode>4"
 631   [(set (match_operand:VSX_F 0 "vsx_register_operand" "=<VSr>,<VSr>,?wa,?wa")
 632         (neg:VSX_F
 633          (fma:VSX_F
 634           (match_operand:VSX_F 1 "vsx_register_operand" "<VSr>,<VSr>,wa,wa")
 635           (match_operand:VSX_F 2 "vsx_register_operand" "<VSr>,0,wa,0")
 636           (match_operand:VSX_F 3 "vsx_register_operand" "0,<VSr>,0,wa"))))]
 637   "VECTOR_UNIT_VSX_P (<MODE>mode)"
 638   "@
 639    x<VSv>nmadda<VSs> %x0,%x1,%x2
 640    x<VSv>nmaddm<VSs> %x0,%x1,%x3
 641    x<VSv>nmadda<VSs> %x0,%x1,%x2
 642    x<VSv>nmaddm<VSs> %x0,%x1,%x3"
 643   [(set_attr "type" "<VStype_mul>")
 644    (set_attr "fp_type" "<VSfptype_mul>")])
 645
 646 (define_insn "*vsx_nfmsdf4"
 647   [(set (match_operand:DF 0 "vsx_register_operand" "=ws,ws,?wa,?wa,d")
 648         (neg:DF
 649          (fma:DF
 650            (match_operand:DF 1 "vsx_register_operand" "%ws,ws,wa,wa,d")
 651            (match_operand:DF 2 "vsx_register_operand" "ws,0,wa,0,d")
 652            (neg:DF
 653              (match_operand:DF 3 "vsx_register_operand" "0,ws,0,wa,d")))))]
 654   "VECTOR_UNIT_VSX_P (DFmode)"
 655   "@
 656    xsnmsubadp %x0,%x1,%x2
 657    xsnmsubmdp %x0,%x1,%x3
 658    xsnmsubadp %x0,%x1,%x2
 659    xsnmsubmdp %x0,%x1,%x3
 660    fnmsub %0,%1,%2,%3"
 661   [(set_attr "type" "fp")
 662    (set_attr "fp_type" "fp_maddsub_d")])
 663
 664 (define_insn "*vsx_nfmsv4sf4"
 665   [(set (match_operand:V4SF 0 "vsx_register_operand" "=wf,wf,?wa,?wa,v")
 666         (neg:V4SF
 667          (fma:V4SF
 668            (match_operand:V4SF 1 "vsx_register_operand" "%wf,wf,wa,wa,v")
 669            (match_operand:V4SF 2 "vsx_register_operand" "wf,0,wa,0,v")
 670            (neg:V4SF
 671              (match_operand:V4SF 3 "vsx_register_operand" "0,wf,0,wa,v")))))]
 672   "VECTOR_UNIT_VSX_P (V4SFmode)"
 673   "@
 674    xvnmsubasp %x0,%x1,%x2
 675    xvnmsubmsp %x0,%x1,%x3
 676    xvnmsubasp %x0,%x1,%x2
 677    xvnmsubmsp %x0,%x1,%x3
 678    vnmsubfp %0,%1,%2,%3"
 679   [(set_attr "type" "vecfloat")])
 680
 681 (define_insn "*vsx_nfmsv2df4"
 682   [(set (match_operand:V2DF 0 "vsx_register_operand" "=wd,wd,?wa,?wa")
 683         (neg:V2DF
 684          (fma:V2DF
 685            (match_operand:V2DF 1 "vsx_register_operand" "%wd,wd,wa,wa")
 686            (match_operand:V2DF 2 "vsx_register_operand" "wd,0,wa,0")
 687            (neg:V2DF
 688              (match_operand:V2DF 3 "vsx_register_operand" "0,wd,0,wa")))))]
 689   "VECTOR_UNIT_VSX_P (V2DFmode)"
 690   "@
 691    xvnmsubadp %x0,%x1,%x2
 692    xvnmsubmdp %x0,%x1,%x3
 693    xvnmsubadp %x0,%x1,%x2
 694    xvnmsubmdp %x0,%x1,%x3"
 695   [(set_attr "type" "vecdouble")])
 696
 697 ;; Vector conditional expressions (no scalar version for these instructions)
 698 (define_insn "vsx_eq<mode>"
 699   [(set (match_operand:VSX_F 0 "vsx_register_operand" "=<VSr>,?wa")
 700         (eq:VSX_F (match_operand:VSX_F 1 "vsx_register_operand" "<VSr>,wa")
 701                   (match_operand:VSX_F 2 "vsx_register_operand" "<VSr>,wa")))]
 702   "VECTOR_UNIT_VSX_P (<MODE>mode)"
 703   "xvcmpeq<VSs> %x0,%x1,%x2"
 704   [(set_attr "type" "<VStype_simple>")
 705    (set_attr "fp_type" "<VSfptype_simple>")])
 706
 707 (define_insn "vsx_gt<mode>"
 708   [(set (match_operand:VSX_F 0 "vsx_register_operand" "=<VSr>,?wa")
 709         (gt:VSX_F (match_operand:VSX_F 1 "vsx_register_operand" "<VSr>,wa")
 710                   (match_operand:VSX_F 2 "vsx_register_operand" "<VSr>,wa")))]
 711   "VECTOR_UNIT_VSX_P (<MODE>mode)"
 712   "xvcmpgt<VSs> %x0,%x1,%x2"
 713   [(set_attr "type" "<VStype_simple>")
 714    (set_attr "fp_type" "<VSfptype_simple>")])
 715
 716 (define_insn "*vsx_ge<mode>"
 717   [(set (match_operand:VSX_F 0 "vsx_register_operand" "=<VSr>,?wa")
 718         (ge:VSX_F (match_operand:VSX_F 1 "vsx_register_operand" "<VSr>,wa")
 719                   (match_operand:VSX_F 2 "vsx_register_operand" "<VSr>,wa")))]
 720   "VECTOR_UNIT_VSX_P (<MODE>mode)"
 721   "xvcmpge<VSs> %x0,%x1,%x2"
 722   [(set_attr "type" "<VStype_simple>")
 723    (set_attr "fp_type" "<VSfptype_simple>")])
 724
 725 ;; Floating point scalar compare
 726 (define_insn "*vsx_cmpdf_internal1"
 727   [(set (match_operand:CCFP 0 "cc_reg_operand" "=y,?y")
 728         (compare:CCFP (match_operand:DF 1 "gpc_reg_operand" "ws,wa")
 729                       (match_operand:DF 2 "gpc_reg_operand" "ws,wa")))]
 730   "TARGET_HARD_FLOAT && TARGET_FPRS && TARGET_DOUBLE_FLOAT
 731    && VECTOR_UNIT_VSX_P (DFmode)"
 732   "xscmpudp %0,%x1,%x2"
 733   [(set_attr "type" "fpcompare")])
 734
 735 ;; Compare vectors producing a vector result and a predicate, setting CR6 to
 736 ;; indicate a combined status
 737 (define_insn "*vsx_eq_<mode>_p"
 738   [(set (reg:CC 74)
 739         (unspec:CC
 740          [(eq:CC (match_operand:VSX_F 1 "vsx_register_operand" "<VSr>,?wa")
 741                  (match_operand:VSX_F 2 "vsx_register_operand" "<VSr>,?wa"))]
 742          UNSPEC_PREDICATE))
 743    (set (match_operand:VSX_F 0 "vsx_register_operand" "=<VSr>,?wa")
 744         (eq:VSX_F (match_dup 1)
 745                   (match_dup 2)))]
 746   "VECTOR_UNIT_VSX_P (<MODE>mode)"
 747   "xvcmpeq<VSs>. %x0,%x1,%x2"
 748   [(set_attr "type" "<VStype_simple>")])
 749
 750 (define_insn "*vsx_gt_<mode>_p"
 751   [(set (reg:CC 74)
 752         (unspec:CC
 753          [(gt:CC (match_operand:VSX_F 1 "vsx_register_operand" "<VSr>,?wa")
 754                  (match_operand:VSX_F 2 "vsx_register_operand" "<VSr>,?wa"))]
 755          UNSPEC_PREDICATE))
 756    (set (match_operand:VSX_F 0 "vsx_register_operand" "=<VSr>,?wa")
 757         (gt:VSX_F (match_dup 1)
 758                   (match_dup 2)))]
 759   "VECTOR_UNIT_VSX_P (<MODE>mode)"
 760   "xvcmpgt<VSs>. %x0,%x1,%x2"
 761   [(set_attr "type" "<VStype_simple>")])
 762
 763 (define_insn "*vsx_ge_<mode>_p"
 764   [(set (reg:CC 74)
 765         (unspec:CC
 766          [(ge:CC (match_operand:VSX_F 1 "vsx_register_operand" "<VSr>,?wa")
 767                  (match_operand:VSX_F 2 "vsx_register_operand" "<VSr>,?wa"))]
 768          UNSPEC_PREDICATE))
 769    (set (match_operand:VSX_F 0 "vsx_register_operand" "=<VSr>,?wa")
 770         (ge:VSX_F (match_dup 1)
 771                   (match_dup 2)))]
 772   "VECTOR_UNIT_VSX_P (<MODE>mode)"
 773   "xvcmpge<VSs>. %x0,%x1,%x2"
 774   [(set_attr "type" "<VStype_simple>")])
 775
 776 ;; Vector select
 777 (define_insn "*vsx_xxsel<mode>"
 778   [(set (match_operand:VSX_L 0 "vsx_register_operand" "=<VSr>,?wa")
 779         (if_then_else:VSX_L
 780          (ne:CC (match_operand:VSX_L 1 "vsx_register_operand" "<VSr>,wa")
 781                 (match_operand:VSX_L 4 "zero_constant" ""))
 782          (match_operand:VSX_L 2 "vsx_register_operand" "<VSr>,wa")
 783          (match_operand:VSX_L 3 "vsx_register_operand" "<VSr>,wa")))]
 784   "VECTOR_MEM_VSX_P (<MODE>mode)"
 785   "xxsel %x0,%x3,%x2,%x1"
 786   [(set_attr "type" "vecperm")])
 787
 788 (define_insn "*vsx_xxsel<mode>_uns"
 789   [(set (match_operand:VSX_L 0 "vsx_register_operand" "=<VSr>,?wa")
 790         (if_then_else:VSX_L
 791          (ne:CCUNS (match_operand:VSX_L 1 "vsx_register_operand" "<VSr>,wa")
 792                    (match_operand:VSX_L 4 "zero_constant" ""))
 793          (match_operand:VSX_L 2 "vsx_register_operand" "<VSr>,wa")
 794          (match_operand:VSX_L 3 "vsx_register_operand" "<VSr>,wa")))]
 795   "VECTOR_MEM_VSX_P (<MODE>mode)"
 796   "xxsel %x0,%x3,%x2,%x1"
 797   [(set_attr "type" "vecperm")])
 798
 799 ;; Copy sign
 800 (define_insn "vsx_copysign<mode>3"
 801   [(set (match_operand:VSX_B 0 "vsx_register_operand" "=<VSr>,?wa")
 802         (unspec:VSX_B
 803          [(match_operand:VSX_B 1 "vsx_register_operand" "<VSr>,wa")
 804           (match_operand:VSX_B 2 "vsx_register_operand" "<VSr>,wa")]
 805          UNSPEC_COPYSIGN))]
 806   "VECTOR_UNIT_VSX_P (<MODE>mode)"
 807   "x<VSv>cpsgn<VSs> %x0,%x2,%x1"
 808   [(set_attr "type" "<VStype_simple>")
 809    (set_attr "fp_type" "<VSfptype_simple>")])
 810
 811 ;; For the conversions, limit the register class for the integer value to be
 812 ;; the fprs because we don't want to add the altivec registers to movdi/movsi.
 813 ;; For the unsigned tests, there isn't a generic double -> unsigned conversion
 814 ;; in rs6000.md so don't test VECTOR_UNIT_VSX_P, just test against VSX.
 815 ;; Don't use vsx_register_operand here, use gpc_reg_operand to match rs6000.md.
 816 (define_insn "vsx_float<VSi><mode>2"
 817   [(set (match_operand:VSX_B 0 "gpc_reg_operand" "=<VSr>,?wa")
 818         (float:VSX_B (match_operand:<VSI> 1 "gpc_reg_operand" "<VSr2>,<VSr3>")))]
 819   "VECTOR_UNIT_VSX_P (<MODE>mode)"
 820   "x<VSv>cvsx<VSc><VSs> %x0,%x1"
 821   [(set_attr "type" "<VStype_simple>")
 822    (set_attr "fp_type" "<VSfptype_simple>")])
 823
 824 (define_insn "vsx_floatuns<VSi><mode>2"
 825   [(set (match_operand:VSX_B 0 "gpc_reg_operand" "=<VSr>,?wa")
 826         (unsigned_float:VSX_B (match_operand:<VSI> 1 "gpc_reg_operand" "<VSr2>,<VSr3>")))]
 827   "VECTOR_UNIT_VSX_P (<MODE>mode)"
 828   "x<VSv>cvux<VSc><VSs> %x0,%x1"
 829   [(set_attr "type" "<VStype_simple>")
 830    (set_attr "fp_type" "<VSfptype_simple>")])
 831
 832 (define_insn "vsx_fix_trunc<mode><VSi>2"
 833   [(set (match_operand:<VSI> 0 "gpc_reg_operand" "=<VSr2>,?<VSr3>")
 834         (fix:<VSI> (match_operand:VSX_B 1 "gpc_reg_operand" "<VSr>,wa")))]
 835   "VECTOR_UNIT_VSX_P (<MODE>mode)"
 836   "x<VSv>cv<VSs>sx<VSc>s %x0,%x1"
 837   [(set_attr "type" "<VStype_simple>")
 838    (set_attr "fp_type" "<VSfptype_simple>")])
 839
 840 (define_insn "vsx_fixuns_trunc<mode><VSi>2"
 841   [(set (match_operand:<VSI> 0 "gpc_reg_operand" "=<VSr2>,?<VSr3>")
 842         (unsigned_fix:<VSI> (match_operand:VSX_B 1 "gpc_reg_operand" "<VSr>,wa")))]
 843   "VECTOR_UNIT_VSX_P (<MODE>mode)"
 844   "x<VSv>cv<VSs>ux<VSc>s %x0,%x1"
 845   [(set_attr "type" "<VStype_simple>")
 846    (set_attr "fp_type" "<VSfptype_simple>")])
 847
 848 ;; Math rounding functions
 849 (define_insn "vsx_x<VSv>r<VSs>i"
 850   [(set (match_operand:VSX_B 0 "vsx_register_operand" "=<VSr>,?wa")
 851         (unspec:VSX_B [(match_operand:VSX_B 1 "vsx_register_operand" "<VSr>,wa")]
 852                       UNSPEC_VSX_ROUND_I))]
 853   "VECTOR_UNIT_VSX_P (<MODE>mode)"
 854   "x<VSv>r<VSs>i %x0,%x1"
 855   [(set_attr "type" "<VStype_simple>")
 856    (set_attr "fp_type" "<VSfptype_simple>")])
 857
 858 (define_insn "vsx_x<VSv>r<VSs>ic"
 859   [(set (match_operand:VSX_B 0 "vsx_register_operand" "=<VSr>,?wa")
 860         (unspec:VSX_B [(match_operand:VSX_B 1 "vsx_register_operand" "<VSr>,wa")]
 861                       UNSPEC_VSX_ROUND_IC))]
 862   "VECTOR_UNIT_VSX_P (<MODE>mode)"
 863   "x<VSv>r<VSs>ic %x0,%x1"
 864   [(set_attr "type" "<VStype_simple>")
 865    (set_attr "fp_type" "<VSfptype_simple>")])
 866
 867 (define_insn "vsx_btrunc<mode>2"
 868   [(set (match_operand:VSX_B 0 "vsx_register_operand" "=<VSr>,?wa")
 869         (fix:VSX_B (match_operand:VSX_B 1 "vsx_register_operand" "<VSr>,wa")))]
 870   "VECTOR_UNIT_VSX_P (<MODE>mode)"
 871   "x<VSv>r<VSs>iz %x0,%x1"
 872   [(set_attr "type" "<VStype_simple>")
 873    (set_attr "fp_type" "<VSfptype_simple>")])
 874
 875 (define_insn "*vsx_b2trunc<mode>2"
 876   [(set (match_operand:VSX_B 0 "vsx_register_operand" "=<VSr>,?wa")
 877         (unspec:VSX_B [(match_operand:VSX_B 1 "vsx_register_operand" "<VSr>,wa")]
 878                       UNSPEC_FRIZ))]
 879   "VECTOR_UNIT_VSX_P (<MODE>mode)"
 880   "x<VSv>r<VSs>iz %x0,%x1"
 881   [(set_attr "type" "<VStype_simple>")
 882    (set_attr "fp_type" "<VSfptype_simple>")])
 883
 884 (define_insn "vsx_floor<mode>2"
 885   [(set (match_operand:VSX_B 0 "vsx_register_operand" "=<VSr>,?wa")
 886         (unspec:VSX_B [(match_operand:VSX_B 1 "vsx_register_operand" "<VSr>,wa")]
 887                       UNSPEC_FRIM))]
 888   "VECTOR_UNIT_VSX_P (<MODE>mode)"
 889   "x<VSv>r<VSs>im %x0,%x1"
 890   [(set_attr "type" "<VStype_simple>")
 891    (set_attr "fp_type" "<VSfptype_simple>")])
 892
 893 (define_insn "vsx_ceil<mode>2"
 894   [(set (match_operand:VSX_B 0 "vsx_register_operand" "=<VSr>,?wa")
 895         (unspec:VSX_B [(match_operand:VSX_B 1 "vsx_register_operand" "<VSr>,wa")]
 896                       UNSPEC_FRIP))]
 897   "VECTOR_UNIT_VSX_P (<MODE>mode)"
 898   "x<VSv>r<VSs>ip %x0,%x1"
 899   [(set_attr "type" "<VStype_simple>")
 900    (set_attr "fp_type" "<VSfptype_simple>")])
 901
 902 \f
 903 ;; VSX convert to/from double vector
 904
 905 ;; Convert between single and double precision
 906 ;; Don't use xscvspdp and xscvdpsp for scalar conversions, since the normal
 907 ;; scalar single precision instructions internally use the double format.
 908 ;; Prefer the altivec registers, since we likely will need to do a vperm
 909 (define_insn "vsx_<VS_spdp_insn>"
 910   [(set (match_operand:<VS_spdp_res> 0 "vsx_register_operand" "=<VSr4>,?wa")
 911         (unspec:<VS_spdp_res> [(match_operand:VSX_SPDP 1 "vsx_register_operand" "<VSr5>,wa")]
 912                               UNSPEC_VSX_CVSPDP))]
 913   "VECTOR_UNIT_VSX_P (<MODE>mode)"
 914   "<VS_spdp_insn> %x0,%x1"
 915   [(set_attr "type" "<VS_spdp_type>")])
 916
 917 ;; xscvspdp, represent the scalar SF type as V4SF
 918 (define_insn "vsx_xscvspdp"
 919   [(set (match_operand:DF 0 "vsx_register_operand" "=ws,?wa")
 920         (unspec:DF [(match_operand:V4SF 1 "vsx_register_operand" "wa,wa")]
 921                    UNSPEC_VSX_CVSPDP))]
 922   "VECTOR_UNIT_VSX_P (V4SFmode)"
 923   "xscvspdp %x0,%x1"
 924   [(set_attr "type" "fp")])
 925
 926 ;; xscvdpsp used for splat'ing a scalar to V4SF, knowing that the internal SF
 927 ;; format of scalars is actually DF.
 928 (define_insn "vsx_xscvdpsp_scalar"
 929   [(set (match_operand:V4SF 0 "vsx_register_operand" "=wa")
 930         (unspec:V4SF [(match_operand:SF 1 "vsx_register_operand" "f")]
 931                      UNSPEC_VSX_CVSPDP))]
 932   "VECTOR_UNIT_VSX_P (V4SFmode)"
 933   "xscvdpsp %x0,%x1"
 934   [(set_attr "type" "fp")])
 935
 936 ;; Same as vsx_xscvspdp, but use SF as the type
 937 (define_insn "vsx_xscvspdp_scalar2"
 938   [(set (match_operand:SF 0 "vsx_register_operand" "=f")
 939         (unspec:SF [(match_operand:V4SF 1 "vsx_register_operand" "wa")]
 940                    UNSPEC_VSX_CVSPDP))]
 941   "VECTOR_UNIT_VSX_P (V4SFmode)"
 942   "xscvspdp %x0,%x1"
 943   [(set_attr "type" "fp")])
 944
 945 ;; Convert from 64-bit to 32-bit types
 946 ;; Note, favor the Altivec registers since the usual use of these instructions
 947 ;; is in vector converts and we need to use the Altivec vperm instruction.
 948
 949 (define_insn "vsx_xvcvdpsxws"
 950   [(set (match_operand:V4SI 0 "vsx_register_operand" "=v,?wa")
 951         (unspec:V4SI [(match_operand:V2DF 1 "vsx_register_operand" "wd,wa")]
 952                      UNSPEC_VSX_CVDPSXWS))]
 953   "VECTOR_UNIT_VSX_P (V2DFmode)"
 954   "xvcvdpsxws %x0,%x1"
 955   [(set_attr "type" "vecdouble")])
 956
 957 (define_insn "vsx_xvcvdpuxws"
 958   [(set (match_operand:V4SI 0 "vsx_register_operand" "=v,?wa")
 959         (unspec:V4SI [(match_operand:V2DF 1 "vsx_register_operand" "wd,wa")]
 960                      UNSPEC_VSX_CVDPUXWS))]
 961   "VECTOR_UNIT_VSX_P (V2DFmode)"
 962   "xvcvdpuxws %x0,%x1"
 963   [(set_attr "type" "vecdouble")])
 964
 965 (define_insn "vsx_xvcvsxdsp"
 966   [(set (match_operand:V4SI 0 "vsx_register_operand" "=wd,?wa")
 967         (unspec:V4SI [(match_operand:V2DF 1 "vsx_register_operand" "wf,wa")]
 968                      UNSPEC_VSX_CVSXDSP))]
 969   "VECTOR_UNIT_VSX_P (V2DFmode)"
 970   "xvcvsxdsp %x0,%x1"
 971   [(set_attr "type" "vecfloat")])
 972
 973 (define_insn "vsx_xvcvuxdsp"
 974   [(set (match_operand:V4SI 0 "vsx_register_operand" "=wd,?wa")
 975         (unspec:V4SI [(match_operand:V2DF 1 "vsx_register_operand" "wf,wa")]
 976                      UNSPEC_VSX_CVUXDSP))]
 977   "VECTOR_UNIT_VSX_P (V2DFmode)"
 978   "xvcvuxwdp %x0,%x1"
 979   [(set_attr "type" "vecdouble")])
 980
 981 ;; Convert from 32-bit to 64-bit types
 982 (define_insn "vsx_xvcvsxwdp"
 983   [(set (match_operand:V2DF 0 "vsx_register_operand" "=wd,?wa")
 984         (unspec:V2DF [(match_operand:V4SI 1 "vsx_register_operand" "wf,wa")]
 985                      UNSPEC_VSX_CVSXWDP))]
 986   "VECTOR_UNIT_VSX_P (V2DFmode)"
 987   "xvcvsxwdp %x0,%x1"
 988   [(set_attr "type" "vecdouble")])
 989
 990 (define_insn "vsx_xvcvuxwdp"
 991   [(set (match_operand:V2DF 0 "vsx_register_operand" "=wd,?wa")
 992         (unspec:V2DF [(match_operand:V4SI 1 "vsx_register_operand" "wf,wa")]
 993                      UNSPEC_VSX_CVUXWDP))]
 994   "VECTOR_UNIT_VSX_P (V2DFmode)"
 995   "xvcvuxwdp %x0,%x1"
 996   [(set_attr "type" "vecdouble")])
 997
 998 (define_insn "vsx_xvcvspsxds"
 999   [(set (match_operand:V2DI 0 "vsx_register_operand" "=v,?wa")
1000         (unspec:V2DI [(match_operand:V4SF 1 "vsx_register_operand" "wd,wa")]
1001                      UNSPEC_VSX_CVSPSXDS))]
1002   "VECTOR_UNIT_VSX_P (V2DFmode)"
1003   "xvcvspsxds %x0,%x1"
1004   [(set_attr "type" "vecdouble")])
1005
1006 (define_insn "vsx_xvcvspuxds"
1007   [(set (match_operand:V2DI 0 "vsx_register_operand" "=v,?wa")
1008         (unspec:V2DI [(match_operand:V4SF 1 "vsx_register_operand" "wd,wa")]
1009                      UNSPEC_VSX_CVSPUXDS))]
1010   "VECTOR_UNIT_VSX_P (V2DFmode)"
1011   "xvcvspuxds %x0,%x1"
1012   [(set_attr "type" "vecdouble")])
1013
1014 ;; Only optimize (float (fix x)) -> frz if we are in fast-math mode, since
1015 ;; since the xsrdpiz instruction does not truncate the value if the floating
1016 ;; point value is < LONG_MIN or > LONG_MAX.
1017 (define_insn "*vsx_float_fix_<mode>2"
1018   [(set (match_operand:VSX_DF 0 "vsx_register_operand" "=<VSr>,?wa")
1019         (float:VSX_DF
1020          (fix:<VSI>
1021           (match_operand:VSX_DF 1 "vsx_register_operand" "<VSr>,?wa"))))]
1022   "TARGET_HARD_FLOAT && TARGET_FPRS && TARGET_DOUBLE_FLOAT
1023    && VECTOR_UNIT_VSX_P (<MODE>mode) && flag_unsafe_math_optimizations
1024    && !flag_trapping_math && TARGET_FRIZ"
1025   "x<VSv>r<VSs>iz %x0,%x1"
1026   [(set_attr "type" "<VStype_simple>")
1027    (set_attr "fp_type" "<VSfptype_simple>")])
1028
1029 \f
1030 ;; Logical and permute operations
1031 (define_insn "*vsx_and<mode>3"
1032   [(set (match_operand:VSX_L 0 "vsx_register_operand" "=<VSr>,?wa")
1033         (and:VSX_L
1034          (match_operand:VSX_L 1 "vsx_register_operand" "<VSr>,?wa")
1035          (match_operand:VSX_L 2 "vsx_register_operand" "<VSr>,?wa")))]
1036   "VECTOR_MEM_VSX_P (<MODE>mode)"
1037   "xxland %x0,%x1,%x2"
1038   [(set_attr "type" "vecsimple")])
1039
1040 (define_insn "*vsx_ior<mode>3"
1041   [(set (match_operand:VSX_L 0 "vsx_register_operand" "=<VSr>,?wa")
1042         (ior:VSX_L (match_operand:VSX_L 1 "vsx_register_operand" "<VSr>,?wa")
1043                    (match_operand:VSX_L 2 "vsx_register_operand" "<VSr>,?wa")))]
1044   "VECTOR_MEM_VSX_P (<MODE>mode)"
1045   "xxlor %x0,%x1,%x2"
1046   [(set_attr "type" "vecsimple")])
1047
1048 (define_insn "*vsx_xor<mode>3"
1049   [(set (match_operand:VSX_L 0 "vsx_register_operand" "=<VSr>,?wa")
1050         (xor:VSX_L
1051          (match_operand:VSX_L 1 "vsx_register_operand" "<VSr>,?wa")
1052          (match_operand:VSX_L 2 "vsx_register_operand" "<VSr>,?wa")))]
1053   "VECTOR_MEM_VSX_P (<MODE>mode)"
1054   "xxlxor %x0,%x1,%x2"
1055   [(set_attr "type" "vecsimple")])
1056
1057 (define_insn "*vsx_one_cmpl<mode>2"
1058   [(set (match_operand:VSX_L 0 "vsx_register_operand" "=<VSr>,?wa")
1059         (not:VSX_L
1060          (match_operand:VSX_L 1 "vsx_register_operand" "<VSr>,?wa")))]
1061   "VECTOR_MEM_VSX_P (<MODE>mode)"
1062   "xxlnor %x0,%x1,%x1"
1063   [(set_attr "type" "vecsimple")])
1064
1065 (define_insn "*vsx_nor<mode>3"
1066   [(set (match_operand:VSX_L 0 "vsx_register_operand" "=<VSr>,?wa")
1067         (not:VSX_L
1068          (ior:VSX_L
1069           (match_operand:VSX_L 1 "vsx_register_operand" "<VSr>,?wa")
1070           (match_operand:VSX_L 2 "vsx_register_operand" "<VSr>,?wa"))))]
1071   "VECTOR_MEM_VSX_P (<MODE>mode)"
1072   "xxlnor %x0,%x1,%x2"
1073   [(set_attr "type" "vecsimple")])
1074
1075 (define_insn "*vsx_andc<mode>3"
1076   [(set (match_operand:VSX_L 0 "vsx_register_operand" "=<VSr>,?wa")
1077         (and:VSX_L
1078          (not:VSX_L
1079           (match_operand:VSX_L 2 "vsx_register_operand" "<VSr>,?wa"))
1080          (match_operand:VSX_L 1 "vsx_register_operand" "<VSr>,?wa")))]
1081   "VECTOR_MEM_VSX_P (<MODE>mode)"
1082   "xxlandc %x0,%x1,%x2"
1083   [(set_attr "type" "vecsimple")])
1084
1085 \f
1086 ;; Permute operations
1087
1088 ;; Build a V2DF/V2DI vector from two scalars
1089 (define_insn "vsx_concat_<mode>"
1090   [(set (match_operand:VSX_D 0 "vsx_register_operand" "=wd,?wa")
1091         (unspec:VSX_D
1092          [(match_operand:<VS_scalar> 1 "vsx_register_operand" "ws,wa")
1093           (match_operand:<VS_scalar> 2 "vsx_register_operand" "ws,wa")]
1094          UNSPEC_VSX_CONCAT))]
1095   "VECTOR_MEM_VSX_P (<MODE>mode)"
1096   "xxpermdi %x0,%x1,%x2,0"
1097   [(set_attr "type" "vecperm")])
1098
1099 ;; Special purpose concat using xxpermdi to glue two single precision values
1100 ;; together, relying on the fact that internally scalar floats are represented
1101 ;; as doubles.  This is used to initialize a V4SF vector with 4 floats
1102 (define_insn "vsx_concat_v2sf"
1103   [(set (match_operand:V2DF 0 "vsx_register_operand" "=wd,?wa")
1104         (unspec:V2DF
1105          [(match_operand:SF 1 "vsx_register_operand" "f,f")
1106           (match_operand:SF 2 "vsx_register_operand" "f,f")]
1107          UNSPEC_VSX_CONCAT))]
1108   "VECTOR_MEM_VSX_P (V2DFmode)"
1109   "xxpermdi %x0,%x1,%x2,0"
1110   [(set_attr "type" "vecperm")])
1111
1112 ;; Set the element of a V2DI/VD2F mode
1113 (define_insn "vsx_set_<mode>"
1114   [(set (match_operand:VSX_D 0 "vsx_register_operand" "=wd,?wa")
1115         (unspec:VSX_D [(match_operand:VSX_D 1 "vsx_register_operand" "wd,wa")
1116                        (match_operand:<VS_scalar> 2 "vsx_register_operand" "ws,wa")
1117                        (match_operand:QI 3 "u5bit_cint_operand" "i,i")]
1118                       UNSPEC_VSX_SET))]
1119   "VECTOR_MEM_VSX_P (<MODE>mode)"
1120 {
1121   if (INTVAL (operands[3]) == 0)
1122     return \"xxpermdi %x0,%x2,%x1,1\";
1123   else if (INTVAL (operands[3]) == 1)
1124     return \"xxpermdi %x0,%x1,%x2,0\";
1125   else
1126     gcc_unreachable ();
1127 }
1128   [(set_attr "type" "vecperm")])
1129
1130 ;; Extract a DF/DI element from V2DF/V2DI
1131 (define_insn "vsx_extract_<mode>"
1132   [(set (match_operand:<VS_scalar> 0 "vsx_register_operand" "=ws,d,?wa")
1133         (vec_select:<VS_scalar> (match_operand:VSX_D 1 "vsx_register_operand" "wd,wd,wa")
1134                        (parallel
1135                         [(match_operand:QI 2 "u5bit_cint_operand" "i,i,i")])))]
1136   "VECTOR_MEM_VSX_P (<MODE>mode)"
1137 {
1138   gcc_assert (UINTVAL (operands[2]) <= 1);
1139   operands[3] = GEN_INT (INTVAL (operands[2]) << 1);
1140   return \"xxpermdi %x0,%x1,%x1,%3\";
1141 }
1142   [(set_attr "type" "vecperm")])
1143
1144 ;; Optimize extracting element 0 from memory
1145 (define_insn "*vsx_extract_<mode>_zero"
1146   [(set (match_operand:<VS_scalar> 0 "vsx_register_operand" "=ws,d,?wa")
1147         (vec_select:<VS_scalar>
1148          (match_operand:VSX_D 1 "indexed_or_indirect_operand" "Z,Z,Z")
1149          (parallel [(const_int 0)])))]
1150   "VECTOR_MEM_VSX_P (<MODE>mode) && WORDS_BIG_ENDIAN"
1151   "lxsd%U1x %x0,%y1"
1152   [(set_attr "type" "fpload")
1153    (set_attr "length" "4")])
1154
1155 ;; Extract a SF element from V4SF
1156 (define_insn_and_split "vsx_extract_v4sf"
1157   [(set (match_operand:SF 0 "vsx_register_operand" "=f,f")
1158         (vec_select:SF
1159          (match_operand:V4SF 1 "vsx_register_operand" "wa,wa")
1160          (parallel [(match_operand:QI 2 "u5bit_cint_operand" "O,i")])))
1161    (clobber (match_scratch:V4SF 3 "=X,0"))]
1162   "VECTOR_UNIT_VSX_P (V4SFmode)"
1163   "@
1164    xscvspdp %x0,%x1
1165    #"
1166   ""
1167   [(const_int 0)]
1168   "
1169 {
1170   rtx op0 = operands[0];
1171   rtx op1 = operands[1];
1172   rtx op2 = operands[2];
1173   rtx op3 = operands[3];
1174   rtx tmp;
1175   HOST_WIDE_INT ele = INTVAL (op2);
1176
1177   if (ele == 0)
1178     tmp = op1;
1179   else
1180     {
1181       if (GET_CODE (op3) == SCRATCH)
1182         op3 = gen_reg_rtx (V4SFmode);
1183       emit_insn (gen_vsx_xxsldwi_v4sf (op3, op1, op1, op2));
1184       tmp = op3;
1185     }
1186   emit_insn (gen_vsx_xscvspdp_scalar2 (op0, tmp));
1187   DONE;
1188 }"
1189   [(set_attr "length" "4,8")
1190    (set_attr "type" "fp")])
1191
1192 ;; Expand the builtin form of xxpermdi to canonical rtl.
1193 (define_expand "vsx_xxpermdi_<mode>"
1194   [(match_operand:VSX_L 0 "vsx_register_operand" "")
1195    (match_operand:VSX_L 1 "vsx_register_operand" "")
1196    (match_operand:VSX_L 2 "vsx_register_operand" "")
1197    (match_operand:QI 3 "u5bit_cint_operand" "")]
1198   "VECTOR_MEM_VSX_P (<MODE>mode)"
1199 {
1200   rtx target = operands[0];
1201   rtx op0 = operands[1];
1202   rtx op1 = operands[2];
1203   int mask = INTVAL (operands[3]);
1204   rtx perm0 = GEN_INT ((mask >> 1) & 1);
1205   rtx perm1 = GEN_INT ((mask & 1) + 2);
1206   rtx (*gen) (rtx, rtx, rtx, rtx, rtx);
1207
1208   if (<MODE>mode == V2DFmode)
1209     gen = gen_vsx_xxpermdi2_v2df_1;
1210   else
1211     {
1212       gen = gen_vsx_xxpermdi2_v2di_1;
1213       if (<MODE>mode != V2DImode)
1214         {
1215           target = gen_lowpart (V2DImode, target);
1216           op0 = gen_lowpart (V2DImode, target);
1217           op1 = gen_lowpart (V2DImode, target);
1218         }
1219     }
1220   emit_insn (gen (target, op0, op1, perm0, perm1));
1221   DONE;
1222 })
1223
1224 (define_insn "vsx_xxpermdi2_<mode>_1"
1225   [(set (match_operand:VSX_D 0 "vsx_register_operand" "=wd")
1226         (vec_select:VSX_D
1227           (vec_concat:<VS_double>
1228             (match_operand:VSX_D 1 "vsx_register_operand" "wd")
1229             (match_operand:VSX_D 2 "vsx_register_operand" "wd"))
1230           (parallel [(match_operand 3 "const_0_to_1_operand" "")
1231                      (match_operand 4 "const_2_to_3_operand" "")])))]
1232   "VECTOR_MEM_VSX_P (<MODE>mode)"
1233 {
1234   int mask = (INTVAL (operands[3]) << 1) | (INTVAL (operands[4]) - 2);
1235   operands[3] = GEN_INT (mask);
1236   return "xxpermdi %x0,%x1,%x2,%3";
1237 }
1238   [(set_attr "type" "vecperm")])
1239
1240 (define_expand "vec_perm_const<mode>"
1241   [(match_operand:VSX_D 0 "vsx_register_operand" "")
1242    (match_operand:VSX_D 1 "vsx_register_operand" "")
1243    (match_operand:VSX_D 2 "vsx_register_operand" "")
1244    (match_operand:V2DI  3 "" "")]
1245   "VECTOR_MEM_VSX_P (<MODE>mode)"
1246 {
1247   if (rs6000_expand_vec_perm_const (operands))
1248     DONE;
1249   else
1250     FAIL;
1251 })
1252
1253 ;; Expanders for builtins
1254 (define_expand "vsx_mergel_<mode>"
1255   [(set (match_operand:VSX_D 0 "vsx_register_operand" "")
1256         (vec_select:VSX_D
1257           (vec_concat:<VS_double>
1258             (match_operand:VSX_D 1 "vsx_register_operand" "")
1259             (match_operand:VSX_D 2 "vsx_register_operand" ""))
1260           (parallel [(const_int 1) (const_int 3)])))]
1261   "VECTOR_MEM_VSX_P (<MODE>mode)"
1262   "")
1263
1264 (define_expand "vsx_mergeh_<mode>"
1265   [(set (match_operand:VSX_D 0 "vsx_register_operand" "")
1266         (vec_select:VSX_D
1267           (vec_concat:<VS_double>
1268             (match_operand:VSX_D 1 "vsx_register_operand" "")
1269             (match_operand:VSX_D 2 "vsx_register_operand" ""))
1270           (parallel [(const_int 0) (const_int 2)])))]
1271   "VECTOR_MEM_VSX_P (<MODE>mode)"
1272   "")
1273
1274 ;; V2DF/V2DI splat
1275 (define_insn "vsx_splat_<mode>"
1276   [(set (match_operand:VSX_D 0 "vsx_register_operand" "=wd,wd,wd,?wa,?wa,?wa")
1277         (vec_duplicate:VSX_D
1278          (match_operand:<VS_scalar> 1 "splat_input_operand" "ws,f,Z,wa,wa,Z")))]
1279   "VECTOR_MEM_VSX_P (<MODE>mode)"
1280   "@
1281    xxpermdi %x0,%x1,%x1,0
1282    xxpermdi %x0,%x1,%x1,0
1283    lxvdsx %x0,%y1
1284    xxpermdi %x0,%x1,%x1,0
1285    xxpermdi %x0,%x1,%x1,0
1286    lxvdsx %x0,%y1"
1287   [(set_attr "type" "vecperm,vecperm,vecload,vecperm,vecperm,vecload")])
1288
1289 ;; V4SF/V4SI splat
1290 (define_insn "vsx_xxspltw_<mode>"
1291   [(set (match_operand:VSX_W 0 "vsx_register_operand" "=wf,?wa")
1292         (vec_duplicate:VSX_W
1293          (vec_select:<VS_scalar>
1294           (match_operand:VSX_W 1 "vsx_register_operand" "wf,wa")
1295           (parallel
1296            [(match_operand:QI 2 "u5bit_cint_operand" "i,i")]))))]
1297   "VECTOR_MEM_VSX_P (<MODE>mode)"
1298   "xxspltw %x0,%x1,%2"
1299   [(set_attr "type" "vecperm")])
1300
1301 ;; V4SF/V4SI interleave
1302 (define_insn "vsx_xxmrghw_<mode>"
1303   [(set (match_operand:VSX_W 0 "vsx_register_operand" "=wf,?wa")
1304         (vec_select:VSX_W
1305           (vec_concat:<VS_double>
1306             (match_operand:VSX_W 1 "vsx_register_operand" "wf,wa")
1307             (match_operand:VSX_W 2 "vsx_register_operand" "wf,wa"))
1308           (parallel [(const_int 0) (const_int 4)
1309                      (const_int 1) (const_int 5)])))]
1310   "VECTOR_MEM_VSX_P (<MODE>mode)"
1311   "xxmrghw %x0,%x1,%x2"
1312   [(set_attr "type" "vecperm")])
1313
1314 (define_insn "vsx_xxmrglw_<mode>"
1315   [(set (match_operand:VSX_W 0 "vsx_register_operand" "=wf,?wa")
1316         (vec_select:VSX_W
1317           (vec_concat:<VS_double>
1318             (match_operand:VSX_W 1 "vsx_register_operand" "wf,wa")
1319             (match_operand:VSX_W 2 "vsx_register_operand" "wf,?wa"))
1320           (parallel [(const_int 2) (const_int 6)
1321                      (const_int 3) (const_int 7)])))]
1322   "VECTOR_MEM_VSX_P (<MODE>mode)"
1323   "xxmrglw %x0,%x1,%x2"
1324   [(set_attr "type" "vecperm")])
1325
1326 ;; Shift left double by word immediate
1327 (define_insn "vsx_xxsldwi_<mode>"
1328   [(set (match_operand:VSX_L 0 "vsx_register_operand" "=wa")
1329         (unspec:VSX_L [(match_operand:VSX_L 1 "vsx_register_operand" "wa")
1330                        (match_operand:VSX_L 2 "vsx_register_operand" "wa")
1331                        (match_operand:QI 3 "u5bit_cint_operand" "i")]
1332                       UNSPEC_VSX_SLDWI))]
1333   "VECTOR_MEM_VSX_P (<MODE>mode)"
1334   "xxsldwi %x0,%x1,%x2,%3"
1335   [(set_attr "type" "vecperm")])
1336
1337 \f
1338 ;; Vector reduction insns and splitters
1339
1340 (define_insn_and_split "*vsx_reduc_<VEC_reduc_name>_v2df"
1341   [(set (match_operand:V2DF 0 "vfloat_operand" "=&wd,&?wa,wd,?wa")
1342         (VEC_reduc:V2DF
1343          (vec_concat:V2DF
1344           (vec_select:DF
1345            (match_operand:V2DF 1 "vfloat_operand" "wd,wa,wd,wa")
1346            (parallel [(const_int 1)]))
1347           (vec_select:DF
1348            (match_dup 1)
1349            (parallel [(const_int 0)])))
1350          (match_dup 1)))
1351    (clobber (match_scratch:V2DF 2 "=0,0,&wd,&wa"))]
1352   "VECTOR_UNIT_VSX_P (V2DFmode)"
1353   "#"
1354   ""
1355   [(const_int 0)]
1356   "
1357 {
1358   rtx tmp = (GET_CODE (operands[2]) == SCRATCH)
1359              ? gen_reg_rtx (V2DFmode)
1360              : operands[2];
1361   emit_insn (gen_vsx_xxsldwi_v2df (tmp, operands[1], operands[1], const2_rtx));
1362   emit_insn (gen_<VEC_reduc_rtx>v2df3 (operands[0], tmp, operands[1]));
1363   DONE;
1364 }"
1365   [(set_attr "length" "8")
1366    (set_attr "type" "veccomplex")])
1367
1368 (define_insn_and_split "*vsx_reduc_<VEC_reduc_name>_v4sf"
1369   [(set (match_operand:V4SF 0 "vfloat_operand" "=wf,?wa")
1370         (VEC_reduc:V4SF
1371          (unspec:V4SF [(const_int 0)] UNSPEC_REDUC)
1372          (match_operand:V4SF 1 "vfloat_operand" "wf,wa")))
1373    (clobber (match_scratch:V4SF 2 "=&wf,&wa"))
1374    (clobber (match_scratch:V4SF 3 "=&wf,&wa"))]
1375   "VECTOR_UNIT_VSX_P (V4SFmode)"
1376   "#"
1377   ""
1378   [(const_int 0)]
1379   "
1380 {
1381   rtx op0 = operands[0];
1382   rtx op1 = operands[1];
1383   rtx tmp2, tmp3, tmp4;
1384
1385   if (can_create_pseudo_p ())
1386     {
1387       tmp2 = gen_reg_rtx (V4SFmode);
1388       tmp3 = gen_reg_rtx (V4SFmode);
1389       tmp4 = gen_reg_rtx (V4SFmode);
1390     }
1391   else
1392     {
1393       tmp2 = operands[2];
1394       tmp3 = operands[3];
1395       tmp4 = tmp2;
1396     }
1397
1398   emit_insn (gen_vsx_xxsldwi_v4sf (tmp2, op1, op1, const2_rtx));
1399   emit_insn (gen_<VEC_reduc_rtx>v4sf3 (tmp3, tmp2, op1));
1400   emit_insn (gen_vsx_xxsldwi_v4sf (tmp4, tmp3, tmp3, GEN_INT (3)));
1401   emit_insn (gen_<VEC_reduc_rtx>v4sf3 (op0, tmp4, tmp3));
1402   DONE;
1403 }"
1404   [(set_attr "length" "16")
1405    (set_attr "type" "veccomplex")])
1406
1407 ;; Combiner patterns with the vector reduction patterns that knows we can get
1408 ;; to the top element of the V2DF array without doing an extract.
1409
1410 (define_insn_and_split "*vsx_reduc_<VEC_reduc_name>_v2df_scalar"
1411   [(set (match_operand:DF 0 "vfloat_operand" "=&ws,&?wa,ws,?wa")
1412         (vec_select:DF
1413          (VEC_reduc:V2DF
1414           (vec_concat:V2DF
1415            (vec_select:DF
1416             (match_operand:V2DF 1 "vfloat_operand" "wd,wa,wd,wa")
1417             (parallel [(const_int 1)]))
1418            (vec_select:DF
1419             (match_dup 1)
1420             (parallel [(const_int 0)])))
1421           (match_dup 1))
1422          (parallel [(const_int 1)])))
1423    (clobber (match_scratch:DF 2 "=0,0,&wd,&wa"))]
1424   "VECTOR_UNIT_VSX_P (V2DFmode)"
1425   "#"
1426   ""
1427   [(const_int 0)]
1428   "
1429 {
1430   rtx hi = gen_highpart (DFmode, operands[1]);
1431   rtx lo = (GET_CODE (operands[2]) == SCRATCH)
1432             ? gen_reg_rtx (DFmode)
1433             : operands[2];
1434
1435   emit_insn (gen_vsx_extract_v2df (lo, operands[1], const1_rtx));
1436   emit_insn (gen_<VEC_reduc_rtx>df3 (operands[0], hi, lo));
1437   DONE;
1438 }"
1439   [(set_attr "length" "8")
1440    (set_attr "type" "veccomplex")])
1441
1442 (define_insn_and_split "*vsx_reduc_<VEC_reduc_name>_v4sf_scalar"
1443   [(set (match_operand:SF 0 "vfloat_operand" "=f,?f")
1444         (vec_select:SF
1445          (VEC_reduc:V4SF
1446           (unspec:V4SF [(const_int 0)] UNSPEC_REDUC)
1447           (match_operand:V4SF 1 "vfloat_operand" "wf,wa"))
1448          (parallel [(const_int 3)])))
1449    (clobber (match_scratch:V4SF 2 "=&wf,&wa"))
1450    (clobber (match_scratch:V4SF 3 "=&wf,&wa"))
1451    (clobber (match_scratch:V4SF 4 "=0,0"))]
1452   "VECTOR_UNIT_VSX_P (V4SFmode)"
1453   "#"
1454   ""
1455   [(const_int 0)]
1456   "
1457 {
1458   rtx op0 = operands[0];
1459   rtx op1 = operands[1];
1460   rtx tmp2, tmp3, tmp4, tmp5;
1461
1462   if (can_create_pseudo_p ())
1463     {
1464       tmp2 = gen_reg_rtx (V4SFmode);
1465       tmp3 = gen_reg_rtx (V4SFmode);
1466       tmp4 = gen_reg_rtx (V4SFmode);
1467       tmp5 = gen_reg_rtx (V4SFmode);
1468     }
1469   else
1470     {
1471       tmp2 = operands[2];
1472       tmp3 = operands[3];
1473       tmp4 = tmp2;
1474       tmp5 = operands[4];
1475     }
1476
1477   emit_insn (gen_vsx_xxsldwi_v4sf (tmp2, op1, op1, const2_rtx));
1478   emit_insn (gen_<VEC_reduc_rtx>v4sf3 (tmp3, tmp2, op1));
1479   emit_insn (gen_vsx_xxsldwi_v4sf (tmp4, tmp3, tmp3, GEN_INT (3)));
1480   emit_insn (gen_<VEC_reduc_rtx>v4sf3 (tmp5, tmp4, tmp3));
1481   emit_insn (gen_vsx_xscvspdp_scalar2 (op0, tmp5));
1482   DONE;
1483 }"
1484   [(set_attr "length" "20")
1485    (set_attr "type" "veccomplex")])