PPC JIT optimizations (System.Math instruction inlining) (#11964)
[mono-project.git] / mono / mini / cpu-ppc.md
blobcb31d18c908cf11157f0994298a65ea220b367ce
1 # powerpc cpu description file
2 # this file is read by genmdesc to pruduce a table with all the relevant information
3 # about the cpu instructions that may be used by the regsiter allocator, the scheduler
4 # and other parts of the arch-dependent part of mini.
6 # An opcode name is followed by a colon and optional specifiers.
7 # A specifier has a name, a colon and a value. Specifiers are separated by white space.
8 # Here is a description of the specifiers valid for this file and their possible values.
10 # dest:register       describes the destination register of an instruction
11 # src1:register       describes the first source register of an instruction
12 # src2:register       describes the second source register of an instruction
14 # register may have the following values:
15 #       i  integer register
16 #       a  r3 register (output from calls)
17 #       b  base register (used in address references)
18 #       f  floating point register
20 # len:number         describe the maximun length in bytes of the instruction
21 # number is a positive integer
23 # cost:number        describe how many cycles are needed to complete the instruction (unused)
25 # clob:spec          describe if the instruction clobbers registers or has special needs
27 # spec can be one of the following characters:
28 #       c  clobbers caller-save registers
29 #       r  'reserves' the destination register until a later instruction unreserves it
30 #          used mostly to set output registers in function calls
32 # flags:spec        describe if the instruction uses or sets the flags (unused)
34 # spec can be one of the following chars:
35 #       s  sets the flags
36 #       u  uses the flags
37 #       m  uses and modifies the flags
39 # res:spec          describe what units are used in the processor (unused)
41 # delay:            describe delay slots (unused)
43 # the required specifiers are: len, clob (if registers are clobbered), the registers
44 # specifiers if the registers are actually used, flags (when scheduling is implemented).
46 # See the code in mini-x86.c for more details on how the specifiers are used.
48 memory_barrier: len:4
49 nop: len:4
50 relaxed_nop: len:4
51 break: len:32
52 seq_point: len:24
53 il_seq_point: len:0
54 tailcall: len:120 clob:c
56 # PowerPC outputs a nice fixed size memcpy loop for larger stack_usage, so 0.
57 tailcall_parameter: len:0
59 call: dest:a clob:c len:16
60 br: len:4
61 throw: src1:i len:20
62 rethrow: src1:i len:20
63 ckfinite: dest:f src1:f
64 ppc_check_finite: src1:i len:16
65 add_ovf_carry: dest:i src1:i src2:i len:16
66 sub_ovf_carry: dest:i src1:i src2:i len:16
67 add_ovf_un_carry: dest:i src1:i src2:i len:16
68 sub_ovf_un_carry: dest:i src1:i src2:i len:16
69 start_handler: len:32
70 endfinally: len:28
71 ceq: dest:i len:12
72 cgt: dest:i len:12
73 cgt_un: dest:i len:12
74 clt: dest:i len:12
75 clt_un: dest:i len:12
76 localloc: dest:i src1:i len:60
77 compare: src1:i src2:i len:4
78 compare_imm: src1:i len:12
79 fcompare: src1:f src2:f len:12
80 arglist: src1:i len:12
81 setlret: src1:i src2:i len:12
82 check_this: src1:b len:4
83 voidcall: len:16 clob:c
84 voidcall_reg: src1:i len:16 clob:c
85 voidcall_membase: src1:b len:16 clob:c
86 fcall: dest:g len:16 clob:c
87 fcall_reg: dest:g src1:i len:16 clob:c
88 fcall_membase: dest:g src1:b len:16 clob:c
89 lcall: dest:l len:16 clob:c
90 lcall_reg: dest:l src1:i len:16 clob:c
91 lcall_membase: dest:l src1:b len:16 clob:c
92 vcall: len:16 clob:c
93 vcall_reg: src1:i len:16 clob:c
94 vcall_membase: src1:b len:16 clob:c
95 call_reg: dest:a src1:i len:16 clob:c
96 call_membase: dest:a src1:b len:16 clob:c
97 iconst: dest:i len:8
98 r4const: dest:f len:12
99 r8const: dest:f len:24
100 label: len:0
101 store_membase_reg: dest:b src1:i len:12
102 storei1_membase_reg: dest:b src1:i len:12
103 storei2_membase_reg: dest:b src1:i len:12
104 storei4_membase_reg: dest:b src1:i len:12
105 storer4_membase_reg: dest:b src1:f len:16
106 storer8_membase_reg: dest:b src1:f len:12
107 load_membase: dest:i src1:b len:12
108 loadi1_membase: dest:i src1:b len:16
109 loadu1_membase: dest:i src1:b len:12
110 loadi2_membase: dest:i src1:b len:12
111 loadu2_membase: dest:i src1:b len:12
112 loadi4_membase: dest:i src1:b len:12
113 loadu4_membase: dest:i src1:b len:12
114 loadr4_membase: dest:f src1:b len:12
115 loadr8_membase: dest:f src1:b len:12
116 load_memindex: dest:i src1:b src2:i len:4
117 loadi1_memindex: dest:i src1:b src2:i len:8
118 loadu1_memindex: dest:i src1:b src2:i len:4
119 loadi2_memindex: dest:i src1:b src2:i len:4
120 loadu2_memindex: dest:i src1:b src2:i len:4
121 loadi4_memindex: dest:i src1:b src2:i len:4
122 loadu4_memindex: dest:i src1:b src2:i len:4
123 loadr4_memindex: dest:f src1:b src2:i len:4
124 loadr8_memindex: dest:f src1:b src2:i len:4
125 store_memindex: dest:b src1:i src2:i len:4
126 storei1_memindex: dest:b src1:i src2:i len:4
127 storei2_memindex: dest:b src1:i src2:i len:4
128 storei4_memindex: dest:b src1:i src2:i len:4
129 storer4_memindex: dest:b src1:i src2:i len:8
130 storer8_memindex: dest:b src1:i src2:i len:4
131 loadu4_mem: dest:i len:8
132 move: dest:i src1:i len:4
133 fmove: dest:f src1:f len:4
134 move_f_to_i4: dest:i src1:f len:8
135 move_i4_to_f: dest:f src1:i len:8
136 add_imm: dest:i src1:i len:4
137 sub_imm: dest:i src1:i len:4
138 mul_imm: dest:i src1:i len:4
139 # there is no actual support for division or reminder by immediate
140 # we simulate them, though (but we need to change the burg rules 
141 # to allocate a symbolic reg for src2)
142 div_imm: dest:i src1:i src2:i len:20
143 div_un_imm: dest:i src1:i src2:i len:12
144 rem_imm: dest:i src1:i src2:i len:28
145 rem_un_imm: dest:i src1:i src2:i len:16
146 and_imm: dest:i src1:i len:4
147 or_imm: dest:i src1:i len:4
148 xor_imm: dest:i src1:i len:4
149 shl_imm: dest:i src1:i len:4
150 shr_imm: dest:i src1:i len:4
151 shr_un_imm: dest:i src1:i len:4
152 cond_exc_eq: len:8
153 cond_exc_ne_un: len:8
154 cond_exc_lt: len:8
155 cond_exc_lt_un: len:8
156 cond_exc_gt: len:8
157 cond_exc_gt_un: len:8
158 cond_exc_ge: len:8
159 cond_exc_ge_un: len:8
160 cond_exc_le: len:8
161 cond_exc_le_un: len:8
162 cond_exc_ov: len:12
163 cond_exc_no: len:8
164 cond_exc_c: len:12
165 cond_exc_nc: len:8
166 long_conv_to_ovf_i: dest:i src1:i src2:i len:32
167 long_mul_ovf: 
168 long_conv_to_r_un: dest:f src1:i src2:i len:37 
169 float_beq: len:8
170 float_bne_un: len:8
171 float_blt: len:8
172 float_blt_un: len:8
173 float_bgt: len:8
174 float_bgt_un: len:8
175 float_bge: len:8
176 float_bge_un: len:8
177 float_ble: len:8
178 float_ble_un: len:8
179 float_add: dest:f src1:f src2:f len:4
180 float_sub: dest:f src1:f src2:f len:4
181 float_mul: dest:f src1:f src2:f len:4
182 float_div: dest:f src1:f src2:f len:4
183 float_div_un: dest:f src1:f src2:f len:4
184 float_rem: dest:f src1:f src2:f len:16
185 float_rem_un: dest:f src1:f src2:f len:16
186 float_neg: dest:f src1:f len:4
187 float_not: dest:f src1:f len:4
188 float_conv_to_i1: dest:i src1:f len:40
189 float_conv_to_i2: dest:i src1:f len:40
190 float_conv_to_i4: dest:i src1:f len:40
191 float_conv_to_i8: dest:l src1:f len:40
192 float_conv_to_r4: dest:f src1:f len:4
193 float_conv_to_u4: dest:i src1:f len:40
194 float_conv_to_u8: dest:l src1:f len:40
195 float_conv_to_u2: dest:i src1:f len:40
196 float_conv_to_u1: dest:i src1:f len:40
197 float_conv_to_i: dest:i src1:f len:40
198 float_ceq: dest:i src1:f src2:f len:16
199 float_cgt: dest:i src1:f src2:f len:16
200 float_cgt_un: dest:i src1:f src2:f len:20
201 float_clt: dest:i src1:f src2:f len:16
202 float_clt_un: dest:i src1:f src2:f len:20
203 float_conv_to_u: dest:i src1:f len:36
204 float_cneq: dest:i src1:f src2:f len:16
205 float_cge: dest:i src1:f src2:f len:16
206 float_cle: dest:i src1:f src2:f len:16
207 call_handler: len:12 clob:c
208 endfilter: src1:i len:32
209 aotconst: dest:i len:8
210 load_gotaddr: dest:i len:32
211 got_entry: dest:i src1:b len:32
212 abs: dest:f src1:f len:4
213 sqrt: dest:f src1:f len:4
214 sqrtf: dest:f src1:f len:4
215 round: dest:f src1:f len:4
216 ppc_trunc: dest:f src1:f len:4
217 ppc_ceil: dest:f src1:f len:4
218 ppc_floor: dest:f src1:f len:4
219 adc: dest:i src1:i src2:i len:4
220 addcc: dest:i src1:i src2:i len:4
221 subcc: dest:i src1:i src2:i len:4
222 addcc_imm: dest:i src1:i len:4
223 sbb: dest:i src1:i src2:i len:4
224 br_reg: src1:i len:8
225 ppc_subfic: dest:i src1:i len:4
226 ppc_subfze: dest:i src1:i len:4
227 bigmul: len:12 dest:l src1:i src2:i
228 bigmul_un: len:12 dest:l src1:i src2:i
230 # Linear IR opcodes
231 dummy_use: src1:i len:0
232 dummy_iconst: dest:i len:0
233 dummy_r8const: dest:f len:0
234 dummy_r4const: dest:f len:0
235 not_reached: len:0
236 not_null: src1:i len:0
238 # 32 bit opcodes
239 int_add: dest:i src1:i src2:i len:4
240 int_sub: dest:i src1:i src2:i len:4
241 int_mul: dest:i src1:i src2:i len:4
242 int_div: dest:i src1:i src2:i len:40
243 int_div_un: dest:i src1:i src2:i len:16
244 int_rem: dest:i src1:i src2:i len:48
245 int_rem_un: dest:i src1:i src2:i len:24
246 int_and: dest:i src1:i src2:i len:4
247 int_or: dest:i src1:i src2:i len:4
248 int_xor: dest:i src1:i src2:i len:4
249 int_shl: dest:i src1:i src2:i len:4
250 int_shr: dest:i src1:i src2:i len:4
251 int_shr_un: dest:i src1:i src2:i len:4
252 int_neg: dest:i src1:i len:4
253 int_not: dest:i src1:i len:4
254 int_conv_to_i1: dest:i src1:i len:8
255 int_conv_to_i2: dest:i src1:i len:8
256 int_conv_to_i4: dest:i src1:i len:4
257 int_conv_to_r4: dest:f src1:i len:36
258 int_conv_to_r8: dest:f src1:i len:36
259 int_conv_to_u4: dest:i src1:i
260 int_conv_to_u2: dest:i src1:i len:8
261 int_conv_to_u1: dest:i src1:i len:4
262 int_beq: len:8
263 int_bge: len:8
264 int_bgt: len:8
265 int_ble: len:8
266 int_blt: len:8
267 int_bne_un: len:8
268 int_bge_un: len:8
269 int_bgt_un: len:8
270 int_ble_un: len:8
271 int_blt_un: len:8
272 int_add_ovf: dest:i src1:i src2:i len:16
273 int_add_ovf_un: dest:i src1:i src2:i len:16
274 int_mul_ovf: dest:i src1:i src2:i len:16
275 int_mul_ovf_un: dest:i src1:i src2:i len:16
276 int_sub_ovf: dest:i src1:i src2:i len:16
277 int_sub_ovf_un: dest:i src1:i src2:i len:16
279 int_adc: dest:i src1:i src2:i len:4
280 int_addcc: dest:i src1:i src2:i len:4
281 int_subcc: dest:i src1:i src2:i len:4
282 int_sbb: dest:i src1:i src2:i len:4
283 int_adc_imm: dest:i src1:i len:12
284 int_sbb_imm: dest:i src1:i len:12
286 int_add_imm: dest:i src1:i len:12
287 int_sub_imm: dest:i src1:i len:12
288 int_mul_imm: dest:i src1:i len:12
289 int_div_imm: dest:i src1:i len:20
290 int_div_un_imm: dest:i src1:i len:12
291 int_rem_imm: dest:i src1:i len:28
292 int_rem_un_imm: dest:i src1:i len:16
293 int_and_imm: dest:i src1:i len:12
294 int_or_imm: dest:i src1:i len:12
295 int_xor_imm: dest:i src1:i len:12
296 int_shl_imm: dest:i src1:i len:8
297 int_shr_imm: dest:i src1:i len:8
298 int_shr_un_imm: dest:i src1:i len:8
300 int_ceq: dest:i len:12
301 int_cgt: dest:i len:12
302 int_cgt_un: dest:i len:12
303 int_clt: dest:i len:12
304 int_clt_un: dest:i len:12
306 int_cneq: dest:i len:12
307 int_cge: dest:i len:12
308 int_cle: dest:i len:12
309 int_cge_un: dest:i len:12
310 int_cle_un: dest:i len:12
312 cond_exc_ieq: len:8
313 cond_exc_ine_un: len:8
314 cond_exc_ilt: len:8
315 cond_exc_ilt_un: len:8
316 cond_exc_igt: len:8
317 cond_exc_igt_un: len:8
318 cond_exc_ige: len:8
319 cond_exc_ige_un: len:8
320 cond_exc_ile: len:8
321 cond_exc_ile_un: len:8
322 cond_exc_iov: len:12
323 cond_exc_ino: len:8
324 cond_exc_ic: len:12
325 cond_exc_inc: len:8
327 icompare: src1:i src2:i len:4
328 icompare_imm: src1:i len:12
330 long_conv_to_ovf_i4_2: dest:i src1:i src2:i len:32
332 # shouldn't use long stuff on ppc32
333 #long_min: dest:i src1:i src2:i len:8 clob:1
334 #long_min_un: dest:i src1:i src2:i len:8 clob:1
335 #long_max: dest:i src1:i src2:i len:8 clob:1
336 #long_max_un: dest:i src1:i src2:i len:8 clob:1
337 int_min: dest:i src1:i src2:i len:8 clob:1
338 int_max: dest:i src1:i src2:i len:8 clob:1
339 int_min_un: dest:i src1:i src2:i len:8 clob:1
340 int_max_un: dest:i src1:i src2:i len:8 clob:1
342 vcall2: len:20 clob:c
343 vcall2_reg: src1:i len:8 clob:c
344 vcall2_membase: src1:b len:16 clob:c
346 jump_table: dest:i len:8
348 atomic_add_i4: src1:b src2:i dest:i len:28
349 atomic_cas_i4: src1:b src2:i src3:i dest:i len:38
351 liverange_start: len:0
352 liverange_end: len:0
353 gc_safe_point: len:0