if_iwm - Recognize IWM_FW_PAGING_BLOCK_CMD wide cmd response correctly.
[dragonfly.git] / lib / libcrypto / asm / sha1-mb-x86_64.s
blob0af7740861882d078c90f2cb80f29c5aab4eb542
1 .text
5 .globl sha1_multi_block
6 .type sha1_multi_block,@function
7 .align 32
8 sha1_multi_block:
9 movq OPENSSL_ia32cap_P+4(%rip),%rcx
10 btq $61,%rcx
11 jc _shaext_shortcut
12 testl $268435456,%ecx
13 jnz _avx_shortcut
14 movq %rsp,%rax
15 pushq %rbx
16 pushq %rbp
17 subq $288,%rsp
18 andq $-256,%rsp
19 movq %rax,272(%rsp)
20 .Lbody:
21 leaq K_XX_XX(%rip),%rbp
22 leaq 256(%rsp),%rbx
24 .Loop_grande:
25 movl %edx,280(%rsp)
26 xorl %edx,%edx
27 movq 0(%rsi),%r8
28 movl 8(%rsi),%ecx
29 cmpl %edx,%ecx
30 cmovgl %ecx,%edx
31 testl %ecx,%ecx
32 movl %ecx,0(%rbx)
33 cmovleq %rbp,%r8
34 movq 16(%rsi),%r9
35 movl 24(%rsi),%ecx
36 cmpl %edx,%ecx
37 cmovgl %ecx,%edx
38 testl %ecx,%ecx
39 movl %ecx,4(%rbx)
40 cmovleq %rbp,%r9
41 movq 32(%rsi),%r10
42 movl 40(%rsi),%ecx
43 cmpl %edx,%ecx
44 cmovgl %ecx,%edx
45 testl %ecx,%ecx
46 movl %ecx,8(%rbx)
47 cmovleq %rbp,%r10
48 movq 48(%rsi),%r11
49 movl 56(%rsi),%ecx
50 cmpl %edx,%ecx
51 cmovgl %ecx,%edx
52 testl %ecx,%ecx
53 movl %ecx,12(%rbx)
54 cmovleq %rbp,%r11
55 testl %edx,%edx
56 jz .Ldone
58 movdqu 0(%rdi),%xmm10
59 leaq 128(%rsp),%rax
60 movdqu 32(%rdi),%xmm11
61 movdqu 64(%rdi),%xmm12
62 movdqu 96(%rdi),%xmm13
63 movdqu 128(%rdi),%xmm14
64 movdqa 96(%rbp),%xmm5
65 movdqa -32(%rbp),%xmm15
66 jmp .Loop
68 .align 32
69 .Loop:
70 movd (%r8),%xmm0
71 leaq 64(%r8),%r8
72 movd (%r9),%xmm2
73 leaq 64(%r9),%r9
74 movd (%r10),%xmm3
75 leaq 64(%r10),%r10
76 movd (%r11),%xmm4
77 leaq 64(%r11),%r11
78 punpckldq %xmm3,%xmm0
79 movd -60(%r8),%xmm1
80 punpckldq %xmm4,%xmm2
81 movd -60(%r9),%xmm9
82 punpckldq %xmm2,%xmm0
83 movd -60(%r10),%xmm8
84 .byte 102,15,56,0,197
85 movd -60(%r11),%xmm7
86 punpckldq %xmm8,%xmm1
87 movdqa %xmm10,%xmm8
88 paddd %xmm15,%xmm14
89 punpckldq %xmm7,%xmm9
90 movdqa %xmm11,%xmm7
91 movdqa %xmm11,%xmm6
92 pslld $5,%xmm8
93 pandn %xmm13,%xmm7
94 pand %xmm12,%xmm6
95 punpckldq %xmm9,%xmm1
96 movdqa %xmm10,%xmm9
98 movdqa %xmm0,0-128(%rax)
99 paddd %xmm0,%xmm14
100 movd -56(%r8),%xmm2
101 psrld $27,%xmm9
102 pxor %xmm7,%xmm6
103 movdqa %xmm11,%xmm7
105 por %xmm9,%xmm8
106 movd -56(%r9),%xmm9
107 pslld $30,%xmm7
108 paddd %xmm6,%xmm14
110 psrld $2,%xmm11
111 paddd %xmm8,%xmm14
112 .byte 102,15,56,0,205
113 movd -56(%r10),%xmm8
114 por %xmm7,%xmm11
115 movd -56(%r11),%xmm7
116 punpckldq %xmm8,%xmm2
117 movdqa %xmm14,%xmm8
118 paddd %xmm15,%xmm13
119 punpckldq %xmm7,%xmm9
120 movdqa %xmm10,%xmm7
121 movdqa %xmm10,%xmm6
122 pslld $5,%xmm8
123 pandn %xmm12,%xmm7
124 pand %xmm11,%xmm6
125 punpckldq %xmm9,%xmm2
126 movdqa %xmm14,%xmm9
128 movdqa %xmm1,16-128(%rax)
129 paddd %xmm1,%xmm13
130 movd -52(%r8),%xmm3
131 psrld $27,%xmm9
132 pxor %xmm7,%xmm6
133 movdqa %xmm10,%xmm7
135 por %xmm9,%xmm8
136 movd -52(%r9),%xmm9
137 pslld $30,%xmm7
138 paddd %xmm6,%xmm13
140 psrld $2,%xmm10
141 paddd %xmm8,%xmm13
142 .byte 102,15,56,0,213
143 movd -52(%r10),%xmm8
144 por %xmm7,%xmm10
145 movd -52(%r11),%xmm7
146 punpckldq %xmm8,%xmm3
147 movdqa %xmm13,%xmm8
148 paddd %xmm15,%xmm12
149 punpckldq %xmm7,%xmm9
150 movdqa %xmm14,%xmm7
151 movdqa %xmm14,%xmm6
152 pslld $5,%xmm8
153 pandn %xmm11,%xmm7
154 pand %xmm10,%xmm6
155 punpckldq %xmm9,%xmm3
156 movdqa %xmm13,%xmm9
158 movdqa %xmm2,32-128(%rax)
159 paddd %xmm2,%xmm12
160 movd -48(%r8),%xmm4
161 psrld $27,%xmm9
162 pxor %xmm7,%xmm6
163 movdqa %xmm14,%xmm7
165 por %xmm9,%xmm8
166 movd -48(%r9),%xmm9
167 pslld $30,%xmm7
168 paddd %xmm6,%xmm12
170 psrld $2,%xmm14
171 paddd %xmm8,%xmm12
172 .byte 102,15,56,0,221
173 movd -48(%r10),%xmm8
174 por %xmm7,%xmm14
175 movd -48(%r11),%xmm7
176 punpckldq %xmm8,%xmm4
177 movdqa %xmm12,%xmm8
178 paddd %xmm15,%xmm11
179 punpckldq %xmm7,%xmm9
180 movdqa %xmm13,%xmm7
181 movdqa %xmm13,%xmm6
182 pslld $5,%xmm8
183 pandn %xmm10,%xmm7
184 pand %xmm14,%xmm6
185 punpckldq %xmm9,%xmm4
186 movdqa %xmm12,%xmm9
188 movdqa %xmm3,48-128(%rax)
189 paddd %xmm3,%xmm11
190 movd -44(%r8),%xmm0
191 psrld $27,%xmm9
192 pxor %xmm7,%xmm6
193 movdqa %xmm13,%xmm7
195 por %xmm9,%xmm8
196 movd -44(%r9),%xmm9
197 pslld $30,%xmm7
198 paddd %xmm6,%xmm11
200 psrld $2,%xmm13
201 paddd %xmm8,%xmm11
202 .byte 102,15,56,0,229
203 movd -44(%r10),%xmm8
204 por %xmm7,%xmm13
205 movd -44(%r11),%xmm7
206 punpckldq %xmm8,%xmm0
207 movdqa %xmm11,%xmm8
208 paddd %xmm15,%xmm10
209 punpckldq %xmm7,%xmm9
210 movdqa %xmm12,%xmm7
211 movdqa %xmm12,%xmm6
212 pslld $5,%xmm8
213 pandn %xmm14,%xmm7
214 pand %xmm13,%xmm6
215 punpckldq %xmm9,%xmm0
216 movdqa %xmm11,%xmm9
218 movdqa %xmm4,64-128(%rax)
219 paddd %xmm4,%xmm10
220 movd -40(%r8),%xmm1
221 psrld $27,%xmm9
222 pxor %xmm7,%xmm6
223 movdqa %xmm12,%xmm7
225 por %xmm9,%xmm8
226 movd -40(%r9),%xmm9
227 pslld $30,%xmm7
228 paddd %xmm6,%xmm10
230 psrld $2,%xmm12
231 paddd %xmm8,%xmm10
232 .byte 102,15,56,0,197
233 movd -40(%r10),%xmm8
234 por %xmm7,%xmm12
235 movd -40(%r11),%xmm7
236 punpckldq %xmm8,%xmm1
237 movdqa %xmm10,%xmm8
238 paddd %xmm15,%xmm14
239 punpckldq %xmm7,%xmm9
240 movdqa %xmm11,%xmm7
241 movdqa %xmm11,%xmm6
242 pslld $5,%xmm8
243 pandn %xmm13,%xmm7
244 pand %xmm12,%xmm6
245 punpckldq %xmm9,%xmm1
246 movdqa %xmm10,%xmm9
248 movdqa %xmm0,80-128(%rax)
249 paddd %xmm0,%xmm14
250 movd -36(%r8),%xmm2
251 psrld $27,%xmm9
252 pxor %xmm7,%xmm6
253 movdqa %xmm11,%xmm7
255 por %xmm9,%xmm8
256 movd -36(%r9),%xmm9
257 pslld $30,%xmm7
258 paddd %xmm6,%xmm14
260 psrld $2,%xmm11
261 paddd %xmm8,%xmm14
262 .byte 102,15,56,0,205
263 movd -36(%r10),%xmm8
264 por %xmm7,%xmm11
265 movd -36(%r11),%xmm7
266 punpckldq %xmm8,%xmm2
267 movdqa %xmm14,%xmm8
268 paddd %xmm15,%xmm13
269 punpckldq %xmm7,%xmm9
270 movdqa %xmm10,%xmm7
271 movdqa %xmm10,%xmm6
272 pslld $5,%xmm8
273 pandn %xmm12,%xmm7
274 pand %xmm11,%xmm6
275 punpckldq %xmm9,%xmm2
276 movdqa %xmm14,%xmm9
278 movdqa %xmm1,96-128(%rax)
279 paddd %xmm1,%xmm13
280 movd -32(%r8),%xmm3
281 psrld $27,%xmm9
282 pxor %xmm7,%xmm6
283 movdqa %xmm10,%xmm7
285 por %xmm9,%xmm8
286 movd -32(%r9),%xmm9
287 pslld $30,%xmm7
288 paddd %xmm6,%xmm13
290 psrld $2,%xmm10
291 paddd %xmm8,%xmm13
292 .byte 102,15,56,0,213
293 movd -32(%r10),%xmm8
294 por %xmm7,%xmm10
295 movd -32(%r11),%xmm7
296 punpckldq %xmm8,%xmm3
297 movdqa %xmm13,%xmm8
298 paddd %xmm15,%xmm12
299 punpckldq %xmm7,%xmm9
300 movdqa %xmm14,%xmm7
301 movdqa %xmm14,%xmm6
302 pslld $5,%xmm8
303 pandn %xmm11,%xmm7
304 pand %xmm10,%xmm6
305 punpckldq %xmm9,%xmm3
306 movdqa %xmm13,%xmm9
308 movdqa %xmm2,112-128(%rax)
309 paddd %xmm2,%xmm12
310 movd -28(%r8),%xmm4
311 psrld $27,%xmm9
312 pxor %xmm7,%xmm6
313 movdqa %xmm14,%xmm7
315 por %xmm9,%xmm8
316 movd -28(%r9),%xmm9
317 pslld $30,%xmm7
318 paddd %xmm6,%xmm12
320 psrld $2,%xmm14
321 paddd %xmm8,%xmm12
322 .byte 102,15,56,0,221
323 movd -28(%r10),%xmm8
324 por %xmm7,%xmm14
325 movd -28(%r11),%xmm7
326 punpckldq %xmm8,%xmm4
327 movdqa %xmm12,%xmm8
328 paddd %xmm15,%xmm11
329 punpckldq %xmm7,%xmm9
330 movdqa %xmm13,%xmm7
331 movdqa %xmm13,%xmm6
332 pslld $5,%xmm8
333 pandn %xmm10,%xmm7
334 pand %xmm14,%xmm6
335 punpckldq %xmm9,%xmm4
336 movdqa %xmm12,%xmm9
338 movdqa %xmm3,128-128(%rax)
339 paddd %xmm3,%xmm11
340 movd -24(%r8),%xmm0
341 psrld $27,%xmm9
342 pxor %xmm7,%xmm6
343 movdqa %xmm13,%xmm7
345 por %xmm9,%xmm8
346 movd -24(%r9),%xmm9
347 pslld $30,%xmm7
348 paddd %xmm6,%xmm11
350 psrld $2,%xmm13
351 paddd %xmm8,%xmm11
352 .byte 102,15,56,0,229
353 movd -24(%r10),%xmm8
354 por %xmm7,%xmm13
355 movd -24(%r11),%xmm7
356 punpckldq %xmm8,%xmm0
357 movdqa %xmm11,%xmm8
358 paddd %xmm15,%xmm10
359 punpckldq %xmm7,%xmm9
360 movdqa %xmm12,%xmm7
361 movdqa %xmm12,%xmm6
362 pslld $5,%xmm8
363 pandn %xmm14,%xmm7
364 pand %xmm13,%xmm6
365 punpckldq %xmm9,%xmm0
366 movdqa %xmm11,%xmm9
368 movdqa %xmm4,144-128(%rax)
369 paddd %xmm4,%xmm10
370 movd -20(%r8),%xmm1
371 psrld $27,%xmm9
372 pxor %xmm7,%xmm6
373 movdqa %xmm12,%xmm7
375 por %xmm9,%xmm8
376 movd -20(%r9),%xmm9
377 pslld $30,%xmm7
378 paddd %xmm6,%xmm10
380 psrld $2,%xmm12
381 paddd %xmm8,%xmm10
382 .byte 102,15,56,0,197
383 movd -20(%r10),%xmm8
384 por %xmm7,%xmm12
385 movd -20(%r11),%xmm7
386 punpckldq %xmm8,%xmm1
387 movdqa %xmm10,%xmm8
388 paddd %xmm15,%xmm14
389 punpckldq %xmm7,%xmm9
390 movdqa %xmm11,%xmm7
391 movdqa %xmm11,%xmm6
392 pslld $5,%xmm8
393 pandn %xmm13,%xmm7
394 pand %xmm12,%xmm6
395 punpckldq %xmm9,%xmm1
396 movdqa %xmm10,%xmm9
398 movdqa %xmm0,160-128(%rax)
399 paddd %xmm0,%xmm14
400 movd -16(%r8),%xmm2
401 psrld $27,%xmm9
402 pxor %xmm7,%xmm6
403 movdqa %xmm11,%xmm7
405 por %xmm9,%xmm8
406 movd -16(%r9),%xmm9
407 pslld $30,%xmm7
408 paddd %xmm6,%xmm14
410 psrld $2,%xmm11
411 paddd %xmm8,%xmm14
412 .byte 102,15,56,0,205
413 movd -16(%r10),%xmm8
414 por %xmm7,%xmm11
415 movd -16(%r11),%xmm7
416 punpckldq %xmm8,%xmm2
417 movdqa %xmm14,%xmm8
418 paddd %xmm15,%xmm13
419 punpckldq %xmm7,%xmm9
420 movdqa %xmm10,%xmm7
421 movdqa %xmm10,%xmm6
422 pslld $5,%xmm8
423 pandn %xmm12,%xmm7
424 pand %xmm11,%xmm6
425 punpckldq %xmm9,%xmm2
426 movdqa %xmm14,%xmm9
428 movdqa %xmm1,176-128(%rax)
429 paddd %xmm1,%xmm13
430 movd -12(%r8),%xmm3
431 psrld $27,%xmm9
432 pxor %xmm7,%xmm6
433 movdqa %xmm10,%xmm7
435 por %xmm9,%xmm8
436 movd -12(%r9),%xmm9
437 pslld $30,%xmm7
438 paddd %xmm6,%xmm13
440 psrld $2,%xmm10
441 paddd %xmm8,%xmm13
442 .byte 102,15,56,0,213
443 movd -12(%r10),%xmm8
444 por %xmm7,%xmm10
445 movd -12(%r11),%xmm7
446 punpckldq %xmm8,%xmm3
447 movdqa %xmm13,%xmm8
448 paddd %xmm15,%xmm12
449 punpckldq %xmm7,%xmm9
450 movdqa %xmm14,%xmm7
451 movdqa %xmm14,%xmm6
452 pslld $5,%xmm8
453 pandn %xmm11,%xmm7
454 pand %xmm10,%xmm6
455 punpckldq %xmm9,%xmm3
456 movdqa %xmm13,%xmm9
458 movdqa %xmm2,192-128(%rax)
459 paddd %xmm2,%xmm12
460 movd -8(%r8),%xmm4
461 psrld $27,%xmm9
462 pxor %xmm7,%xmm6
463 movdqa %xmm14,%xmm7
465 por %xmm9,%xmm8
466 movd -8(%r9),%xmm9
467 pslld $30,%xmm7
468 paddd %xmm6,%xmm12
470 psrld $2,%xmm14
471 paddd %xmm8,%xmm12
472 .byte 102,15,56,0,221
473 movd -8(%r10),%xmm8
474 por %xmm7,%xmm14
475 movd -8(%r11),%xmm7
476 punpckldq %xmm8,%xmm4
477 movdqa %xmm12,%xmm8
478 paddd %xmm15,%xmm11
479 punpckldq %xmm7,%xmm9
480 movdqa %xmm13,%xmm7
481 movdqa %xmm13,%xmm6
482 pslld $5,%xmm8
483 pandn %xmm10,%xmm7
484 pand %xmm14,%xmm6
485 punpckldq %xmm9,%xmm4
486 movdqa %xmm12,%xmm9
488 movdqa %xmm3,208-128(%rax)
489 paddd %xmm3,%xmm11
490 movd -4(%r8),%xmm0
491 psrld $27,%xmm9
492 pxor %xmm7,%xmm6
493 movdqa %xmm13,%xmm7
495 por %xmm9,%xmm8
496 movd -4(%r9),%xmm9
497 pslld $30,%xmm7
498 paddd %xmm6,%xmm11
500 psrld $2,%xmm13
501 paddd %xmm8,%xmm11
502 .byte 102,15,56,0,229
503 movd -4(%r10),%xmm8
504 por %xmm7,%xmm13
505 movdqa 0-128(%rax),%xmm1
506 movd -4(%r11),%xmm7
507 punpckldq %xmm8,%xmm0
508 movdqa %xmm11,%xmm8
509 paddd %xmm15,%xmm10
510 punpckldq %xmm7,%xmm9
511 movdqa %xmm12,%xmm7
512 movdqa %xmm12,%xmm6
513 pslld $5,%xmm8
514 prefetcht0 63(%r8)
515 pandn %xmm14,%xmm7
516 pand %xmm13,%xmm6
517 punpckldq %xmm9,%xmm0
518 movdqa %xmm11,%xmm9
520 movdqa %xmm4,224-128(%rax)
521 paddd %xmm4,%xmm10
522 psrld $27,%xmm9
523 pxor %xmm7,%xmm6
524 movdqa %xmm12,%xmm7
525 prefetcht0 63(%r9)
527 por %xmm9,%xmm8
528 pslld $30,%xmm7
529 paddd %xmm6,%xmm10
530 prefetcht0 63(%r10)
532 psrld $2,%xmm12
533 paddd %xmm8,%xmm10
534 .byte 102,15,56,0,197
535 prefetcht0 63(%r11)
536 por %xmm7,%xmm12
537 movdqa 16-128(%rax),%xmm2
538 pxor %xmm3,%xmm1
539 movdqa 32-128(%rax),%xmm3
541 movdqa %xmm10,%xmm8
542 pxor 128-128(%rax),%xmm1
543 paddd %xmm15,%xmm14
544 movdqa %xmm11,%xmm7
545 pslld $5,%xmm8
546 pxor %xmm3,%xmm1
547 movdqa %xmm11,%xmm6
548 pandn %xmm13,%xmm7
549 movdqa %xmm1,%xmm5
550 pand %xmm12,%xmm6
551 movdqa %xmm10,%xmm9
552 psrld $31,%xmm5
553 paddd %xmm1,%xmm1
555 movdqa %xmm0,240-128(%rax)
556 paddd %xmm0,%xmm14
557 psrld $27,%xmm9
558 pxor %xmm7,%xmm6
560 movdqa %xmm11,%xmm7
561 por %xmm9,%xmm8
562 pslld $30,%xmm7
563 paddd %xmm6,%xmm14
565 psrld $2,%xmm11
566 paddd %xmm8,%xmm14
567 por %xmm5,%xmm1
568 por %xmm7,%xmm11
569 pxor %xmm4,%xmm2
570 movdqa 48-128(%rax),%xmm4
572 movdqa %xmm14,%xmm8
573 pxor 144-128(%rax),%xmm2
574 paddd %xmm15,%xmm13
575 movdqa %xmm10,%xmm7
576 pslld $5,%xmm8
577 pxor %xmm4,%xmm2
578 movdqa %xmm10,%xmm6
579 pandn %xmm12,%xmm7
580 movdqa %xmm2,%xmm5
581 pand %xmm11,%xmm6
582 movdqa %xmm14,%xmm9
583 psrld $31,%xmm5
584 paddd %xmm2,%xmm2
586 movdqa %xmm1,0-128(%rax)
587 paddd %xmm1,%xmm13
588 psrld $27,%xmm9
589 pxor %xmm7,%xmm6
591 movdqa %xmm10,%xmm7
592 por %xmm9,%xmm8
593 pslld $30,%xmm7
594 paddd %xmm6,%xmm13
596 psrld $2,%xmm10
597 paddd %xmm8,%xmm13
598 por %xmm5,%xmm2
599 por %xmm7,%xmm10
600 pxor %xmm0,%xmm3
601 movdqa 64-128(%rax),%xmm0
603 movdqa %xmm13,%xmm8
604 pxor 160-128(%rax),%xmm3
605 paddd %xmm15,%xmm12
606 movdqa %xmm14,%xmm7
607 pslld $5,%xmm8
608 pxor %xmm0,%xmm3
609 movdqa %xmm14,%xmm6
610 pandn %xmm11,%xmm7
611 movdqa %xmm3,%xmm5
612 pand %xmm10,%xmm6
613 movdqa %xmm13,%xmm9
614 psrld $31,%xmm5
615 paddd %xmm3,%xmm3
617 movdqa %xmm2,16-128(%rax)
618 paddd %xmm2,%xmm12
619 psrld $27,%xmm9
620 pxor %xmm7,%xmm6
622 movdqa %xmm14,%xmm7
623 por %xmm9,%xmm8
624 pslld $30,%xmm7
625 paddd %xmm6,%xmm12
627 psrld $2,%xmm14
628 paddd %xmm8,%xmm12
629 por %xmm5,%xmm3
630 por %xmm7,%xmm14
631 pxor %xmm1,%xmm4
632 movdqa 80-128(%rax),%xmm1
634 movdqa %xmm12,%xmm8
635 pxor 176-128(%rax),%xmm4
636 paddd %xmm15,%xmm11
637 movdqa %xmm13,%xmm7
638 pslld $5,%xmm8
639 pxor %xmm1,%xmm4
640 movdqa %xmm13,%xmm6
641 pandn %xmm10,%xmm7
642 movdqa %xmm4,%xmm5
643 pand %xmm14,%xmm6
644 movdqa %xmm12,%xmm9
645 psrld $31,%xmm5
646 paddd %xmm4,%xmm4
648 movdqa %xmm3,32-128(%rax)
649 paddd %xmm3,%xmm11
650 psrld $27,%xmm9
651 pxor %xmm7,%xmm6
653 movdqa %xmm13,%xmm7
654 por %xmm9,%xmm8
655 pslld $30,%xmm7
656 paddd %xmm6,%xmm11
658 psrld $2,%xmm13
659 paddd %xmm8,%xmm11
660 por %xmm5,%xmm4
661 por %xmm7,%xmm13
662 pxor %xmm2,%xmm0
663 movdqa 96-128(%rax),%xmm2
665 movdqa %xmm11,%xmm8
666 pxor 192-128(%rax),%xmm0
667 paddd %xmm15,%xmm10
668 movdqa %xmm12,%xmm7
669 pslld $5,%xmm8
670 pxor %xmm2,%xmm0
671 movdqa %xmm12,%xmm6
672 pandn %xmm14,%xmm7
673 movdqa %xmm0,%xmm5
674 pand %xmm13,%xmm6
675 movdqa %xmm11,%xmm9
676 psrld $31,%xmm5
677 paddd %xmm0,%xmm0
679 movdqa %xmm4,48-128(%rax)
680 paddd %xmm4,%xmm10
681 psrld $27,%xmm9
682 pxor %xmm7,%xmm6
684 movdqa %xmm12,%xmm7
685 por %xmm9,%xmm8
686 pslld $30,%xmm7
687 paddd %xmm6,%xmm10
689 psrld $2,%xmm12
690 paddd %xmm8,%xmm10
691 por %xmm5,%xmm0
692 por %xmm7,%xmm12
693 movdqa 0(%rbp),%xmm15
694 pxor %xmm3,%xmm1
695 movdqa 112-128(%rax),%xmm3
697 movdqa %xmm10,%xmm8
698 movdqa %xmm13,%xmm6
699 pxor 208-128(%rax),%xmm1
700 paddd %xmm15,%xmm14
701 pslld $5,%xmm8
702 pxor %xmm11,%xmm6
704 movdqa %xmm10,%xmm9
705 movdqa %xmm0,64-128(%rax)
706 paddd %xmm0,%xmm14
707 pxor %xmm3,%xmm1
708 psrld $27,%xmm9
709 pxor %xmm12,%xmm6
710 movdqa %xmm11,%xmm7
712 pslld $30,%xmm7
713 movdqa %xmm1,%xmm5
714 por %xmm9,%xmm8
715 psrld $31,%xmm5
716 paddd %xmm6,%xmm14
717 paddd %xmm1,%xmm1
719 psrld $2,%xmm11
720 paddd %xmm8,%xmm14
721 por %xmm5,%xmm1
722 por %xmm7,%xmm11
723 pxor %xmm4,%xmm2
724 movdqa 128-128(%rax),%xmm4
726 movdqa %xmm14,%xmm8
727 movdqa %xmm12,%xmm6
728 pxor 224-128(%rax),%xmm2
729 paddd %xmm15,%xmm13
730 pslld $5,%xmm8
731 pxor %xmm10,%xmm6
733 movdqa %xmm14,%xmm9
734 movdqa %xmm1,80-128(%rax)
735 paddd %xmm1,%xmm13
736 pxor %xmm4,%xmm2
737 psrld $27,%xmm9
738 pxor %xmm11,%xmm6
739 movdqa %xmm10,%xmm7
741 pslld $30,%xmm7
742 movdqa %xmm2,%xmm5
743 por %xmm9,%xmm8
744 psrld $31,%xmm5
745 paddd %xmm6,%xmm13
746 paddd %xmm2,%xmm2
748 psrld $2,%xmm10
749 paddd %xmm8,%xmm13
750 por %xmm5,%xmm2
751 por %xmm7,%xmm10
752 pxor %xmm0,%xmm3
753 movdqa 144-128(%rax),%xmm0
755 movdqa %xmm13,%xmm8
756 movdqa %xmm11,%xmm6
757 pxor 240-128(%rax),%xmm3
758 paddd %xmm15,%xmm12
759 pslld $5,%xmm8
760 pxor %xmm14,%xmm6
762 movdqa %xmm13,%xmm9
763 movdqa %xmm2,96-128(%rax)
764 paddd %xmm2,%xmm12
765 pxor %xmm0,%xmm3
766 psrld $27,%xmm9
767 pxor %xmm10,%xmm6
768 movdqa %xmm14,%xmm7
770 pslld $30,%xmm7
771 movdqa %xmm3,%xmm5
772 por %xmm9,%xmm8
773 psrld $31,%xmm5
774 paddd %xmm6,%xmm12
775 paddd %xmm3,%xmm3
777 psrld $2,%xmm14
778 paddd %xmm8,%xmm12
779 por %xmm5,%xmm3
780 por %xmm7,%xmm14
781 pxor %xmm1,%xmm4
782 movdqa 160-128(%rax),%xmm1
784 movdqa %xmm12,%xmm8
785 movdqa %xmm10,%xmm6
786 pxor 0-128(%rax),%xmm4
787 paddd %xmm15,%xmm11
788 pslld $5,%xmm8
789 pxor %xmm13,%xmm6
791 movdqa %xmm12,%xmm9
792 movdqa %xmm3,112-128(%rax)
793 paddd %xmm3,%xmm11
794 pxor %xmm1,%xmm4
795 psrld $27,%xmm9
796 pxor %xmm14,%xmm6
797 movdqa %xmm13,%xmm7
799 pslld $30,%xmm7
800 movdqa %xmm4,%xmm5
801 por %xmm9,%xmm8
802 psrld $31,%xmm5
803 paddd %xmm6,%xmm11
804 paddd %xmm4,%xmm4
806 psrld $2,%xmm13
807 paddd %xmm8,%xmm11
808 por %xmm5,%xmm4
809 por %xmm7,%xmm13
810 pxor %xmm2,%xmm0
811 movdqa 176-128(%rax),%xmm2
813 movdqa %xmm11,%xmm8
814 movdqa %xmm14,%xmm6
815 pxor 16-128(%rax),%xmm0
816 paddd %xmm15,%xmm10
817 pslld $5,%xmm8
818 pxor %xmm12,%xmm6
820 movdqa %xmm11,%xmm9
821 movdqa %xmm4,128-128(%rax)
822 paddd %xmm4,%xmm10
823 pxor %xmm2,%xmm0
824 psrld $27,%xmm9
825 pxor %xmm13,%xmm6
826 movdqa %xmm12,%xmm7
828 pslld $30,%xmm7
829 movdqa %xmm0,%xmm5
830 por %xmm9,%xmm8
831 psrld $31,%xmm5
832 paddd %xmm6,%xmm10
833 paddd %xmm0,%xmm0
835 psrld $2,%xmm12
836 paddd %xmm8,%xmm10
837 por %xmm5,%xmm0
838 por %xmm7,%xmm12
839 pxor %xmm3,%xmm1
840 movdqa 192-128(%rax),%xmm3
842 movdqa %xmm10,%xmm8
843 movdqa %xmm13,%xmm6
844 pxor 32-128(%rax),%xmm1
845 paddd %xmm15,%xmm14
846 pslld $5,%xmm8
847 pxor %xmm11,%xmm6
849 movdqa %xmm10,%xmm9
850 movdqa %xmm0,144-128(%rax)
851 paddd %xmm0,%xmm14
852 pxor %xmm3,%xmm1
853 psrld $27,%xmm9
854 pxor %xmm12,%xmm6
855 movdqa %xmm11,%xmm7
857 pslld $30,%xmm7
858 movdqa %xmm1,%xmm5
859 por %xmm9,%xmm8
860 psrld $31,%xmm5
861 paddd %xmm6,%xmm14
862 paddd %xmm1,%xmm1
864 psrld $2,%xmm11
865 paddd %xmm8,%xmm14
866 por %xmm5,%xmm1
867 por %xmm7,%xmm11
868 pxor %xmm4,%xmm2
869 movdqa 208-128(%rax),%xmm4
871 movdqa %xmm14,%xmm8
872 movdqa %xmm12,%xmm6
873 pxor 48-128(%rax),%xmm2
874 paddd %xmm15,%xmm13
875 pslld $5,%xmm8
876 pxor %xmm10,%xmm6
878 movdqa %xmm14,%xmm9
879 movdqa %xmm1,160-128(%rax)
880 paddd %xmm1,%xmm13
881 pxor %xmm4,%xmm2
882 psrld $27,%xmm9
883 pxor %xmm11,%xmm6
884 movdqa %xmm10,%xmm7
886 pslld $30,%xmm7
887 movdqa %xmm2,%xmm5
888 por %xmm9,%xmm8
889 psrld $31,%xmm5
890 paddd %xmm6,%xmm13
891 paddd %xmm2,%xmm2
893 psrld $2,%xmm10
894 paddd %xmm8,%xmm13
895 por %xmm5,%xmm2
896 por %xmm7,%xmm10
897 pxor %xmm0,%xmm3
898 movdqa 224-128(%rax),%xmm0
900 movdqa %xmm13,%xmm8
901 movdqa %xmm11,%xmm6
902 pxor 64-128(%rax),%xmm3
903 paddd %xmm15,%xmm12
904 pslld $5,%xmm8
905 pxor %xmm14,%xmm6
907 movdqa %xmm13,%xmm9
908 movdqa %xmm2,176-128(%rax)
909 paddd %xmm2,%xmm12
910 pxor %xmm0,%xmm3
911 psrld $27,%xmm9
912 pxor %xmm10,%xmm6
913 movdqa %xmm14,%xmm7
915 pslld $30,%xmm7
916 movdqa %xmm3,%xmm5
917 por %xmm9,%xmm8
918 psrld $31,%xmm5
919 paddd %xmm6,%xmm12
920 paddd %xmm3,%xmm3
922 psrld $2,%xmm14
923 paddd %xmm8,%xmm12
924 por %xmm5,%xmm3
925 por %xmm7,%xmm14
926 pxor %xmm1,%xmm4
927 movdqa 240-128(%rax),%xmm1
929 movdqa %xmm12,%xmm8
930 movdqa %xmm10,%xmm6
931 pxor 80-128(%rax),%xmm4
932 paddd %xmm15,%xmm11
933 pslld $5,%xmm8
934 pxor %xmm13,%xmm6
936 movdqa %xmm12,%xmm9
937 movdqa %xmm3,192-128(%rax)
938 paddd %xmm3,%xmm11
939 pxor %xmm1,%xmm4
940 psrld $27,%xmm9
941 pxor %xmm14,%xmm6
942 movdqa %xmm13,%xmm7
944 pslld $30,%xmm7
945 movdqa %xmm4,%xmm5
946 por %xmm9,%xmm8
947 psrld $31,%xmm5
948 paddd %xmm6,%xmm11
949 paddd %xmm4,%xmm4
951 psrld $2,%xmm13
952 paddd %xmm8,%xmm11
953 por %xmm5,%xmm4
954 por %xmm7,%xmm13
955 pxor %xmm2,%xmm0
956 movdqa 0-128(%rax),%xmm2
958 movdqa %xmm11,%xmm8
959 movdqa %xmm14,%xmm6
960 pxor 96-128(%rax),%xmm0
961 paddd %xmm15,%xmm10
962 pslld $5,%xmm8
963 pxor %xmm12,%xmm6
965 movdqa %xmm11,%xmm9
966 movdqa %xmm4,208-128(%rax)
967 paddd %xmm4,%xmm10
968 pxor %xmm2,%xmm0
969 psrld $27,%xmm9
970 pxor %xmm13,%xmm6
971 movdqa %xmm12,%xmm7
973 pslld $30,%xmm7
974 movdqa %xmm0,%xmm5
975 por %xmm9,%xmm8
976 psrld $31,%xmm5
977 paddd %xmm6,%xmm10
978 paddd %xmm0,%xmm0
980 psrld $2,%xmm12
981 paddd %xmm8,%xmm10
982 por %xmm5,%xmm0
983 por %xmm7,%xmm12
984 pxor %xmm3,%xmm1
985 movdqa 16-128(%rax),%xmm3
987 movdqa %xmm10,%xmm8
988 movdqa %xmm13,%xmm6
989 pxor 112-128(%rax),%xmm1
990 paddd %xmm15,%xmm14
991 pslld $5,%xmm8
992 pxor %xmm11,%xmm6
994 movdqa %xmm10,%xmm9
995 movdqa %xmm0,224-128(%rax)
996 paddd %xmm0,%xmm14
997 pxor %xmm3,%xmm1
998 psrld $27,%xmm9
999 pxor %xmm12,%xmm6
1000 movdqa %xmm11,%xmm7
1002 pslld $30,%xmm7
1003 movdqa %xmm1,%xmm5
1004 por %xmm9,%xmm8
1005 psrld $31,%xmm5
1006 paddd %xmm6,%xmm14
1007 paddd %xmm1,%xmm1
1009 psrld $2,%xmm11
1010 paddd %xmm8,%xmm14
1011 por %xmm5,%xmm1
1012 por %xmm7,%xmm11
1013 pxor %xmm4,%xmm2
1014 movdqa 32-128(%rax),%xmm4
1016 movdqa %xmm14,%xmm8
1017 movdqa %xmm12,%xmm6
1018 pxor 128-128(%rax),%xmm2
1019 paddd %xmm15,%xmm13
1020 pslld $5,%xmm8
1021 pxor %xmm10,%xmm6
1023 movdqa %xmm14,%xmm9
1024 movdqa %xmm1,240-128(%rax)
1025 paddd %xmm1,%xmm13
1026 pxor %xmm4,%xmm2
1027 psrld $27,%xmm9
1028 pxor %xmm11,%xmm6
1029 movdqa %xmm10,%xmm7
1031 pslld $30,%xmm7
1032 movdqa %xmm2,%xmm5
1033 por %xmm9,%xmm8
1034 psrld $31,%xmm5
1035 paddd %xmm6,%xmm13
1036 paddd %xmm2,%xmm2
1038 psrld $2,%xmm10
1039 paddd %xmm8,%xmm13
1040 por %xmm5,%xmm2
1041 por %xmm7,%xmm10
1042 pxor %xmm0,%xmm3
1043 movdqa 48-128(%rax),%xmm0
1045 movdqa %xmm13,%xmm8
1046 movdqa %xmm11,%xmm6
1047 pxor 144-128(%rax),%xmm3
1048 paddd %xmm15,%xmm12
1049 pslld $5,%xmm8
1050 pxor %xmm14,%xmm6
1052 movdqa %xmm13,%xmm9
1053 movdqa %xmm2,0-128(%rax)
1054 paddd %xmm2,%xmm12
1055 pxor %xmm0,%xmm3
1056 psrld $27,%xmm9
1057 pxor %xmm10,%xmm6
1058 movdqa %xmm14,%xmm7
1060 pslld $30,%xmm7
1061 movdqa %xmm3,%xmm5
1062 por %xmm9,%xmm8
1063 psrld $31,%xmm5
1064 paddd %xmm6,%xmm12
1065 paddd %xmm3,%xmm3
1067 psrld $2,%xmm14
1068 paddd %xmm8,%xmm12
1069 por %xmm5,%xmm3
1070 por %xmm7,%xmm14
1071 pxor %xmm1,%xmm4
1072 movdqa 64-128(%rax),%xmm1
1074 movdqa %xmm12,%xmm8
1075 movdqa %xmm10,%xmm6
1076 pxor 160-128(%rax),%xmm4
1077 paddd %xmm15,%xmm11
1078 pslld $5,%xmm8
1079 pxor %xmm13,%xmm6
1081 movdqa %xmm12,%xmm9
1082 movdqa %xmm3,16-128(%rax)
1083 paddd %xmm3,%xmm11
1084 pxor %xmm1,%xmm4
1085 psrld $27,%xmm9
1086 pxor %xmm14,%xmm6
1087 movdqa %xmm13,%xmm7
1089 pslld $30,%xmm7
1090 movdqa %xmm4,%xmm5
1091 por %xmm9,%xmm8
1092 psrld $31,%xmm5
1093 paddd %xmm6,%xmm11
1094 paddd %xmm4,%xmm4
1096 psrld $2,%xmm13
1097 paddd %xmm8,%xmm11
1098 por %xmm5,%xmm4
1099 por %xmm7,%xmm13
1100 pxor %xmm2,%xmm0
1101 movdqa 80-128(%rax),%xmm2
1103 movdqa %xmm11,%xmm8
1104 movdqa %xmm14,%xmm6
1105 pxor 176-128(%rax),%xmm0
1106 paddd %xmm15,%xmm10
1107 pslld $5,%xmm8
1108 pxor %xmm12,%xmm6
1110 movdqa %xmm11,%xmm9
1111 movdqa %xmm4,32-128(%rax)
1112 paddd %xmm4,%xmm10
1113 pxor %xmm2,%xmm0
1114 psrld $27,%xmm9
1115 pxor %xmm13,%xmm6
1116 movdqa %xmm12,%xmm7
1118 pslld $30,%xmm7
1119 movdqa %xmm0,%xmm5
1120 por %xmm9,%xmm8
1121 psrld $31,%xmm5
1122 paddd %xmm6,%xmm10
1123 paddd %xmm0,%xmm0
1125 psrld $2,%xmm12
1126 paddd %xmm8,%xmm10
1127 por %xmm5,%xmm0
1128 por %xmm7,%xmm12
1129 pxor %xmm3,%xmm1
1130 movdqa 96-128(%rax),%xmm3
1132 movdqa %xmm10,%xmm8
1133 movdqa %xmm13,%xmm6
1134 pxor 192-128(%rax),%xmm1
1135 paddd %xmm15,%xmm14
1136 pslld $5,%xmm8
1137 pxor %xmm11,%xmm6
1139 movdqa %xmm10,%xmm9
1140 movdqa %xmm0,48-128(%rax)
1141 paddd %xmm0,%xmm14
1142 pxor %xmm3,%xmm1
1143 psrld $27,%xmm9
1144 pxor %xmm12,%xmm6
1145 movdqa %xmm11,%xmm7
1147 pslld $30,%xmm7
1148 movdqa %xmm1,%xmm5
1149 por %xmm9,%xmm8
1150 psrld $31,%xmm5
1151 paddd %xmm6,%xmm14
1152 paddd %xmm1,%xmm1
1154 psrld $2,%xmm11
1155 paddd %xmm8,%xmm14
1156 por %xmm5,%xmm1
1157 por %xmm7,%xmm11
1158 pxor %xmm4,%xmm2
1159 movdqa 112-128(%rax),%xmm4
1161 movdqa %xmm14,%xmm8
1162 movdqa %xmm12,%xmm6
1163 pxor 208-128(%rax),%xmm2
1164 paddd %xmm15,%xmm13
1165 pslld $5,%xmm8
1166 pxor %xmm10,%xmm6
1168 movdqa %xmm14,%xmm9
1169 movdqa %xmm1,64-128(%rax)
1170 paddd %xmm1,%xmm13
1171 pxor %xmm4,%xmm2
1172 psrld $27,%xmm9
1173 pxor %xmm11,%xmm6
1174 movdqa %xmm10,%xmm7
1176 pslld $30,%xmm7
1177 movdqa %xmm2,%xmm5
1178 por %xmm9,%xmm8
1179 psrld $31,%xmm5
1180 paddd %xmm6,%xmm13
1181 paddd %xmm2,%xmm2
1183 psrld $2,%xmm10
1184 paddd %xmm8,%xmm13
1185 por %xmm5,%xmm2
1186 por %xmm7,%xmm10
1187 pxor %xmm0,%xmm3
1188 movdqa 128-128(%rax),%xmm0
1190 movdqa %xmm13,%xmm8
1191 movdqa %xmm11,%xmm6
1192 pxor 224-128(%rax),%xmm3
1193 paddd %xmm15,%xmm12
1194 pslld $5,%xmm8
1195 pxor %xmm14,%xmm6
1197 movdqa %xmm13,%xmm9
1198 movdqa %xmm2,80-128(%rax)
1199 paddd %xmm2,%xmm12
1200 pxor %xmm0,%xmm3
1201 psrld $27,%xmm9
1202 pxor %xmm10,%xmm6
1203 movdqa %xmm14,%xmm7
1205 pslld $30,%xmm7
1206 movdqa %xmm3,%xmm5
1207 por %xmm9,%xmm8
1208 psrld $31,%xmm5
1209 paddd %xmm6,%xmm12
1210 paddd %xmm3,%xmm3
1212 psrld $2,%xmm14
1213 paddd %xmm8,%xmm12
1214 por %xmm5,%xmm3
1215 por %xmm7,%xmm14
1216 pxor %xmm1,%xmm4
1217 movdqa 144-128(%rax),%xmm1
1219 movdqa %xmm12,%xmm8
1220 movdqa %xmm10,%xmm6
1221 pxor 240-128(%rax),%xmm4
1222 paddd %xmm15,%xmm11
1223 pslld $5,%xmm8
1224 pxor %xmm13,%xmm6
1226 movdqa %xmm12,%xmm9
1227 movdqa %xmm3,96-128(%rax)
1228 paddd %xmm3,%xmm11
1229 pxor %xmm1,%xmm4
1230 psrld $27,%xmm9
1231 pxor %xmm14,%xmm6
1232 movdqa %xmm13,%xmm7
1234 pslld $30,%xmm7
1235 movdqa %xmm4,%xmm5
1236 por %xmm9,%xmm8
1237 psrld $31,%xmm5
1238 paddd %xmm6,%xmm11
1239 paddd %xmm4,%xmm4
1241 psrld $2,%xmm13
1242 paddd %xmm8,%xmm11
1243 por %xmm5,%xmm4
1244 por %xmm7,%xmm13
1245 pxor %xmm2,%xmm0
1246 movdqa 160-128(%rax),%xmm2
1248 movdqa %xmm11,%xmm8
1249 movdqa %xmm14,%xmm6
1250 pxor 0-128(%rax),%xmm0
1251 paddd %xmm15,%xmm10
1252 pslld $5,%xmm8
1253 pxor %xmm12,%xmm6
1255 movdqa %xmm11,%xmm9
1256 movdqa %xmm4,112-128(%rax)
1257 paddd %xmm4,%xmm10
1258 pxor %xmm2,%xmm0
1259 psrld $27,%xmm9
1260 pxor %xmm13,%xmm6
1261 movdqa %xmm12,%xmm7
1263 pslld $30,%xmm7
1264 movdqa %xmm0,%xmm5
1265 por %xmm9,%xmm8
1266 psrld $31,%xmm5
1267 paddd %xmm6,%xmm10
1268 paddd %xmm0,%xmm0
1270 psrld $2,%xmm12
1271 paddd %xmm8,%xmm10
1272 por %xmm5,%xmm0
1273 por %xmm7,%xmm12
1274 movdqa 32(%rbp),%xmm15
1275 pxor %xmm3,%xmm1
1276 movdqa 176-128(%rax),%xmm3
1278 movdqa %xmm10,%xmm8
1279 movdqa %xmm13,%xmm7
1280 pxor 16-128(%rax),%xmm1
1281 pxor %xmm3,%xmm1
1282 paddd %xmm15,%xmm14
1283 pslld $5,%xmm8
1284 movdqa %xmm10,%xmm9
1285 pand %xmm12,%xmm7
1287 movdqa %xmm13,%xmm6
1288 movdqa %xmm1,%xmm5
1289 psrld $27,%xmm9
1290 paddd %xmm7,%xmm14
1291 pxor %xmm12,%xmm6
1293 movdqa %xmm0,128-128(%rax)
1294 paddd %xmm0,%xmm14
1295 por %xmm9,%xmm8
1296 psrld $31,%xmm5
1297 pand %xmm11,%xmm6
1298 movdqa %xmm11,%xmm7
1300 pslld $30,%xmm7
1301 paddd %xmm1,%xmm1
1302 paddd %xmm6,%xmm14
1304 psrld $2,%xmm11
1305 paddd %xmm8,%xmm14
1306 por %xmm5,%xmm1
1307 por %xmm7,%xmm11
1308 pxor %xmm4,%xmm2
1309 movdqa 192-128(%rax),%xmm4
1311 movdqa %xmm14,%xmm8
1312 movdqa %xmm12,%xmm7
1313 pxor 32-128(%rax),%xmm2
1314 pxor %xmm4,%xmm2
1315 paddd %xmm15,%xmm13
1316 pslld $5,%xmm8
1317 movdqa %xmm14,%xmm9
1318 pand %xmm11,%xmm7
1320 movdqa %xmm12,%xmm6
1321 movdqa %xmm2,%xmm5
1322 psrld $27,%xmm9
1323 paddd %xmm7,%xmm13
1324 pxor %xmm11,%xmm6
1326 movdqa %xmm1,144-128(%rax)
1327 paddd %xmm1,%xmm13
1328 por %xmm9,%xmm8
1329 psrld $31,%xmm5
1330 pand %xmm10,%xmm6
1331 movdqa %xmm10,%xmm7
1333 pslld $30,%xmm7
1334 paddd %xmm2,%xmm2
1335 paddd %xmm6,%xmm13
1337 psrld $2,%xmm10
1338 paddd %xmm8,%xmm13
1339 por %xmm5,%xmm2
1340 por %xmm7,%xmm10
1341 pxor %xmm0,%xmm3
1342 movdqa 208-128(%rax),%xmm0
1344 movdqa %xmm13,%xmm8
1345 movdqa %xmm11,%xmm7
1346 pxor 48-128(%rax),%xmm3
1347 pxor %xmm0,%xmm3
1348 paddd %xmm15,%xmm12
1349 pslld $5,%xmm8
1350 movdqa %xmm13,%xmm9
1351 pand %xmm10,%xmm7
1353 movdqa %xmm11,%xmm6
1354 movdqa %xmm3,%xmm5
1355 psrld $27,%xmm9
1356 paddd %xmm7,%xmm12
1357 pxor %xmm10,%xmm6
1359 movdqa %xmm2,160-128(%rax)
1360 paddd %xmm2,%xmm12
1361 por %xmm9,%xmm8
1362 psrld $31,%xmm5
1363 pand %xmm14,%xmm6
1364 movdqa %xmm14,%xmm7
1366 pslld $30,%xmm7
1367 paddd %xmm3,%xmm3
1368 paddd %xmm6,%xmm12
1370 psrld $2,%xmm14
1371 paddd %xmm8,%xmm12
1372 por %xmm5,%xmm3
1373 por %xmm7,%xmm14
1374 pxor %xmm1,%xmm4
1375 movdqa 224-128(%rax),%xmm1
1377 movdqa %xmm12,%xmm8
1378 movdqa %xmm10,%xmm7
1379 pxor 64-128(%rax),%xmm4
1380 pxor %xmm1,%xmm4
1381 paddd %xmm15,%xmm11
1382 pslld $5,%xmm8
1383 movdqa %xmm12,%xmm9
1384 pand %xmm14,%xmm7
1386 movdqa %xmm10,%xmm6
1387 movdqa %xmm4,%xmm5
1388 psrld $27,%xmm9
1389 paddd %xmm7,%xmm11
1390 pxor %xmm14,%xmm6
1392 movdqa %xmm3,176-128(%rax)
1393 paddd %xmm3,%xmm11
1394 por %xmm9,%xmm8
1395 psrld $31,%xmm5
1396 pand %xmm13,%xmm6
1397 movdqa %xmm13,%xmm7
1399 pslld $30,%xmm7
1400 paddd %xmm4,%xmm4
1401 paddd %xmm6,%xmm11
1403 psrld $2,%xmm13
1404 paddd %xmm8,%xmm11
1405 por %xmm5,%xmm4
1406 por %xmm7,%xmm13
1407 pxor %xmm2,%xmm0
1408 movdqa 240-128(%rax),%xmm2
1410 movdqa %xmm11,%xmm8
1411 movdqa %xmm14,%xmm7
1412 pxor 80-128(%rax),%xmm0
1413 pxor %xmm2,%xmm0
1414 paddd %xmm15,%xmm10
1415 pslld $5,%xmm8
1416 movdqa %xmm11,%xmm9
1417 pand %xmm13,%xmm7
1419 movdqa %xmm14,%xmm6
1420 movdqa %xmm0,%xmm5
1421 psrld $27,%xmm9
1422 paddd %xmm7,%xmm10
1423 pxor %xmm13,%xmm6
1425 movdqa %xmm4,192-128(%rax)
1426 paddd %xmm4,%xmm10
1427 por %xmm9,%xmm8
1428 psrld $31,%xmm5
1429 pand %xmm12,%xmm6
1430 movdqa %xmm12,%xmm7
1432 pslld $30,%xmm7
1433 paddd %xmm0,%xmm0
1434 paddd %xmm6,%xmm10
1436 psrld $2,%xmm12
1437 paddd %xmm8,%xmm10
1438 por %xmm5,%xmm0
1439 por %xmm7,%xmm12
1440 pxor %xmm3,%xmm1
1441 movdqa 0-128(%rax),%xmm3
1443 movdqa %xmm10,%xmm8
1444 movdqa %xmm13,%xmm7
1445 pxor 96-128(%rax),%xmm1
1446 pxor %xmm3,%xmm1
1447 paddd %xmm15,%xmm14
1448 pslld $5,%xmm8
1449 movdqa %xmm10,%xmm9
1450 pand %xmm12,%xmm7
1452 movdqa %xmm13,%xmm6
1453 movdqa %xmm1,%xmm5
1454 psrld $27,%xmm9
1455 paddd %xmm7,%xmm14
1456 pxor %xmm12,%xmm6
1458 movdqa %xmm0,208-128(%rax)
1459 paddd %xmm0,%xmm14
1460 por %xmm9,%xmm8
1461 psrld $31,%xmm5
1462 pand %xmm11,%xmm6
1463 movdqa %xmm11,%xmm7
1465 pslld $30,%xmm7
1466 paddd %xmm1,%xmm1
1467 paddd %xmm6,%xmm14
1469 psrld $2,%xmm11
1470 paddd %xmm8,%xmm14
1471 por %xmm5,%xmm1
1472 por %xmm7,%xmm11
1473 pxor %xmm4,%xmm2
1474 movdqa 16-128(%rax),%xmm4
1476 movdqa %xmm14,%xmm8
1477 movdqa %xmm12,%xmm7
1478 pxor 112-128(%rax),%xmm2
1479 pxor %xmm4,%xmm2
1480 paddd %xmm15,%xmm13
1481 pslld $5,%xmm8
1482 movdqa %xmm14,%xmm9
1483 pand %xmm11,%xmm7
1485 movdqa %xmm12,%xmm6
1486 movdqa %xmm2,%xmm5
1487 psrld $27,%xmm9
1488 paddd %xmm7,%xmm13
1489 pxor %xmm11,%xmm6
1491 movdqa %xmm1,224-128(%rax)
1492 paddd %xmm1,%xmm13
1493 por %xmm9,%xmm8
1494 psrld $31,%xmm5
1495 pand %xmm10,%xmm6
1496 movdqa %xmm10,%xmm7
1498 pslld $30,%xmm7
1499 paddd %xmm2,%xmm2
1500 paddd %xmm6,%xmm13
1502 psrld $2,%xmm10
1503 paddd %xmm8,%xmm13
1504 por %xmm5,%xmm2
1505 por %xmm7,%xmm10
1506 pxor %xmm0,%xmm3
1507 movdqa 32-128(%rax),%xmm0
1509 movdqa %xmm13,%xmm8
1510 movdqa %xmm11,%xmm7
1511 pxor 128-128(%rax),%xmm3
1512 pxor %xmm0,%xmm3
1513 paddd %xmm15,%xmm12
1514 pslld $5,%xmm8
1515 movdqa %xmm13,%xmm9
1516 pand %xmm10,%xmm7
1518 movdqa %xmm11,%xmm6
1519 movdqa %xmm3,%xmm5
1520 psrld $27,%xmm9
1521 paddd %xmm7,%xmm12
1522 pxor %xmm10,%xmm6
1524 movdqa %xmm2,240-128(%rax)
1525 paddd %xmm2,%xmm12
1526 por %xmm9,%xmm8
1527 psrld $31,%xmm5
1528 pand %xmm14,%xmm6
1529 movdqa %xmm14,%xmm7
1531 pslld $30,%xmm7
1532 paddd %xmm3,%xmm3
1533 paddd %xmm6,%xmm12
1535 psrld $2,%xmm14
1536 paddd %xmm8,%xmm12
1537 por %xmm5,%xmm3
1538 por %xmm7,%xmm14
1539 pxor %xmm1,%xmm4
1540 movdqa 48-128(%rax),%xmm1
1542 movdqa %xmm12,%xmm8
1543 movdqa %xmm10,%xmm7
1544 pxor 144-128(%rax),%xmm4
1545 pxor %xmm1,%xmm4
1546 paddd %xmm15,%xmm11
1547 pslld $5,%xmm8
1548 movdqa %xmm12,%xmm9
1549 pand %xmm14,%xmm7
1551 movdqa %xmm10,%xmm6
1552 movdqa %xmm4,%xmm5
1553 psrld $27,%xmm9
1554 paddd %xmm7,%xmm11
1555 pxor %xmm14,%xmm6
1557 movdqa %xmm3,0-128(%rax)
1558 paddd %xmm3,%xmm11
1559 por %xmm9,%xmm8
1560 psrld $31,%xmm5
1561 pand %xmm13,%xmm6
1562 movdqa %xmm13,%xmm7
1564 pslld $30,%xmm7
1565 paddd %xmm4,%xmm4
1566 paddd %xmm6,%xmm11
1568 psrld $2,%xmm13
1569 paddd %xmm8,%xmm11
1570 por %xmm5,%xmm4
1571 por %xmm7,%xmm13
1572 pxor %xmm2,%xmm0
1573 movdqa 64-128(%rax),%xmm2
1575 movdqa %xmm11,%xmm8
1576 movdqa %xmm14,%xmm7
1577 pxor 160-128(%rax),%xmm0
1578 pxor %xmm2,%xmm0
1579 paddd %xmm15,%xmm10
1580 pslld $5,%xmm8
1581 movdqa %xmm11,%xmm9
1582 pand %xmm13,%xmm7
1584 movdqa %xmm14,%xmm6
1585 movdqa %xmm0,%xmm5
1586 psrld $27,%xmm9
1587 paddd %xmm7,%xmm10
1588 pxor %xmm13,%xmm6
1590 movdqa %xmm4,16-128(%rax)
1591 paddd %xmm4,%xmm10
1592 por %xmm9,%xmm8
1593 psrld $31,%xmm5
1594 pand %xmm12,%xmm6
1595 movdqa %xmm12,%xmm7
1597 pslld $30,%xmm7
1598 paddd %xmm0,%xmm0
1599 paddd %xmm6,%xmm10
1601 psrld $2,%xmm12
1602 paddd %xmm8,%xmm10
1603 por %xmm5,%xmm0
1604 por %xmm7,%xmm12
1605 pxor %xmm3,%xmm1
1606 movdqa 80-128(%rax),%xmm3
1608 movdqa %xmm10,%xmm8
1609 movdqa %xmm13,%xmm7
1610 pxor 176-128(%rax),%xmm1
1611 pxor %xmm3,%xmm1
1612 paddd %xmm15,%xmm14
1613 pslld $5,%xmm8
1614 movdqa %xmm10,%xmm9
1615 pand %xmm12,%xmm7
1617 movdqa %xmm13,%xmm6
1618 movdqa %xmm1,%xmm5
1619 psrld $27,%xmm9
1620 paddd %xmm7,%xmm14
1621 pxor %xmm12,%xmm6
1623 movdqa %xmm0,32-128(%rax)
1624 paddd %xmm0,%xmm14
1625 por %xmm9,%xmm8
1626 psrld $31,%xmm5
1627 pand %xmm11,%xmm6
1628 movdqa %xmm11,%xmm7
1630 pslld $30,%xmm7
1631 paddd %xmm1,%xmm1
1632 paddd %xmm6,%xmm14
1634 psrld $2,%xmm11
1635 paddd %xmm8,%xmm14
1636 por %xmm5,%xmm1
1637 por %xmm7,%xmm11
1638 pxor %xmm4,%xmm2
1639 movdqa 96-128(%rax),%xmm4
1641 movdqa %xmm14,%xmm8
1642 movdqa %xmm12,%xmm7
1643 pxor 192-128(%rax),%xmm2
1644 pxor %xmm4,%xmm2
1645 paddd %xmm15,%xmm13
1646 pslld $5,%xmm8
1647 movdqa %xmm14,%xmm9
1648 pand %xmm11,%xmm7
1650 movdqa %xmm12,%xmm6
1651 movdqa %xmm2,%xmm5
1652 psrld $27,%xmm9
1653 paddd %xmm7,%xmm13
1654 pxor %xmm11,%xmm6
1656 movdqa %xmm1,48-128(%rax)
1657 paddd %xmm1,%xmm13
1658 por %xmm9,%xmm8
1659 psrld $31,%xmm5
1660 pand %xmm10,%xmm6
1661 movdqa %xmm10,%xmm7
1663 pslld $30,%xmm7
1664 paddd %xmm2,%xmm2
1665 paddd %xmm6,%xmm13
1667 psrld $2,%xmm10
1668 paddd %xmm8,%xmm13
1669 por %xmm5,%xmm2
1670 por %xmm7,%xmm10
1671 pxor %xmm0,%xmm3
1672 movdqa 112-128(%rax),%xmm0
1674 movdqa %xmm13,%xmm8
1675 movdqa %xmm11,%xmm7
1676 pxor 208-128(%rax),%xmm3
1677 pxor %xmm0,%xmm3
1678 paddd %xmm15,%xmm12
1679 pslld $5,%xmm8
1680 movdqa %xmm13,%xmm9
1681 pand %xmm10,%xmm7
1683 movdqa %xmm11,%xmm6
1684 movdqa %xmm3,%xmm5
1685 psrld $27,%xmm9
1686 paddd %xmm7,%xmm12
1687 pxor %xmm10,%xmm6
1689 movdqa %xmm2,64-128(%rax)
1690 paddd %xmm2,%xmm12
1691 por %xmm9,%xmm8
1692 psrld $31,%xmm5
1693 pand %xmm14,%xmm6
1694 movdqa %xmm14,%xmm7
1696 pslld $30,%xmm7
1697 paddd %xmm3,%xmm3
1698 paddd %xmm6,%xmm12
1700 psrld $2,%xmm14
1701 paddd %xmm8,%xmm12
1702 por %xmm5,%xmm3
1703 por %xmm7,%xmm14
1704 pxor %xmm1,%xmm4
1705 movdqa 128-128(%rax),%xmm1
1707 movdqa %xmm12,%xmm8
1708 movdqa %xmm10,%xmm7
1709 pxor 224-128(%rax),%xmm4
1710 pxor %xmm1,%xmm4
1711 paddd %xmm15,%xmm11
1712 pslld $5,%xmm8
1713 movdqa %xmm12,%xmm9
1714 pand %xmm14,%xmm7
1716 movdqa %xmm10,%xmm6
1717 movdqa %xmm4,%xmm5
1718 psrld $27,%xmm9
1719 paddd %xmm7,%xmm11
1720 pxor %xmm14,%xmm6
1722 movdqa %xmm3,80-128(%rax)
1723 paddd %xmm3,%xmm11
1724 por %xmm9,%xmm8
1725 psrld $31,%xmm5
1726 pand %xmm13,%xmm6
1727 movdqa %xmm13,%xmm7
1729 pslld $30,%xmm7
1730 paddd %xmm4,%xmm4
1731 paddd %xmm6,%xmm11
1733 psrld $2,%xmm13
1734 paddd %xmm8,%xmm11
1735 por %xmm5,%xmm4
1736 por %xmm7,%xmm13
1737 pxor %xmm2,%xmm0
1738 movdqa 144-128(%rax),%xmm2
1740 movdqa %xmm11,%xmm8
1741 movdqa %xmm14,%xmm7
1742 pxor 240-128(%rax),%xmm0
1743 pxor %xmm2,%xmm0
1744 paddd %xmm15,%xmm10
1745 pslld $5,%xmm8
1746 movdqa %xmm11,%xmm9
1747 pand %xmm13,%xmm7
1749 movdqa %xmm14,%xmm6
1750 movdqa %xmm0,%xmm5
1751 psrld $27,%xmm9
1752 paddd %xmm7,%xmm10
1753 pxor %xmm13,%xmm6
1755 movdqa %xmm4,96-128(%rax)
1756 paddd %xmm4,%xmm10
1757 por %xmm9,%xmm8
1758 psrld $31,%xmm5
1759 pand %xmm12,%xmm6
1760 movdqa %xmm12,%xmm7
1762 pslld $30,%xmm7
1763 paddd %xmm0,%xmm0
1764 paddd %xmm6,%xmm10
1766 psrld $2,%xmm12
1767 paddd %xmm8,%xmm10
1768 por %xmm5,%xmm0
1769 por %xmm7,%xmm12
1770 pxor %xmm3,%xmm1
1771 movdqa 160-128(%rax),%xmm3
1773 movdqa %xmm10,%xmm8
1774 movdqa %xmm13,%xmm7
1775 pxor 0-128(%rax),%xmm1
1776 pxor %xmm3,%xmm1
1777 paddd %xmm15,%xmm14
1778 pslld $5,%xmm8
1779 movdqa %xmm10,%xmm9
1780 pand %xmm12,%xmm7
1782 movdqa %xmm13,%xmm6
1783 movdqa %xmm1,%xmm5
1784 psrld $27,%xmm9
1785 paddd %xmm7,%xmm14
1786 pxor %xmm12,%xmm6
1788 movdqa %xmm0,112-128(%rax)
1789 paddd %xmm0,%xmm14
1790 por %xmm9,%xmm8
1791 psrld $31,%xmm5
1792 pand %xmm11,%xmm6
1793 movdqa %xmm11,%xmm7
1795 pslld $30,%xmm7
1796 paddd %xmm1,%xmm1
1797 paddd %xmm6,%xmm14
1799 psrld $2,%xmm11
1800 paddd %xmm8,%xmm14
1801 por %xmm5,%xmm1
1802 por %xmm7,%xmm11
1803 pxor %xmm4,%xmm2
1804 movdqa 176-128(%rax),%xmm4
1806 movdqa %xmm14,%xmm8
1807 movdqa %xmm12,%xmm7
1808 pxor 16-128(%rax),%xmm2
1809 pxor %xmm4,%xmm2
1810 paddd %xmm15,%xmm13
1811 pslld $5,%xmm8
1812 movdqa %xmm14,%xmm9
1813 pand %xmm11,%xmm7
1815 movdqa %xmm12,%xmm6
1816 movdqa %xmm2,%xmm5
1817 psrld $27,%xmm9
1818 paddd %xmm7,%xmm13
1819 pxor %xmm11,%xmm6
1821 movdqa %xmm1,128-128(%rax)
1822 paddd %xmm1,%xmm13
1823 por %xmm9,%xmm8
1824 psrld $31,%xmm5
1825 pand %xmm10,%xmm6
1826 movdqa %xmm10,%xmm7
1828 pslld $30,%xmm7
1829 paddd %xmm2,%xmm2
1830 paddd %xmm6,%xmm13
1832 psrld $2,%xmm10
1833 paddd %xmm8,%xmm13
1834 por %xmm5,%xmm2
1835 por %xmm7,%xmm10
1836 pxor %xmm0,%xmm3
1837 movdqa 192-128(%rax),%xmm0
1839 movdqa %xmm13,%xmm8
1840 movdqa %xmm11,%xmm7
1841 pxor 32-128(%rax),%xmm3
1842 pxor %xmm0,%xmm3
1843 paddd %xmm15,%xmm12
1844 pslld $5,%xmm8
1845 movdqa %xmm13,%xmm9
1846 pand %xmm10,%xmm7
1848 movdqa %xmm11,%xmm6
1849 movdqa %xmm3,%xmm5
1850 psrld $27,%xmm9
1851 paddd %xmm7,%xmm12
1852 pxor %xmm10,%xmm6
1854 movdqa %xmm2,144-128(%rax)
1855 paddd %xmm2,%xmm12
1856 por %xmm9,%xmm8
1857 psrld $31,%xmm5
1858 pand %xmm14,%xmm6
1859 movdqa %xmm14,%xmm7
1861 pslld $30,%xmm7
1862 paddd %xmm3,%xmm3
1863 paddd %xmm6,%xmm12
1865 psrld $2,%xmm14
1866 paddd %xmm8,%xmm12
1867 por %xmm5,%xmm3
1868 por %xmm7,%xmm14
1869 pxor %xmm1,%xmm4
1870 movdqa 208-128(%rax),%xmm1
1872 movdqa %xmm12,%xmm8
1873 movdqa %xmm10,%xmm7
1874 pxor 48-128(%rax),%xmm4
1875 pxor %xmm1,%xmm4
1876 paddd %xmm15,%xmm11
1877 pslld $5,%xmm8
1878 movdqa %xmm12,%xmm9
1879 pand %xmm14,%xmm7
1881 movdqa %xmm10,%xmm6
1882 movdqa %xmm4,%xmm5
1883 psrld $27,%xmm9
1884 paddd %xmm7,%xmm11
1885 pxor %xmm14,%xmm6
1887 movdqa %xmm3,160-128(%rax)
1888 paddd %xmm3,%xmm11
1889 por %xmm9,%xmm8
1890 psrld $31,%xmm5
1891 pand %xmm13,%xmm6
1892 movdqa %xmm13,%xmm7
1894 pslld $30,%xmm7
1895 paddd %xmm4,%xmm4
1896 paddd %xmm6,%xmm11
1898 psrld $2,%xmm13
1899 paddd %xmm8,%xmm11
1900 por %xmm5,%xmm4
1901 por %xmm7,%xmm13
1902 pxor %xmm2,%xmm0
1903 movdqa 224-128(%rax),%xmm2
1905 movdqa %xmm11,%xmm8
1906 movdqa %xmm14,%xmm7
1907 pxor 64-128(%rax),%xmm0
1908 pxor %xmm2,%xmm0
1909 paddd %xmm15,%xmm10
1910 pslld $5,%xmm8
1911 movdqa %xmm11,%xmm9
1912 pand %xmm13,%xmm7
1914 movdqa %xmm14,%xmm6
1915 movdqa %xmm0,%xmm5
1916 psrld $27,%xmm9
1917 paddd %xmm7,%xmm10
1918 pxor %xmm13,%xmm6
1920 movdqa %xmm4,176-128(%rax)
1921 paddd %xmm4,%xmm10
1922 por %xmm9,%xmm8
1923 psrld $31,%xmm5
1924 pand %xmm12,%xmm6
1925 movdqa %xmm12,%xmm7
1927 pslld $30,%xmm7
1928 paddd %xmm0,%xmm0
1929 paddd %xmm6,%xmm10
1931 psrld $2,%xmm12
1932 paddd %xmm8,%xmm10
1933 por %xmm5,%xmm0
1934 por %xmm7,%xmm12
1935 movdqa 64(%rbp),%xmm15
1936 pxor %xmm3,%xmm1
1937 movdqa 240-128(%rax),%xmm3
1939 movdqa %xmm10,%xmm8
1940 movdqa %xmm13,%xmm6
1941 pxor 80-128(%rax),%xmm1
1942 paddd %xmm15,%xmm14
1943 pslld $5,%xmm8
1944 pxor %xmm11,%xmm6
1946 movdqa %xmm10,%xmm9
1947 movdqa %xmm0,192-128(%rax)
1948 paddd %xmm0,%xmm14
1949 pxor %xmm3,%xmm1
1950 psrld $27,%xmm9
1951 pxor %xmm12,%xmm6
1952 movdqa %xmm11,%xmm7
1954 pslld $30,%xmm7
1955 movdqa %xmm1,%xmm5
1956 por %xmm9,%xmm8
1957 psrld $31,%xmm5
1958 paddd %xmm6,%xmm14
1959 paddd %xmm1,%xmm1
1961 psrld $2,%xmm11
1962 paddd %xmm8,%xmm14
1963 por %xmm5,%xmm1
1964 por %xmm7,%xmm11
1965 pxor %xmm4,%xmm2
1966 movdqa 0-128(%rax),%xmm4
1968 movdqa %xmm14,%xmm8
1969 movdqa %xmm12,%xmm6
1970 pxor 96-128(%rax),%xmm2
1971 paddd %xmm15,%xmm13
1972 pslld $5,%xmm8
1973 pxor %xmm10,%xmm6
1975 movdqa %xmm14,%xmm9
1976 movdqa %xmm1,208-128(%rax)
1977 paddd %xmm1,%xmm13
1978 pxor %xmm4,%xmm2
1979 psrld $27,%xmm9
1980 pxor %xmm11,%xmm6
1981 movdqa %xmm10,%xmm7
1983 pslld $30,%xmm7
1984 movdqa %xmm2,%xmm5
1985 por %xmm9,%xmm8
1986 psrld $31,%xmm5
1987 paddd %xmm6,%xmm13
1988 paddd %xmm2,%xmm2
1990 psrld $2,%xmm10
1991 paddd %xmm8,%xmm13
1992 por %xmm5,%xmm2
1993 por %xmm7,%xmm10
1994 pxor %xmm0,%xmm3
1995 movdqa 16-128(%rax),%xmm0
1997 movdqa %xmm13,%xmm8
1998 movdqa %xmm11,%xmm6
1999 pxor 112-128(%rax),%xmm3
2000 paddd %xmm15,%xmm12
2001 pslld $5,%xmm8
2002 pxor %xmm14,%xmm6
2004 movdqa %xmm13,%xmm9
2005 movdqa %xmm2,224-128(%rax)
2006 paddd %xmm2,%xmm12
2007 pxor %xmm0,%xmm3
2008 psrld $27,%xmm9
2009 pxor %xmm10,%xmm6
2010 movdqa %xmm14,%xmm7
2012 pslld $30,%xmm7
2013 movdqa %xmm3,%xmm5
2014 por %xmm9,%xmm8
2015 psrld $31,%xmm5
2016 paddd %xmm6,%xmm12
2017 paddd %xmm3,%xmm3
2019 psrld $2,%xmm14
2020 paddd %xmm8,%xmm12
2021 por %xmm5,%xmm3
2022 por %xmm7,%xmm14
2023 pxor %xmm1,%xmm4
2024 movdqa 32-128(%rax),%xmm1
2026 movdqa %xmm12,%xmm8
2027 movdqa %xmm10,%xmm6
2028 pxor 128-128(%rax),%xmm4
2029 paddd %xmm15,%xmm11
2030 pslld $5,%xmm8
2031 pxor %xmm13,%xmm6
2033 movdqa %xmm12,%xmm9
2034 movdqa %xmm3,240-128(%rax)
2035 paddd %xmm3,%xmm11
2036 pxor %xmm1,%xmm4
2037 psrld $27,%xmm9
2038 pxor %xmm14,%xmm6
2039 movdqa %xmm13,%xmm7
2041 pslld $30,%xmm7
2042 movdqa %xmm4,%xmm5
2043 por %xmm9,%xmm8
2044 psrld $31,%xmm5
2045 paddd %xmm6,%xmm11
2046 paddd %xmm4,%xmm4
2048 psrld $2,%xmm13
2049 paddd %xmm8,%xmm11
2050 por %xmm5,%xmm4
2051 por %xmm7,%xmm13
2052 pxor %xmm2,%xmm0
2053 movdqa 48-128(%rax),%xmm2
2055 movdqa %xmm11,%xmm8
2056 movdqa %xmm14,%xmm6
2057 pxor 144-128(%rax),%xmm0
2058 paddd %xmm15,%xmm10
2059 pslld $5,%xmm8
2060 pxor %xmm12,%xmm6
2062 movdqa %xmm11,%xmm9
2063 movdqa %xmm4,0-128(%rax)
2064 paddd %xmm4,%xmm10
2065 pxor %xmm2,%xmm0
2066 psrld $27,%xmm9
2067 pxor %xmm13,%xmm6
2068 movdqa %xmm12,%xmm7
2070 pslld $30,%xmm7
2071 movdqa %xmm0,%xmm5
2072 por %xmm9,%xmm8
2073 psrld $31,%xmm5
2074 paddd %xmm6,%xmm10
2075 paddd %xmm0,%xmm0
2077 psrld $2,%xmm12
2078 paddd %xmm8,%xmm10
2079 por %xmm5,%xmm0
2080 por %xmm7,%xmm12
2081 pxor %xmm3,%xmm1
2082 movdqa 64-128(%rax),%xmm3
2084 movdqa %xmm10,%xmm8
2085 movdqa %xmm13,%xmm6
2086 pxor 160-128(%rax),%xmm1
2087 paddd %xmm15,%xmm14
2088 pslld $5,%xmm8
2089 pxor %xmm11,%xmm6
2091 movdqa %xmm10,%xmm9
2092 movdqa %xmm0,16-128(%rax)
2093 paddd %xmm0,%xmm14
2094 pxor %xmm3,%xmm1
2095 psrld $27,%xmm9
2096 pxor %xmm12,%xmm6
2097 movdqa %xmm11,%xmm7
2099 pslld $30,%xmm7
2100 movdqa %xmm1,%xmm5
2101 por %xmm9,%xmm8
2102 psrld $31,%xmm5
2103 paddd %xmm6,%xmm14
2104 paddd %xmm1,%xmm1
2106 psrld $2,%xmm11
2107 paddd %xmm8,%xmm14
2108 por %xmm5,%xmm1
2109 por %xmm7,%xmm11
2110 pxor %xmm4,%xmm2
2111 movdqa 80-128(%rax),%xmm4
2113 movdqa %xmm14,%xmm8
2114 movdqa %xmm12,%xmm6
2115 pxor 176-128(%rax),%xmm2
2116 paddd %xmm15,%xmm13
2117 pslld $5,%xmm8
2118 pxor %xmm10,%xmm6
2120 movdqa %xmm14,%xmm9
2121 movdqa %xmm1,32-128(%rax)
2122 paddd %xmm1,%xmm13
2123 pxor %xmm4,%xmm2
2124 psrld $27,%xmm9
2125 pxor %xmm11,%xmm6
2126 movdqa %xmm10,%xmm7
2128 pslld $30,%xmm7
2129 movdqa %xmm2,%xmm5
2130 por %xmm9,%xmm8
2131 psrld $31,%xmm5
2132 paddd %xmm6,%xmm13
2133 paddd %xmm2,%xmm2
2135 psrld $2,%xmm10
2136 paddd %xmm8,%xmm13
2137 por %xmm5,%xmm2
2138 por %xmm7,%xmm10
2139 pxor %xmm0,%xmm3
2140 movdqa 96-128(%rax),%xmm0
2142 movdqa %xmm13,%xmm8
2143 movdqa %xmm11,%xmm6
2144 pxor 192-128(%rax),%xmm3
2145 paddd %xmm15,%xmm12
2146 pslld $5,%xmm8
2147 pxor %xmm14,%xmm6
2149 movdqa %xmm13,%xmm9
2150 movdqa %xmm2,48-128(%rax)
2151 paddd %xmm2,%xmm12
2152 pxor %xmm0,%xmm3
2153 psrld $27,%xmm9
2154 pxor %xmm10,%xmm6
2155 movdqa %xmm14,%xmm7
2157 pslld $30,%xmm7
2158 movdqa %xmm3,%xmm5
2159 por %xmm9,%xmm8
2160 psrld $31,%xmm5
2161 paddd %xmm6,%xmm12
2162 paddd %xmm3,%xmm3
2164 psrld $2,%xmm14
2165 paddd %xmm8,%xmm12
2166 por %xmm5,%xmm3
2167 por %xmm7,%xmm14
2168 pxor %xmm1,%xmm4
2169 movdqa 112-128(%rax),%xmm1
2171 movdqa %xmm12,%xmm8
2172 movdqa %xmm10,%xmm6
2173 pxor 208-128(%rax),%xmm4
2174 paddd %xmm15,%xmm11
2175 pslld $5,%xmm8
2176 pxor %xmm13,%xmm6
2178 movdqa %xmm12,%xmm9
2179 movdqa %xmm3,64-128(%rax)
2180 paddd %xmm3,%xmm11
2181 pxor %xmm1,%xmm4
2182 psrld $27,%xmm9
2183 pxor %xmm14,%xmm6
2184 movdqa %xmm13,%xmm7
2186 pslld $30,%xmm7
2187 movdqa %xmm4,%xmm5
2188 por %xmm9,%xmm8
2189 psrld $31,%xmm5
2190 paddd %xmm6,%xmm11
2191 paddd %xmm4,%xmm4
2193 psrld $2,%xmm13
2194 paddd %xmm8,%xmm11
2195 por %xmm5,%xmm4
2196 por %xmm7,%xmm13
2197 pxor %xmm2,%xmm0
2198 movdqa 128-128(%rax),%xmm2
2200 movdqa %xmm11,%xmm8
2201 movdqa %xmm14,%xmm6
2202 pxor 224-128(%rax),%xmm0
2203 paddd %xmm15,%xmm10
2204 pslld $5,%xmm8
2205 pxor %xmm12,%xmm6
2207 movdqa %xmm11,%xmm9
2208 movdqa %xmm4,80-128(%rax)
2209 paddd %xmm4,%xmm10
2210 pxor %xmm2,%xmm0
2211 psrld $27,%xmm9
2212 pxor %xmm13,%xmm6
2213 movdqa %xmm12,%xmm7
2215 pslld $30,%xmm7
2216 movdqa %xmm0,%xmm5
2217 por %xmm9,%xmm8
2218 psrld $31,%xmm5
2219 paddd %xmm6,%xmm10
2220 paddd %xmm0,%xmm0
2222 psrld $2,%xmm12
2223 paddd %xmm8,%xmm10
2224 por %xmm5,%xmm0
2225 por %xmm7,%xmm12
2226 pxor %xmm3,%xmm1
2227 movdqa 144-128(%rax),%xmm3
2229 movdqa %xmm10,%xmm8
2230 movdqa %xmm13,%xmm6
2231 pxor 240-128(%rax),%xmm1
2232 paddd %xmm15,%xmm14
2233 pslld $5,%xmm8
2234 pxor %xmm11,%xmm6
2236 movdqa %xmm10,%xmm9
2237 movdqa %xmm0,96-128(%rax)
2238 paddd %xmm0,%xmm14
2239 pxor %xmm3,%xmm1
2240 psrld $27,%xmm9
2241 pxor %xmm12,%xmm6
2242 movdqa %xmm11,%xmm7
2244 pslld $30,%xmm7
2245 movdqa %xmm1,%xmm5
2246 por %xmm9,%xmm8
2247 psrld $31,%xmm5
2248 paddd %xmm6,%xmm14
2249 paddd %xmm1,%xmm1
2251 psrld $2,%xmm11
2252 paddd %xmm8,%xmm14
2253 por %xmm5,%xmm1
2254 por %xmm7,%xmm11
2255 pxor %xmm4,%xmm2
2256 movdqa 160-128(%rax),%xmm4
2258 movdqa %xmm14,%xmm8
2259 movdqa %xmm12,%xmm6
2260 pxor 0-128(%rax),%xmm2
2261 paddd %xmm15,%xmm13
2262 pslld $5,%xmm8
2263 pxor %xmm10,%xmm6
2265 movdqa %xmm14,%xmm9
2266 movdqa %xmm1,112-128(%rax)
2267 paddd %xmm1,%xmm13
2268 pxor %xmm4,%xmm2
2269 psrld $27,%xmm9
2270 pxor %xmm11,%xmm6
2271 movdqa %xmm10,%xmm7
2273 pslld $30,%xmm7
2274 movdqa %xmm2,%xmm5
2275 por %xmm9,%xmm8
2276 psrld $31,%xmm5
2277 paddd %xmm6,%xmm13
2278 paddd %xmm2,%xmm2
2280 psrld $2,%xmm10
2281 paddd %xmm8,%xmm13
2282 por %xmm5,%xmm2
2283 por %xmm7,%xmm10
2284 pxor %xmm0,%xmm3
2285 movdqa 176-128(%rax),%xmm0
2287 movdqa %xmm13,%xmm8
2288 movdqa %xmm11,%xmm6
2289 pxor 16-128(%rax),%xmm3
2290 paddd %xmm15,%xmm12
2291 pslld $5,%xmm8
2292 pxor %xmm14,%xmm6
2294 movdqa %xmm13,%xmm9
2295 paddd %xmm2,%xmm12
2296 pxor %xmm0,%xmm3
2297 psrld $27,%xmm9
2298 pxor %xmm10,%xmm6
2299 movdqa %xmm14,%xmm7
2301 pslld $30,%xmm7
2302 movdqa %xmm3,%xmm5
2303 por %xmm9,%xmm8
2304 psrld $31,%xmm5
2305 paddd %xmm6,%xmm12
2306 paddd %xmm3,%xmm3
2308 psrld $2,%xmm14
2309 paddd %xmm8,%xmm12
2310 por %xmm5,%xmm3
2311 por %xmm7,%xmm14
2312 pxor %xmm1,%xmm4
2313 movdqa 192-128(%rax),%xmm1
2315 movdqa %xmm12,%xmm8
2316 movdqa %xmm10,%xmm6
2317 pxor 32-128(%rax),%xmm4
2318 paddd %xmm15,%xmm11
2319 pslld $5,%xmm8
2320 pxor %xmm13,%xmm6
2322 movdqa %xmm12,%xmm9
2323 paddd %xmm3,%xmm11
2324 pxor %xmm1,%xmm4
2325 psrld $27,%xmm9
2326 pxor %xmm14,%xmm6
2327 movdqa %xmm13,%xmm7
2329 pslld $30,%xmm7
2330 movdqa %xmm4,%xmm5
2331 por %xmm9,%xmm8
2332 psrld $31,%xmm5
2333 paddd %xmm6,%xmm11
2334 paddd %xmm4,%xmm4
2336 psrld $2,%xmm13
2337 paddd %xmm8,%xmm11
2338 por %xmm5,%xmm4
2339 por %xmm7,%xmm13
2340 pxor %xmm2,%xmm0
2341 movdqa 208-128(%rax),%xmm2
2343 movdqa %xmm11,%xmm8
2344 movdqa %xmm14,%xmm6
2345 pxor 48-128(%rax),%xmm0
2346 paddd %xmm15,%xmm10
2347 pslld $5,%xmm8
2348 pxor %xmm12,%xmm6
2350 movdqa %xmm11,%xmm9
2351 paddd %xmm4,%xmm10
2352 pxor %xmm2,%xmm0
2353 psrld $27,%xmm9
2354 pxor %xmm13,%xmm6
2355 movdqa %xmm12,%xmm7
2357 pslld $30,%xmm7
2358 movdqa %xmm0,%xmm5
2359 por %xmm9,%xmm8
2360 psrld $31,%xmm5
2361 paddd %xmm6,%xmm10
2362 paddd %xmm0,%xmm0
2364 psrld $2,%xmm12
2365 paddd %xmm8,%xmm10
2366 por %xmm5,%xmm0
2367 por %xmm7,%xmm12
2368 pxor %xmm3,%xmm1
2369 movdqa 224-128(%rax),%xmm3
2371 movdqa %xmm10,%xmm8
2372 movdqa %xmm13,%xmm6
2373 pxor 64-128(%rax),%xmm1
2374 paddd %xmm15,%xmm14
2375 pslld $5,%xmm8
2376 pxor %xmm11,%xmm6
2378 movdqa %xmm10,%xmm9
2379 paddd %xmm0,%xmm14
2380 pxor %xmm3,%xmm1
2381 psrld $27,%xmm9
2382 pxor %xmm12,%xmm6
2383 movdqa %xmm11,%xmm7
2385 pslld $30,%xmm7
2386 movdqa %xmm1,%xmm5
2387 por %xmm9,%xmm8
2388 psrld $31,%xmm5
2389 paddd %xmm6,%xmm14
2390 paddd %xmm1,%xmm1
2392 psrld $2,%xmm11
2393 paddd %xmm8,%xmm14
2394 por %xmm5,%xmm1
2395 por %xmm7,%xmm11
2396 pxor %xmm4,%xmm2
2397 movdqa 240-128(%rax),%xmm4
2399 movdqa %xmm14,%xmm8
2400 movdqa %xmm12,%xmm6
2401 pxor 80-128(%rax),%xmm2
2402 paddd %xmm15,%xmm13
2403 pslld $5,%xmm8
2404 pxor %xmm10,%xmm6
2406 movdqa %xmm14,%xmm9
2407 paddd %xmm1,%xmm13
2408 pxor %xmm4,%xmm2
2409 psrld $27,%xmm9
2410 pxor %xmm11,%xmm6
2411 movdqa %xmm10,%xmm7
2413 pslld $30,%xmm7
2414 movdqa %xmm2,%xmm5
2415 por %xmm9,%xmm8
2416 psrld $31,%xmm5
2417 paddd %xmm6,%xmm13
2418 paddd %xmm2,%xmm2
2420 psrld $2,%xmm10
2421 paddd %xmm8,%xmm13
2422 por %xmm5,%xmm2
2423 por %xmm7,%xmm10
2424 pxor %xmm0,%xmm3
2425 movdqa 0-128(%rax),%xmm0
2427 movdqa %xmm13,%xmm8
2428 movdqa %xmm11,%xmm6
2429 pxor 96-128(%rax),%xmm3
2430 paddd %xmm15,%xmm12
2431 pslld $5,%xmm8
2432 pxor %xmm14,%xmm6
2434 movdqa %xmm13,%xmm9
2435 paddd %xmm2,%xmm12
2436 pxor %xmm0,%xmm3
2437 psrld $27,%xmm9
2438 pxor %xmm10,%xmm6
2439 movdqa %xmm14,%xmm7
2441 pslld $30,%xmm7
2442 movdqa %xmm3,%xmm5
2443 por %xmm9,%xmm8
2444 psrld $31,%xmm5
2445 paddd %xmm6,%xmm12
2446 paddd %xmm3,%xmm3
2448 psrld $2,%xmm14
2449 paddd %xmm8,%xmm12
2450 por %xmm5,%xmm3
2451 por %xmm7,%xmm14
2452 pxor %xmm1,%xmm4
2453 movdqa 16-128(%rax),%xmm1
2455 movdqa %xmm12,%xmm8
2456 movdqa %xmm10,%xmm6
2457 pxor 112-128(%rax),%xmm4
2458 paddd %xmm15,%xmm11
2459 pslld $5,%xmm8
2460 pxor %xmm13,%xmm6
2462 movdqa %xmm12,%xmm9
2463 paddd %xmm3,%xmm11
2464 pxor %xmm1,%xmm4
2465 psrld $27,%xmm9
2466 pxor %xmm14,%xmm6
2467 movdqa %xmm13,%xmm7
2469 pslld $30,%xmm7
2470 movdqa %xmm4,%xmm5
2471 por %xmm9,%xmm8
2472 psrld $31,%xmm5
2473 paddd %xmm6,%xmm11
2474 paddd %xmm4,%xmm4
2476 psrld $2,%xmm13
2477 paddd %xmm8,%xmm11
2478 por %xmm5,%xmm4
2479 por %xmm7,%xmm13
2480 movdqa %xmm11,%xmm8
2481 paddd %xmm15,%xmm10
2482 movdqa %xmm14,%xmm6
2483 pslld $5,%xmm8
2484 pxor %xmm12,%xmm6
2486 movdqa %xmm11,%xmm9
2487 paddd %xmm4,%xmm10
2488 psrld $27,%xmm9
2489 movdqa %xmm12,%xmm7
2490 pxor %xmm13,%xmm6
2492 pslld $30,%xmm7
2493 por %xmm9,%xmm8
2494 paddd %xmm6,%xmm10
2496 psrld $2,%xmm12
2497 paddd %xmm8,%xmm10
2498 por %xmm7,%xmm12
2499 movdqa (%rbx),%xmm0
2500 movl $1,%ecx
2501 cmpl 0(%rbx),%ecx
2502 pxor %xmm8,%xmm8
2503 cmovgeq %rbp,%r8
2504 cmpl 4(%rbx),%ecx
2505 movdqa %xmm0,%xmm1
2506 cmovgeq %rbp,%r9
2507 cmpl 8(%rbx),%ecx
2508 pcmpgtd %xmm8,%xmm1
2509 cmovgeq %rbp,%r10
2510 cmpl 12(%rbx),%ecx
2511 paddd %xmm1,%xmm0
2512 cmovgeq %rbp,%r11
2514 movdqu 0(%rdi),%xmm6
2515 pand %xmm1,%xmm10
2516 movdqu 32(%rdi),%xmm7
2517 pand %xmm1,%xmm11
2518 paddd %xmm6,%xmm10
2519 movdqu 64(%rdi),%xmm8
2520 pand %xmm1,%xmm12
2521 paddd %xmm7,%xmm11
2522 movdqu 96(%rdi),%xmm9
2523 pand %xmm1,%xmm13
2524 paddd %xmm8,%xmm12
2525 movdqu 128(%rdi),%xmm5
2526 pand %xmm1,%xmm14
2527 movdqu %xmm10,0(%rdi)
2528 paddd %xmm9,%xmm13
2529 movdqu %xmm11,32(%rdi)
2530 paddd %xmm5,%xmm14
2531 movdqu %xmm12,64(%rdi)
2532 movdqu %xmm13,96(%rdi)
2533 movdqu %xmm14,128(%rdi)
2535 movdqa %xmm0,(%rbx)
2536 movdqa 96(%rbp),%xmm5
2537 movdqa -32(%rbp),%xmm15
2538 decl %edx
2539 jnz .Loop
2541 movl 280(%rsp),%edx
2542 leaq 16(%rdi),%rdi
2543 leaq 64(%rsi),%rsi
2544 decl %edx
2545 jnz .Loop_grande
2547 .Ldone:
2548 movq 272(%rsp),%rax
2549 movq -16(%rax),%rbp
2550 movq -8(%rax),%rbx
2551 leaq (%rax),%rsp
2552 .Lepilogue:
2553 .byte 0xf3,0xc3
2554 .size sha1_multi_block,.-sha1_multi_block
2555 .type sha1_multi_block_shaext,@function
2556 .align 32
2557 sha1_multi_block_shaext:
2558 _shaext_shortcut:
2559 movq %rsp,%rax
2560 pushq %rbx
2561 pushq %rbp
2562 subq $288,%rsp
2563 shll $1,%edx
2564 andq $-256,%rsp
2565 leaq 64(%rdi),%rdi
2566 movq %rax,272(%rsp)
2567 .Lbody_shaext:
2568 leaq 256(%rsp),%rbx
2569 movdqa K_XX_XX+128(%rip),%xmm3
2571 .Loop_grande_shaext:
2572 movl %edx,280(%rsp)
2573 xorl %edx,%edx
2574 movq 0(%rsi),%r8
2575 movl 8(%rsi),%ecx
2576 cmpl %edx,%ecx
2577 cmovgl %ecx,%edx
2578 testl %ecx,%ecx
2579 movl %ecx,0(%rbx)
2580 cmovleq %rsp,%r8
2581 movq 16(%rsi),%r9
2582 movl 24(%rsi),%ecx
2583 cmpl %edx,%ecx
2584 cmovgl %ecx,%edx
2585 testl %ecx,%ecx
2586 movl %ecx,4(%rbx)
2587 cmovleq %rsp,%r9
2588 testl %edx,%edx
2589 jz .Ldone_shaext
2591 movq 0-64(%rdi),%xmm0
2592 movq 32-64(%rdi),%xmm4
2593 movq 64-64(%rdi),%xmm5
2594 movq 96-64(%rdi),%xmm6
2595 movq 128-64(%rdi),%xmm7
2597 punpckldq %xmm4,%xmm0
2598 punpckldq %xmm6,%xmm5
2600 movdqa %xmm0,%xmm8
2601 punpcklqdq %xmm5,%xmm0
2602 punpckhqdq %xmm5,%xmm8
2604 pshufd $63,%xmm7,%xmm1
2605 pshufd $127,%xmm7,%xmm9
2606 pshufd $27,%xmm0,%xmm0
2607 pshufd $27,%xmm8,%xmm8
2608 jmp .Loop_shaext
2610 .align 32
2611 .Loop_shaext:
2612 movdqu 0(%r8),%xmm4
2613 movdqu 0(%r9),%xmm11
2614 movdqu 16(%r8),%xmm5
2615 movdqu 16(%r9),%xmm12
2616 movdqu 32(%r8),%xmm6
2617 .byte 102,15,56,0,227
2618 movdqu 32(%r9),%xmm13
2619 .byte 102,68,15,56,0,219
2620 movdqu 48(%r8),%xmm7
2621 leaq 64(%r8),%r8
2622 .byte 102,15,56,0,235
2623 movdqu 48(%r9),%xmm14
2624 leaq 64(%r9),%r9
2625 .byte 102,68,15,56,0,227
2627 movdqa %xmm1,80(%rsp)
2628 paddd %xmm4,%xmm1
2629 movdqa %xmm9,112(%rsp)
2630 paddd %xmm11,%xmm9
2631 movdqa %xmm0,64(%rsp)
2632 movdqa %xmm0,%xmm2
2633 movdqa %xmm8,96(%rsp)
2634 movdqa %xmm8,%xmm10
2635 .byte 15,58,204,193,0
2636 .byte 15,56,200,213
2637 .byte 69,15,58,204,193,0
2638 .byte 69,15,56,200,212
2639 .byte 102,15,56,0,243
2640 prefetcht0 127(%r8)
2641 .byte 15,56,201,229
2642 .byte 102,68,15,56,0,235
2643 prefetcht0 127(%r9)
2644 .byte 69,15,56,201,220
2646 .byte 102,15,56,0,251
2647 movdqa %xmm0,%xmm1
2648 .byte 102,68,15,56,0,243
2649 movdqa %xmm8,%xmm9
2650 .byte 15,58,204,194,0
2651 .byte 15,56,200,206
2652 .byte 69,15,58,204,194,0
2653 .byte 69,15,56,200,205
2654 pxor %xmm6,%xmm4
2655 .byte 15,56,201,238
2656 pxor %xmm13,%xmm11
2657 .byte 69,15,56,201,229
2658 movdqa %xmm0,%xmm2
2659 movdqa %xmm8,%xmm10
2660 .byte 15,58,204,193,0
2661 .byte 15,56,200,215
2662 .byte 69,15,58,204,193,0
2663 .byte 69,15,56,200,214
2664 .byte 15,56,202,231
2665 .byte 69,15,56,202,222
2666 pxor %xmm7,%xmm5
2667 .byte 15,56,201,247
2668 pxor %xmm14,%xmm12
2669 .byte 69,15,56,201,238
2670 movdqa %xmm0,%xmm1
2671 movdqa %xmm8,%xmm9
2672 .byte 15,58,204,194,0
2673 .byte 15,56,200,204
2674 .byte 69,15,58,204,194,0
2675 .byte 69,15,56,200,203
2676 .byte 15,56,202,236
2677 .byte 69,15,56,202,227
2678 pxor %xmm4,%xmm6
2679 .byte 15,56,201,252
2680 pxor %xmm11,%xmm13
2681 .byte 69,15,56,201,243
2682 movdqa %xmm0,%xmm2
2683 movdqa %xmm8,%xmm10
2684 .byte 15,58,204,193,0
2685 .byte 15,56,200,213
2686 .byte 69,15,58,204,193,0
2687 .byte 69,15,56,200,212
2688 .byte 15,56,202,245
2689 .byte 69,15,56,202,236
2690 pxor %xmm5,%xmm7
2691 .byte 15,56,201,229
2692 pxor %xmm12,%xmm14
2693 .byte 69,15,56,201,220
2694 movdqa %xmm0,%xmm1
2695 movdqa %xmm8,%xmm9
2696 .byte 15,58,204,194,1
2697 .byte 15,56,200,206
2698 .byte 69,15,58,204,194,1
2699 .byte 69,15,56,200,205
2700 .byte 15,56,202,254
2701 .byte 69,15,56,202,245
2702 pxor %xmm6,%xmm4
2703 .byte 15,56,201,238
2704 pxor %xmm13,%xmm11
2705 .byte 69,15,56,201,229
2706 movdqa %xmm0,%xmm2
2707 movdqa %xmm8,%xmm10
2708 .byte 15,58,204,193,1
2709 .byte 15,56,200,215
2710 .byte 69,15,58,204,193,1
2711 .byte 69,15,56,200,214
2712 .byte 15,56,202,231
2713 .byte 69,15,56,202,222
2714 pxor %xmm7,%xmm5
2715 .byte 15,56,201,247
2716 pxor %xmm14,%xmm12
2717 .byte 69,15,56,201,238
2718 movdqa %xmm0,%xmm1
2719 movdqa %xmm8,%xmm9
2720 .byte 15,58,204,194,1
2721 .byte 15,56,200,204
2722 .byte 69,15,58,204,194,1
2723 .byte 69,15,56,200,203
2724 .byte 15,56,202,236
2725 .byte 69,15,56,202,227
2726 pxor %xmm4,%xmm6
2727 .byte 15,56,201,252
2728 pxor %xmm11,%xmm13
2729 .byte 69,15,56,201,243
2730 movdqa %xmm0,%xmm2
2731 movdqa %xmm8,%xmm10
2732 .byte 15,58,204,193,1
2733 .byte 15,56,200,213
2734 .byte 69,15,58,204,193,1
2735 .byte 69,15,56,200,212
2736 .byte 15,56,202,245
2737 .byte 69,15,56,202,236
2738 pxor %xmm5,%xmm7
2739 .byte 15,56,201,229
2740 pxor %xmm12,%xmm14
2741 .byte 69,15,56,201,220
2742 movdqa %xmm0,%xmm1
2743 movdqa %xmm8,%xmm9
2744 .byte 15,58,204,194,1
2745 .byte 15,56,200,206
2746 .byte 69,15,58,204,194,1
2747 .byte 69,15,56,200,205
2748 .byte 15,56,202,254
2749 .byte 69,15,56,202,245
2750 pxor %xmm6,%xmm4
2751 .byte 15,56,201,238
2752 pxor %xmm13,%xmm11
2753 .byte 69,15,56,201,229
2754 movdqa %xmm0,%xmm2
2755 movdqa %xmm8,%xmm10
2756 .byte 15,58,204,193,2
2757 .byte 15,56,200,215
2758 .byte 69,15,58,204,193,2
2759 .byte 69,15,56,200,214
2760 .byte 15,56,202,231
2761 .byte 69,15,56,202,222
2762 pxor %xmm7,%xmm5
2763 .byte 15,56,201,247
2764 pxor %xmm14,%xmm12
2765 .byte 69,15,56,201,238
2766 movdqa %xmm0,%xmm1
2767 movdqa %xmm8,%xmm9
2768 .byte 15,58,204,194,2
2769 .byte 15,56,200,204
2770 .byte 69,15,58,204,194,2
2771 .byte 69,15,56,200,203
2772 .byte 15,56,202,236
2773 .byte 69,15,56,202,227
2774 pxor %xmm4,%xmm6
2775 .byte 15,56,201,252
2776 pxor %xmm11,%xmm13
2777 .byte 69,15,56,201,243
2778 movdqa %xmm0,%xmm2
2779 movdqa %xmm8,%xmm10
2780 .byte 15,58,204,193,2
2781 .byte 15,56,200,213
2782 .byte 69,15,58,204,193,2
2783 .byte 69,15,56,200,212
2784 .byte 15,56,202,245
2785 .byte 69,15,56,202,236
2786 pxor %xmm5,%xmm7
2787 .byte 15,56,201,229
2788 pxor %xmm12,%xmm14
2789 .byte 69,15,56,201,220
2790 movdqa %xmm0,%xmm1
2791 movdqa %xmm8,%xmm9
2792 .byte 15,58,204,194,2
2793 .byte 15,56,200,206
2794 .byte 69,15,58,204,194,2
2795 .byte 69,15,56,200,205
2796 .byte 15,56,202,254
2797 .byte 69,15,56,202,245
2798 pxor %xmm6,%xmm4
2799 .byte 15,56,201,238
2800 pxor %xmm13,%xmm11
2801 .byte 69,15,56,201,229
2802 movdqa %xmm0,%xmm2
2803 movdqa %xmm8,%xmm10
2804 .byte 15,58,204,193,2
2805 .byte 15,56,200,215
2806 .byte 69,15,58,204,193,2
2807 .byte 69,15,56,200,214
2808 .byte 15,56,202,231
2809 .byte 69,15,56,202,222
2810 pxor %xmm7,%xmm5
2811 .byte 15,56,201,247
2812 pxor %xmm14,%xmm12
2813 .byte 69,15,56,201,238
2814 movdqa %xmm0,%xmm1
2815 movdqa %xmm8,%xmm9
2816 .byte 15,58,204,194,3
2817 .byte 15,56,200,204
2818 .byte 69,15,58,204,194,3
2819 .byte 69,15,56,200,203
2820 .byte 15,56,202,236
2821 .byte 69,15,56,202,227
2822 pxor %xmm4,%xmm6
2823 .byte 15,56,201,252
2824 pxor %xmm11,%xmm13
2825 .byte 69,15,56,201,243
2826 movdqa %xmm0,%xmm2
2827 movdqa %xmm8,%xmm10
2828 .byte 15,58,204,193,3
2829 .byte 15,56,200,213
2830 .byte 69,15,58,204,193,3
2831 .byte 69,15,56,200,212
2832 .byte 15,56,202,245
2833 .byte 69,15,56,202,236
2834 pxor %xmm5,%xmm7
2835 pxor %xmm12,%xmm14
2837 movl $1,%ecx
2838 pxor %xmm4,%xmm4
2839 cmpl 0(%rbx),%ecx
2840 cmovgeq %rsp,%r8
2842 movdqa %xmm0,%xmm1
2843 movdqa %xmm8,%xmm9
2844 .byte 15,58,204,194,3
2845 .byte 15,56,200,206
2846 .byte 69,15,58,204,194,3
2847 .byte 69,15,56,200,205
2848 .byte 15,56,202,254
2849 .byte 69,15,56,202,245
2851 cmpl 4(%rbx),%ecx
2852 cmovgeq %rsp,%r9
2853 movq (%rbx),%xmm6
2855 movdqa %xmm0,%xmm2
2856 movdqa %xmm8,%xmm10
2857 .byte 15,58,204,193,3
2858 .byte 15,56,200,215
2859 .byte 69,15,58,204,193,3
2860 .byte 69,15,56,200,214
2862 pshufd $0x00,%xmm6,%xmm11
2863 pshufd $0x55,%xmm6,%xmm12
2864 movdqa %xmm6,%xmm7
2865 pcmpgtd %xmm4,%xmm11
2866 pcmpgtd %xmm4,%xmm12
2868 movdqa %xmm0,%xmm1
2869 movdqa %xmm8,%xmm9
2870 .byte 15,58,204,194,3
2871 .byte 15,56,200,204
2872 .byte 69,15,58,204,194,3
2873 .byte 68,15,56,200,204
2875 pcmpgtd %xmm4,%xmm7
2876 pand %xmm11,%xmm0
2877 pand %xmm11,%xmm1
2878 pand %xmm12,%xmm8
2879 pand %xmm12,%xmm9
2880 paddd %xmm7,%xmm6
2882 paddd 64(%rsp),%xmm0
2883 paddd 80(%rsp),%xmm1
2884 paddd 96(%rsp),%xmm8
2885 paddd 112(%rsp),%xmm9
2887 movq %xmm6,(%rbx)
2888 decl %edx
2889 jnz .Loop_shaext
2891 movl 280(%rsp),%edx
2893 pshufd $27,%xmm0,%xmm0
2894 pshufd $27,%xmm8,%xmm8
2896 movdqa %xmm0,%xmm6
2897 punpckldq %xmm8,%xmm0
2898 punpckhdq %xmm8,%xmm6
2899 punpckhdq %xmm9,%xmm1
2900 movq %xmm0,0-64(%rdi)
2901 psrldq $8,%xmm0
2902 movq %xmm6,64-64(%rdi)
2903 psrldq $8,%xmm6
2904 movq %xmm0,32-64(%rdi)
2905 psrldq $8,%xmm1
2906 movq %xmm6,96-64(%rdi)
2907 movq %xmm1,128-64(%rdi)
2909 leaq 8(%rdi),%rdi
2910 leaq 32(%rsi),%rsi
2911 decl %edx
2912 jnz .Loop_grande_shaext
2914 .Ldone_shaext:
2916 movq -16(%rax),%rbp
2917 movq -8(%rax),%rbx
2918 leaq (%rax),%rsp
2919 .Lepilogue_shaext:
2920 .byte 0xf3,0xc3
2921 .size sha1_multi_block_shaext,.-sha1_multi_block_shaext
2922 .type sha1_multi_block_avx,@function
2923 .align 32
2924 sha1_multi_block_avx:
2925 _avx_shortcut:
2926 shrq $32,%rcx
2927 cmpl $2,%edx
2928 jb .Lavx
2929 testl $32,%ecx
2930 jnz _avx2_shortcut
2931 jmp .Lavx
2932 .align 32
2933 .Lavx:
2934 movq %rsp,%rax
2935 pushq %rbx
2936 pushq %rbp
2937 subq $288,%rsp
2938 andq $-256,%rsp
2939 movq %rax,272(%rsp)
2940 .Lbody_avx:
2941 leaq K_XX_XX(%rip),%rbp
2942 leaq 256(%rsp),%rbx
2944 vzeroupper
2945 .Loop_grande_avx:
2946 movl %edx,280(%rsp)
2947 xorl %edx,%edx
2948 movq 0(%rsi),%r8
2949 movl 8(%rsi),%ecx
2950 cmpl %edx,%ecx
2951 cmovgl %ecx,%edx
2952 testl %ecx,%ecx
2953 movl %ecx,0(%rbx)
2954 cmovleq %rbp,%r8
2955 movq 16(%rsi),%r9
2956 movl 24(%rsi),%ecx
2957 cmpl %edx,%ecx
2958 cmovgl %ecx,%edx
2959 testl %ecx,%ecx
2960 movl %ecx,4(%rbx)
2961 cmovleq %rbp,%r9
2962 movq 32(%rsi),%r10
2963 movl 40(%rsi),%ecx
2964 cmpl %edx,%ecx
2965 cmovgl %ecx,%edx
2966 testl %ecx,%ecx
2967 movl %ecx,8(%rbx)
2968 cmovleq %rbp,%r10
2969 movq 48(%rsi),%r11
2970 movl 56(%rsi),%ecx
2971 cmpl %edx,%ecx
2972 cmovgl %ecx,%edx
2973 testl %ecx,%ecx
2974 movl %ecx,12(%rbx)
2975 cmovleq %rbp,%r11
2976 testl %edx,%edx
2977 jz .Ldone_avx
2979 vmovdqu 0(%rdi),%xmm10
2980 leaq 128(%rsp),%rax
2981 vmovdqu 32(%rdi),%xmm11
2982 vmovdqu 64(%rdi),%xmm12
2983 vmovdqu 96(%rdi),%xmm13
2984 vmovdqu 128(%rdi),%xmm14
2985 vmovdqu 96(%rbp),%xmm5
2986 jmp .Loop_avx
2988 .align 32
2989 .Loop_avx:
2990 vmovdqa -32(%rbp),%xmm15
2991 vmovd (%r8),%xmm0
2992 leaq 64(%r8),%r8
2993 vmovd (%r9),%xmm2
2994 leaq 64(%r9),%r9
2995 vpinsrd $1,(%r10),%xmm0,%xmm0
2996 leaq 64(%r10),%r10
2997 vpinsrd $1,(%r11),%xmm2,%xmm2
2998 leaq 64(%r11),%r11
2999 vmovd -60(%r8),%xmm1
3000 vpunpckldq %xmm2,%xmm0,%xmm0
3001 vmovd -60(%r9),%xmm9
3002 vpshufb %xmm5,%xmm0,%xmm0
3003 vpinsrd $1,-60(%r10),%xmm1,%xmm1
3004 vpinsrd $1,-60(%r11),%xmm9,%xmm9
3005 vpaddd %xmm15,%xmm14,%xmm14
3006 vpslld $5,%xmm10,%xmm8
3007 vpandn %xmm13,%xmm11,%xmm7
3008 vpand %xmm12,%xmm11,%xmm6
3010 vmovdqa %xmm0,0-128(%rax)
3011 vpaddd %xmm0,%xmm14,%xmm14
3012 vpunpckldq %xmm9,%xmm1,%xmm1
3013 vpsrld $27,%xmm10,%xmm9
3014 vpxor %xmm7,%xmm6,%xmm6
3015 vmovd -56(%r8),%xmm2
3017 vpslld $30,%xmm11,%xmm7
3018 vpor %xmm9,%xmm8,%xmm8
3019 vmovd -56(%r9),%xmm9
3020 vpaddd %xmm6,%xmm14,%xmm14
3022 vpsrld $2,%xmm11,%xmm11
3023 vpaddd %xmm8,%xmm14,%xmm14
3024 vpshufb %xmm5,%xmm1,%xmm1
3025 vpor %xmm7,%xmm11,%xmm11
3026 vpinsrd $1,-56(%r10),%xmm2,%xmm2
3027 vpinsrd $1,-56(%r11),%xmm9,%xmm9
3028 vpaddd %xmm15,%xmm13,%xmm13
3029 vpslld $5,%xmm14,%xmm8
3030 vpandn %xmm12,%xmm10,%xmm7
3031 vpand %xmm11,%xmm10,%xmm6
3033 vmovdqa %xmm1,16-128(%rax)
3034 vpaddd %xmm1,%xmm13,%xmm13
3035 vpunpckldq %xmm9,%xmm2,%xmm2
3036 vpsrld $27,%xmm14,%xmm9
3037 vpxor %xmm7,%xmm6,%xmm6
3038 vmovd -52(%r8),%xmm3
3040 vpslld $30,%xmm10,%xmm7
3041 vpor %xmm9,%xmm8,%xmm8
3042 vmovd -52(%r9),%xmm9
3043 vpaddd %xmm6,%xmm13,%xmm13
3045 vpsrld $2,%xmm10,%xmm10
3046 vpaddd %xmm8,%xmm13,%xmm13
3047 vpshufb %xmm5,%xmm2,%xmm2
3048 vpor %xmm7,%xmm10,%xmm10
3049 vpinsrd $1,-52(%r10),%xmm3,%xmm3
3050 vpinsrd $1,-52(%r11),%xmm9,%xmm9
3051 vpaddd %xmm15,%xmm12,%xmm12
3052 vpslld $5,%xmm13,%xmm8
3053 vpandn %xmm11,%xmm14,%xmm7
3054 vpand %xmm10,%xmm14,%xmm6
3056 vmovdqa %xmm2,32-128(%rax)
3057 vpaddd %xmm2,%xmm12,%xmm12
3058 vpunpckldq %xmm9,%xmm3,%xmm3
3059 vpsrld $27,%xmm13,%xmm9
3060 vpxor %xmm7,%xmm6,%xmm6
3061 vmovd -48(%r8),%xmm4
3063 vpslld $30,%xmm14,%xmm7
3064 vpor %xmm9,%xmm8,%xmm8
3065 vmovd -48(%r9),%xmm9
3066 vpaddd %xmm6,%xmm12,%xmm12
3068 vpsrld $2,%xmm14,%xmm14
3069 vpaddd %xmm8,%xmm12,%xmm12
3070 vpshufb %xmm5,%xmm3,%xmm3
3071 vpor %xmm7,%xmm14,%xmm14
3072 vpinsrd $1,-48(%r10),%xmm4,%xmm4
3073 vpinsrd $1,-48(%r11),%xmm9,%xmm9
3074 vpaddd %xmm15,%xmm11,%xmm11
3075 vpslld $5,%xmm12,%xmm8
3076 vpandn %xmm10,%xmm13,%xmm7
3077 vpand %xmm14,%xmm13,%xmm6
3079 vmovdqa %xmm3,48-128(%rax)
3080 vpaddd %xmm3,%xmm11,%xmm11
3081 vpunpckldq %xmm9,%xmm4,%xmm4
3082 vpsrld $27,%xmm12,%xmm9
3083 vpxor %xmm7,%xmm6,%xmm6
3084 vmovd -44(%r8),%xmm0
3086 vpslld $30,%xmm13,%xmm7
3087 vpor %xmm9,%xmm8,%xmm8
3088 vmovd -44(%r9),%xmm9
3089 vpaddd %xmm6,%xmm11,%xmm11
3091 vpsrld $2,%xmm13,%xmm13
3092 vpaddd %xmm8,%xmm11,%xmm11
3093 vpshufb %xmm5,%xmm4,%xmm4
3094 vpor %xmm7,%xmm13,%xmm13
3095 vpinsrd $1,-44(%r10),%xmm0,%xmm0
3096 vpinsrd $1,-44(%r11),%xmm9,%xmm9
3097 vpaddd %xmm15,%xmm10,%xmm10
3098 vpslld $5,%xmm11,%xmm8
3099 vpandn %xmm14,%xmm12,%xmm7
3100 vpand %xmm13,%xmm12,%xmm6
3102 vmovdqa %xmm4,64-128(%rax)
3103 vpaddd %xmm4,%xmm10,%xmm10
3104 vpunpckldq %xmm9,%xmm0,%xmm0
3105 vpsrld $27,%xmm11,%xmm9
3106 vpxor %xmm7,%xmm6,%xmm6
3107 vmovd -40(%r8),%xmm1
3109 vpslld $30,%xmm12,%xmm7
3110 vpor %xmm9,%xmm8,%xmm8
3111 vmovd -40(%r9),%xmm9
3112 vpaddd %xmm6,%xmm10,%xmm10
3114 vpsrld $2,%xmm12,%xmm12
3115 vpaddd %xmm8,%xmm10,%xmm10
3116 vpshufb %xmm5,%xmm0,%xmm0
3117 vpor %xmm7,%xmm12,%xmm12
3118 vpinsrd $1,-40(%r10),%xmm1,%xmm1
3119 vpinsrd $1,-40(%r11),%xmm9,%xmm9
3120 vpaddd %xmm15,%xmm14,%xmm14
3121 vpslld $5,%xmm10,%xmm8
3122 vpandn %xmm13,%xmm11,%xmm7
3123 vpand %xmm12,%xmm11,%xmm6
3125 vmovdqa %xmm0,80-128(%rax)
3126 vpaddd %xmm0,%xmm14,%xmm14
3127 vpunpckldq %xmm9,%xmm1,%xmm1
3128 vpsrld $27,%xmm10,%xmm9
3129 vpxor %xmm7,%xmm6,%xmm6
3130 vmovd -36(%r8),%xmm2
3132 vpslld $30,%xmm11,%xmm7
3133 vpor %xmm9,%xmm8,%xmm8
3134 vmovd -36(%r9),%xmm9
3135 vpaddd %xmm6,%xmm14,%xmm14
3137 vpsrld $2,%xmm11,%xmm11
3138 vpaddd %xmm8,%xmm14,%xmm14
3139 vpshufb %xmm5,%xmm1,%xmm1
3140 vpor %xmm7,%xmm11,%xmm11
3141 vpinsrd $1,-36(%r10),%xmm2,%xmm2
3142 vpinsrd $1,-36(%r11),%xmm9,%xmm9
3143 vpaddd %xmm15,%xmm13,%xmm13
3144 vpslld $5,%xmm14,%xmm8
3145 vpandn %xmm12,%xmm10,%xmm7
3146 vpand %xmm11,%xmm10,%xmm6
3148 vmovdqa %xmm1,96-128(%rax)
3149 vpaddd %xmm1,%xmm13,%xmm13
3150 vpunpckldq %xmm9,%xmm2,%xmm2
3151 vpsrld $27,%xmm14,%xmm9
3152 vpxor %xmm7,%xmm6,%xmm6
3153 vmovd -32(%r8),%xmm3
3155 vpslld $30,%xmm10,%xmm7
3156 vpor %xmm9,%xmm8,%xmm8
3157 vmovd -32(%r9),%xmm9
3158 vpaddd %xmm6,%xmm13,%xmm13
3160 vpsrld $2,%xmm10,%xmm10
3161 vpaddd %xmm8,%xmm13,%xmm13
3162 vpshufb %xmm5,%xmm2,%xmm2
3163 vpor %xmm7,%xmm10,%xmm10
3164 vpinsrd $1,-32(%r10),%xmm3,%xmm3
3165 vpinsrd $1,-32(%r11),%xmm9,%xmm9
3166 vpaddd %xmm15,%xmm12,%xmm12
3167 vpslld $5,%xmm13,%xmm8
3168 vpandn %xmm11,%xmm14,%xmm7
3169 vpand %xmm10,%xmm14,%xmm6
3171 vmovdqa %xmm2,112-128(%rax)
3172 vpaddd %xmm2,%xmm12,%xmm12
3173 vpunpckldq %xmm9,%xmm3,%xmm3
3174 vpsrld $27,%xmm13,%xmm9
3175 vpxor %xmm7,%xmm6,%xmm6
3176 vmovd -28(%r8),%xmm4
3178 vpslld $30,%xmm14,%xmm7
3179 vpor %xmm9,%xmm8,%xmm8
3180 vmovd -28(%r9),%xmm9
3181 vpaddd %xmm6,%xmm12,%xmm12
3183 vpsrld $2,%xmm14,%xmm14
3184 vpaddd %xmm8,%xmm12,%xmm12
3185 vpshufb %xmm5,%xmm3,%xmm3
3186 vpor %xmm7,%xmm14,%xmm14
3187 vpinsrd $1,-28(%r10),%xmm4,%xmm4
3188 vpinsrd $1,-28(%r11),%xmm9,%xmm9
3189 vpaddd %xmm15,%xmm11,%xmm11
3190 vpslld $5,%xmm12,%xmm8
3191 vpandn %xmm10,%xmm13,%xmm7
3192 vpand %xmm14,%xmm13,%xmm6
3194 vmovdqa %xmm3,128-128(%rax)
3195 vpaddd %xmm3,%xmm11,%xmm11
3196 vpunpckldq %xmm9,%xmm4,%xmm4
3197 vpsrld $27,%xmm12,%xmm9
3198 vpxor %xmm7,%xmm6,%xmm6
3199 vmovd -24(%r8),%xmm0
3201 vpslld $30,%xmm13,%xmm7
3202 vpor %xmm9,%xmm8,%xmm8
3203 vmovd -24(%r9),%xmm9
3204 vpaddd %xmm6,%xmm11,%xmm11
3206 vpsrld $2,%xmm13,%xmm13
3207 vpaddd %xmm8,%xmm11,%xmm11
3208 vpshufb %xmm5,%xmm4,%xmm4
3209 vpor %xmm7,%xmm13,%xmm13
3210 vpinsrd $1,-24(%r10),%xmm0,%xmm0
3211 vpinsrd $1,-24(%r11),%xmm9,%xmm9
3212 vpaddd %xmm15,%xmm10,%xmm10
3213 vpslld $5,%xmm11,%xmm8
3214 vpandn %xmm14,%xmm12,%xmm7
3215 vpand %xmm13,%xmm12,%xmm6
3217 vmovdqa %xmm4,144-128(%rax)
3218 vpaddd %xmm4,%xmm10,%xmm10
3219 vpunpckldq %xmm9,%xmm0,%xmm0
3220 vpsrld $27,%xmm11,%xmm9
3221 vpxor %xmm7,%xmm6,%xmm6
3222 vmovd -20(%r8),%xmm1
3224 vpslld $30,%xmm12,%xmm7
3225 vpor %xmm9,%xmm8,%xmm8
3226 vmovd -20(%r9),%xmm9
3227 vpaddd %xmm6,%xmm10,%xmm10
3229 vpsrld $2,%xmm12,%xmm12
3230 vpaddd %xmm8,%xmm10,%xmm10
3231 vpshufb %xmm5,%xmm0,%xmm0
3232 vpor %xmm7,%xmm12,%xmm12
3233 vpinsrd $1,-20(%r10),%xmm1,%xmm1
3234 vpinsrd $1,-20(%r11),%xmm9,%xmm9
3235 vpaddd %xmm15,%xmm14,%xmm14
3236 vpslld $5,%xmm10,%xmm8
3237 vpandn %xmm13,%xmm11,%xmm7
3238 vpand %xmm12,%xmm11,%xmm6
3240 vmovdqa %xmm0,160-128(%rax)
3241 vpaddd %xmm0,%xmm14,%xmm14
3242 vpunpckldq %xmm9,%xmm1,%xmm1
3243 vpsrld $27,%xmm10,%xmm9
3244 vpxor %xmm7,%xmm6,%xmm6
3245 vmovd -16(%r8),%xmm2
3247 vpslld $30,%xmm11,%xmm7
3248 vpor %xmm9,%xmm8,%xmm8
3249 vmovd -16(%r9),%xmm9
3250 vpaddd %xmm6,%xmm14,%xmm14
3252 vpsrld $2,%xmm11,%xmm11
3253 vpaddd %xmm8,%xmm14,%xmm14
3254 vpshufb %xmm5,%xmm1,%xmm1
3255 vpor %xmm7,%xmm11,%xmm11
3256 vpinsrd $1,-16(%r10),%xmm2,%xmm2
3257 vpinsrd $1,-16(%r11),%xmm9,%xmm9
3258 vpaddd %xmm15,%xmm13,%xmm13
3259 vpslld $5,%xmm14,%xmm8
3260 vpandn %xmm12,%xmm10,%xmm7
3261 vpand %xmm11,%xmm10,%xmm6
3263 vmovdqa %xmm1,176-128(%rax)
3264 vpaddd %xmm1,%xmm13,%xmm13
3265 vpunpckldq %xmm9,%xmm2,%xmm2
3266 vpsrld $27,%xmm14,%xmm9
3267 vpxor %xmm7,%xmm6,%xmm6
3268 vmovd -12(%r8),%xmm3
3270 vpslld $30,%xmm10,%xmm7
3271 vpor %xmm9,%xmm8,%xmm8
3272 vmovd -12(%r9),%xmm9
3273 vpaddd %xmm6,%xmm13,%xmm13
3275 vpsrld $2,%xmm10,%xmm10
3276 vpaddd %xmm8,%xmm13,%xmm13
3277 vpshufb %xmm5,%xmm2,%xmm2
3278 vpor %xmm7,%xmm10,%xmm10
3279 vpinsrd $1,-12(%r10),%xmm3,%xmm3
3280 vpinsrd $1,-12(%r11),%xmm9,%xmm9
3281 vpaddd %xmm15,%xmm12,%xmm12
3282 vpslld $5,%xmm13,%xmm8
3283 vpandn %xmm11,%xmm14,%xmm7
3284 vpand %xmm10,%xmm14,%xmm6
3286 vmovdqa %xmm2,192-128(%rax)
3287 vpaddd %xmm2,%xmm12,%xmm12
3288 vpunpckldq %xmm9,%xmm3,%xmm3
3289 vpsrld $27,%xmm13,%xmm9
3290 vpxor %xmm7,%xmm6,%xmm6
3291 vmovd -8(%r8),%xmm4
3293 vpslld $30,%xmm14,%xmm7
3294 vpor %xmm9,%xmm8,%xmm8
3295 vmovd -8(%r9),%xmm9
3296 vpaddd %xmm6,%xmm12,%xmm12
3298 vpsrld $2,%xmm14,%xmm14
3299 vpaddd %xmm8,%xmm12,%xmm12
3300 vpshufb %xmm5,%xmm3,%xmm3
3301 vpor %xmm7,%xmm14,%xmm14
3302 vpinsrd $1,-8(%r10),%xmm4,%xmm4
3303 vpinsrd $1,-8(%r11),%xmm9,%xmm9
3304 vpaddd %xmm15,%xmm11,%xmm11
3305 vpslld $5,%xmm12,%xmm8
3306 vpandn %xmm10,%xmm13,%xmm7
3307 vpand %xmm14,%xmm13,%xmm6
3309 vmovdqa %xmm3,208-128(%rax)
3310 vpaddd %xmm3,%xmm11,%xmm11
3311 vpunpckldq %xmm9,%xmm4,%xmm4
3312 vpsrld $27,%xmm12,%xmm9
3313 vpxor %xmm7,%xmm6,%xmm6
3314 vmovd -4(%r8),%xmm0
3316 vpslld $30,%xmm13,%xmm7
3317 vpor %xmm9,%xmm8,%xmm8
3318 vmovd -4(%r9),%xmm9
3319 vpaddd %xmm6,%xmm11,%xmm11
3321 vpsrld $2,%xmm13,%xmm13
3322 vpaddd %xmm8,%xmm11,%xmm11
3323 vpshufb %xmm5,%xmm4,%xmm4
3324 vpor %xmm7,%xmm13,%xmm13
3325 vmovdqa 0-128(%rax),%xmm1
3326 vpinsrd $1,-4(%r10),%xmm0,%xmm0
3327 vpinsrd $1,-4(%r11),%xmm9,%xmm9
3328 vpaddd %xmm15,%xmm10,%xmm10
3329 prefetcht0 63(%r8)
3330 vpslld $5,%xmm11,%xmm8
3331 vpandn %xmm14,%xmm12,%xmm7
3332 vpand %xmm13,%xmm12,%xmm6
3334 vmovdqa %xmm4,224-128(%rax)
3335 vpaddd %xmm4,%xmm10,%xmm10
3336 vpunpckldq %xmm9,%xmm0,%xmm0
3337 vpsrld $27,%xmm11,%xmm9
3338 prefetcht0 63(%r9)
3339 vpxor %xmm7,%xmm6,%xmm6
3341 vpslld $30,%xmm12,%xmm7
3342 vpor %xmm9,%xmm8,%xmm8
3343 prefetcht0 63(%r10)
3344 vpaddd %xmm6,%xmm10,%xmm10
3346 vpsrld $2,%xmm12,%xmm12
3347 vpaddd %xmm8,%xmm10,%xmm10
3348 prefetcht0 63(%r11)
3349 vpshufb %xmm5,%xmm0,%xmm0
3350 vpor %xmm7,%xmm12,%xmm12
3351 vmovdqa 16-128(%rax),%xmm2
3352 vpxor %xmm3,%xmm1,%xmm1
3353 vmovdqa 32-128(%rax),%xmm3
3355 vpaddd %xmm15,%xmm14,%xmm14
3356 vpslld $5,%xmm10,%xmm8
3357 vpandn %xmm13,%xmm11,%xmm7
3359 vpand %xmm12,%xmm11,%xmm6
3361 vmovdqa %xmm0,240-128(%rax)
3362 vpaddd %xmm0,%xmm14,%xmm14
3363 vpxor 128-128(%rax),%xmm1,%xmm1
3364 vpsrld $27,%xmm10,%xmm9
3365 vpxor %xmm7,%xmm6,%xmm6
3366 vpxor %xmm3,%xmm1,%xmm1
3369 vpslld $30,%xmm11,%xmm7
3370 vpor %xmm9,%xmm8,%xmm8
3371 vpaddd %xmm6,%xmm14,%xmm14
3373 vpsrld $31,%xmm1,%xmm5
3374 vpaddd %xmm1,%xmm1,%xmm1
3376 vpsrld $2,%xmm11,%xmm11
3378 vpaddd %xmm8,%xmm14,%xmm14
3379 vpor %xmm5,%xmm1,%xmm1
3380 vpor %xmm7,%xmm11,%xmm11
3381 vpxor %xmm4,%xmm2,%xmm2
3382 vmovdqa 48-128(%rax),%xmm4
3384 vpaddd %xmm15,%xmm13,%xmm13
3385 vpslld $5,%xmm14,%xmm8
3386 vpandn %xmm12,%xmm10,%xmm7
3388 vpand %xmm11,%xmm10,%xmm6
3390 vmovdqa %xmm1,0-128(%rax)
3391 vpaddd %xmm1,%xmm13,%xmm13
3392 vpxor 144-128(%rax),%xmm2,%xmm2
3393 vpsrld $27,%xmm14,%xmm9
3394 vpxor %xmm7,%xmm6,%xmm6
3395 vpxor %xmm4,%xmm2,%xmm2
3398 vpslld $30,%xmm10,%xmm7
3399 vpor %xmm9,%xmm8,%xmm8
3400 vpaddd %xmm6,%xmm13,%xmm13
3402 vpsrld $31,%xmm2,%xmm5
3403 vpaddd %xmm2,%xmm2,%xmm2
3405 vpsrld $2,%xmm10,%xmm10
3407 vpaddd %xmm8,%xmm13,%xmm13
3408 vpor %xmm5,%xmm2,%xmm2
3409 vpor %xmm7,%xmm10,%xmm10
3410 vpxor %xmm0,%xmm3,%xmm3
3411 vmovdqa 64-128(%rax),%xmm0
3413 vpaddd %xmm15,%xmm12,%xmm12
3414 vpslld $5,%xmm13,%xmm8
3415 vpandn %xmm11,%xmm14,%xmm7
3417 vpand %xmm10,%xmm14,%xmm6
3419 vmovdqa %xmm2,16-128(%rax)
3420 vpaddd %xmm2,%xmm12,%xmm12
3421 vpxor 160-128(%rax),%xmm3,%xmm3
3422 vpsrld $27,%xmm13,%xmm9
3423 vpxor %xmm7,%xmm6,%xmm6
3424 vpxor %xmm0,%xmm3,%xmm3
3427 vpslld $30,%xmm14,%xmm7
3428 vpor %xmm9,%xmm8,%xmm8
3429 vpaddd %xmm6,%xmm12,%xmm12
3431 vpsrld $31,%xmm3,%xmm5
3432 vpaddd %xmm3,%xmm3,%xmm3
3434 vpsrld $2,%xmm14,%xmm14
3436 vpaddd %xmm8,%xmm12,%xmm12
3437 vpor %xmm5,%xmm3,%xmm3
3438 vpor %xmm7,%xmm14,%xmm14
3439 vpxor %xmm1,%xmm4,%xmm4
3440 vmovdqa 80-128(%rax),%xmm1
3442 vpaddd %xmm15,%xmm11,%xmm11
3443 vpslld $5,%xmm12,%xmm8
3444 vpandn %xmm10,%xmm13,%xmm7
3446 vpand %xmm14,%xmm13,%xmm6
3448 vmovdqa %xmm3,32-128(%rax)
3449 vpaddd %xmm3,%xmm11,%xmm11
3450 vpxor 176-128(%rax),%xmm4,%xmm4
3451 vpsrld $27,%xmm12,%xmm9
3452 vpxor %xmm7,%xmm6,%xmm6
3453 vpxor %xmm1,%xmm4,%xmm4
3456 vpslld $30,%xmm13,%xmm7
3457 vpor %xmm9,%xmm8,%xmm8
3458 vpaddd %xmm6,%xmm11,%xmm11
3460 vpsrld $31,%xmm4,%xmm5
3461 vpaddd %xmm4,%xmm4,%xmm4
3463 vpsrld $2,%xmm13,%xmm13
3465 vpaddd %xmm8,%xmm11,%xmm11
3466 vpor %xmm5,%xmm4,%xmm4
3467 vpor %xmm7,%xmm13,%xmm13
3468 vpxor %xmm2,%xmm0,%xmm0
3469 vmovdqa 96-128(%rax),%xmm2
3471 vpaddd %xmm15,%xmm10,%xmm10
3472 vpslld $5,%xmm11,%xmm8
3473 vpandn %xmm14,%xmm12,%xmm7
3475 vpand %xmm13,%xmm12,%xmm6
3477 vmovdqa %xmm4,48-128(%rax)
3478 vpaddd %xmm4,%xmm10,%xmm10
3479 vpxor 192-128(%rax),%xmm0,%xmm0
3480 vpsrld $27,%xmm11,%xmm9
3481 vpxor %xmm7,%xmm6,%xmm6
3482 vpxor %xmm2,%xmm0,%xmm0
3485 vpslld $30,%xmm12,%xmm7
3486 vpor %xmm9,%xmm8,%xmm8
3487 vpaddd %xmm6,%xmm10,%xmm10
3489 vpsrld $31,%xmm0,%xmm5
3490 vpaddd %xmm0,%xmm0,%xmm0
3492 vpsrld $2,%xmm12,%xmm12
3494 vpaddd %xmm8,%xmm10,%xmm10
3495 vpor %xmm5,%xmm0,%xmm0
3496 vpor %xmm7,%xmm12,%xmm12
3497 vmovdqa 0(%rbp),%xmm15
3498 vpxor %xmm3,%xmm1,%xmm1
3499 vmovdqa 112-128(%rax),%xmm3
3501 vpslld $5,%xmm10,%xmm8
3502 vpaddd %xmm15,%xmm14,%xmm14
3503 vpxor %xmm11,%xmm13,%xmm6
3504 vmovdqa %xmm0,64-128(%rax)
3505 vpaddd %xmm0,%xmm14,%xmm14
3506 vpxor 208-128(%rax),%xmm1,%xmm1
3507 vpsrld $27,%xmm10,%xmm9
3508 vpxor %xmm12,%xmm6,%xmm6
3509 vpxor %xmm3,%xmm1,%xmm1
3511 vpslld $30,%xmm11,%xmm7
3512 vpor %xmm9,%xmm8,%xmm8
3513 vpaddd %xmm6,%xmm14,%xmm14
3514 vpsrld $31,%xmm1,%xmm5
3515 vpaddd %xmm1,%xmm1,%xmm1
3517 vpsrld $2,%xmm11,%xmm11
3518 vpaddd %xmm8,%xmm14,%xmm14
3519 vpor %xmm5,%xmm1,%xmm1
3520 vpor %xmm7,%xmm11,%xmm11
3521 vpxor %xmm4,%xmm2,%xmm2
3522 vmovdqa 128-128(%rax),%xmm4
3524 vpslld $5,%xmm14,%xmm8
3525 vpaddd %xmm15,%xmm13,%xmm13
3526 vpxor %xmm10,%xmm12,%xmm6
3527 vmovdqa %xmm1,80-128(%rax)
3528 vpaddd %xmm1,%xmm13,%xmm13
3529 vpxor 224-128(%rax),%xmm2,%xmm2
3530 vpsrld $27,%xmm14,%xmm9
3531 vpxor %xmm11,%xmm6,%xmm6
3532 vpxor %xmm4,%xmm2,%xmm2
3534 vpslld $30,%xmm10,%xmm7
3535 vpor %xmm9,%xmm8,%xmm8
3536 vpaddd %xmm6,%xmm13,%xmm13
3537 vpsrld $31,%xmm2,%xmm5
3538 vpaddd %xmm2,%xmm2,%xmm2
3540 vpsrld $2,%xmm10,%xmm10
3541 vpaddd %xmm8,%xmm13,%xmm13
3542 vpor %xmm5,%xmm2,%xmm2
3543 vpor %xmm7,%xmm10,%xmm10
3544 vpxor %xmm0,%xmm3,%xmm3
3545 vmovdqa 144-128(%rax),%xmm0
3547 vpslld $5,%xmm13,%xmm8
3548 vpaddd %xmm15,%xmm12,%xmm12
3549 vpxor %xmm14,%xmm11,%xmm6
3550 vmovdqa %xmm2,96-128(%rax)
3551 vpaddd %xmm2,%xmm12,%xmm12
3552 vpxor 240-128(%rax),%xmm3,%xmm3
3553 vpsrld $27,%xmm13,%xmm9
3554 vpxor %xmm10,%xmm6,%xmm6
3555 vpxor %xmm0,%xmm3,%xmm3
3557 vpslld $30,%xmm14,%xmm7
3558 vpor %xmm9,%xmm8,%xmm8
3559 vpaddd %xmm6,%xmm12,%xmm12
3560 vpsrld $31,%xmm3,%xmm5
3561 vpaddd %xmm3,%xmm3,%xmm3
3563 vpsrld $2,%xmm14,%xmm14
3564 vpaddd %xmm8,%xmm12,%xmm12
3565 vpor %xmm5,%xmm3,%xmm3
3566 vpor %xmm7,%xmm14,%xmm14
3567 vpxor %xmm1,%xmm4,%xmm4
3568 vmovdqa 160-128(%rax),%xmm1
3570 vpslld $5,%xmm12,%xmm8
3571 vpaddd %xmm15,%xmm11,%xmm11
3572 vpxor %xmm13,%xmm10,%xmm6
3573 vmovdqa %xmm3,112-128(%rax)
3574 vpaddd %xmm3,%xmm11,%xmm11
3575 vpxor 0-128(%rax),%xmm4,%xmm4
3576 vpsrld $27,%xmm12,%xmm9
3577 vpxor %xmm14,%xmm6,%xmm6
3578 vpxor %xmm1,%xmm4,%xmm4
3580 vpslld $30,%xmm13,%xmm7
3581 vpor %xmm9,%xmm8,%xmm8
3582 vpaddd %xmm6,%xmm11,%xmm11
3583 vpsrld $31,%xmm4,%xmm5
3584 vpaddd %xmm4,%xmm4,%xmm4
3586 vpsrld $2,%xmm13,%xmm13
3587 vpaddd %xmm8,%xmm11,%xmm11
3588 vpor %xmm5,%xmm4,%xmm4
3589 vpor %xmm7,%xmm13,%xmm13
3590 vpxor %xmm2,%xmm0,%xmm0
3591 vmovdqa 176-128(%rax),%xmm2
3593 vpslld $5,%xmm11,%xmm8
3594 vpaddd %xmm15,%xmm10,%xmm10
3595 vpxor %xmm12,%xmm14,%xmm6
3596 vmovdqa %xmm4,128-128(%rax)
3597 vpaddd %xmm4,%xmm10,%xmm10
3598 vpxor 16-128(%rax),%xmm0,%xmm0
3599 vpsrld $27,%xmm11,%xmm9
3600 vpxor %xmm13,%xmm6,%xmm6
3601 vpxor %xmm2,%xmm0,%xmm0
3603 vpslld $30,%xmm12,%xmm7
3604 vpor %xmm9,%xmm8,%xmm8
3605 vpaddd %xmm6,%xmm10,%xmm10
3606 vpsrld $31,%xmm0,%xmm5
3607 vpaddd %xmm0,%xmm0,%xmm0
3609 vpsrld $2,%xmm12,%xmm12
3610 vpaddd %xmm8,%xmm10,%xmm10
3611 vpor %xmm5,%xmm0,%xmm0
3612 vpor %xmm7,%xmm12,%xmm12
3613 vpxor %xmm3,%xmm1,%xmm1
3614 vmovdqa 192-128(%rax),%xmm3
3616 vpslld $5,%xmm10,%xmm8
3617 vpaddd %xmm15,%xmm14,%xmm14
3618 vpxor %xmm11,%xmm13,%xmm6
3619 vmovdqa %xmm0,144-128(%rax)
3620 vpaddd %xmm0,%xmm14,%xmm14
3621 vpxor 32-128(%rax),%xmm1,%xmm1
3622 vpsrld $27,%xmm10,%xmm9
3623 vpxor %xmm12,%xmm6,%xmm6
3624 vpxor %xmm3,%xmm1,%xmm1
3626 vpslld $30,%xmm11,%xmm7
3627 vpor %xmm9,%xmm8,%xmm8
3628 vpaddd %xmm6,%xmm14,%xmm14
3629 vpsrld $31,%xmm1,%xmm5
3630 vpaddd %xmm1,%xmm1,%xmm1
3632 vpsrld $2,%xmm11,%xmm11
3633 vpaddd %xmm8,%xmm14,%xmm14
3634 vpor %xmm5,%xmm1,%xmm1
3635 vpor %xmm7,%xmm11,%xmm11
3636 vpxor %xmm4,%xmm2,%xmm2
3637 vmovdqa 208-128(%rax),%xmm4
3639 vpslld $5,%xmm14,%xmm8
3640 vpaddd %xmm15,%xmm13,%xmm13
3641 vpxor %xmm10,%xmm12,%xmm6
3642 vmovdqa %xmm1,160-128(%rax)
3643 vpaddd %xmm1,%xmm13,%xmm13
3644 vpxor 48-128(%rax),%xmm2,%xmm2
3645 vpsrld $27,%xmm14,%xmm9
3646 vpxor %xmm11,%xmm6,%xmm6
3647 vpxor %xmm4,%xmm2,%xmm2
3649 vpslld $30,%xmm10,%xmm7
3650 vpor %xmm9,%xmm8,%xmm8
3651 vpaddd %xmm6,%xmm13,%xmm13
3652 vpsrld $31,%xmm2,%xmm5
3653 vpaddd %xmm2,%xmm2,%xmm2
3655 vpsrld $2,%xmm10,%xmm10
3656 vpaddd %xmm8,%xmm13,%xmm13
3657 vpor %xmm5,%xmm2,%xmm2
3658 vpor %xmm7,%xmm10,%xmm10
3659 vpxor %xmm0,%xmm3,%xmm3
3660 vmovdqa 224-128(%rax),%xmm0
3662 vpslld $5,%xmm13,%xmm8
3663 vpaddd %xmm15,%xmm12,%xmm12
3664 vpxor %xmm14,%xmm11,%xmm6
3665 vmovdqa %xmm2,176-128(%rax)
3666 vpaddd %xmm2,%xmm12,%xmm12
3667 vpxor 64-128(%rax),%xmm3,%xmm3
3668 vpsrld $27,%xmm13,%xmm9
3669 vpxor %xmm10,%xmm6,%xmm6
3670 vpxor %xmm0,%xmm3,%xmm3
3672 vpslld $30,%xmm14,%xmm7
3673 vpor %xmm9,%xmm8,%xmm8
3674 vpaddd %xmm6,%xmm12,%xmm12
3675 vpsrld $31,%xmm3,%xmm5
3676 vpaddd %xmm3,%xmm3,%xmm3
3678 vpsrld $2,%xmm14,%xmm14
3679 vpaddd %xmm8,%xmm12,%xmm12
3680 vpor %xmm5,%xmm3,%xmm3
3681 vpor %xmm7,%xmm14,%xmm14
3682 vpxor %xmm1,%xmm4,%xmm4
3683 vmovdqa 240-128(%rax),%xmm1
3685 vpslld $5,%xmm12,%xmm8
3686 vpaddd %xmm15,%xmm11,%xmm11
3687 vpxor %xmm13,%xmm10,%xmm6
3688 vmovdqa %xmm3,192-128(%rax)
3689 vpaddd %xmm3,%xmm11,%xmm11
3690 vpxor 80-128(%rax),%xmm4,%xmm4
3691 vpsrld $27,%xmm12,%xmm9
3692 vpxor %xmm14,%xmm6,%xmm6
3693 vpxor %xmm1,%xmm4,%xmm4
3695 vpslld $30,%xmm13,%xmm7
3696 vpor %xmm9,%xmm8,%xmm8
3697 vpaddd %xmm6,%xmm11,%xmm11
3698 vpsrld $31,%xmm4,%xmm5
3699 vpaddd %xmm4,%xmm4,%xmm4
3701 vpsrld $2,%xmm13,%xmm13
3702 vpaddd %xmm8,%xmm11,%xmm11
3703 vpor %xmm5,%xmm4,%xmm4
3704 vpor %xmm7,%xmm13,%xmm13
3705 vpxor %xmm2,%xmm0,%xmm0
3706 vmovdqa 0-128(%rax),%xmm2
3708 vpslld $5,%xmm11,%xmm8
3709 vpaddd %xmm15,%xmm10,%xmm10
3710 vpxor %xmm12,%xmm14,%xmm6
3711 vmovdqa %xmm4,208-128(%rax)
3712 vpaddd %xmm4,%xmm10,%xmm10
3713 vpxor 96-128(%rax),%xmm0,%xmm0
3714 vpsrld $27,%xmm11,%xmm9
3715 vpxor %xmm13,%xmm6,%xmm6
3716 vpxor %xmm2,%xmm0,%xmm0
3718 vpslld $30,%xmm12,%xmm7
3719 vpor %xmm9,%xmm8,%xmm8
3720 vpaddd %xmm6,%xmm10,%xmm10
3721 vpsrld $31,%xmm0,%xmm5
3722 vpaddd %xmm0,%xmm0,%xmm0
3724 vpsrld $2,%xmm12,%xmm12
3725 vpaddd %xmm8,%xmm10,%xmm10
3726 vpor %xmm5,%xmm0,%xmm0
3727 vpor %xmm7,%xmm12,%xmm12
3728 vpxor %xmm3,%xmm1,%xmm1
3729 vmovdqa 16-128(%rax),%xmm3
3731 vpslld $5,%xmm10,%xmm8
3732 vpaddd %xmm15,%xmm14,%xmm14
3733 vpxor %xmm11,%xmm13,%xmm6
3734 vmovdqa %xmm0,224-128(%rax)
3735 vpaddd %xmm0,%xmm14,%xmm14
3736 vpxor 112-128(%rax),%xmm1,%xmm1
3737 vpsrld $27,%xmm10,%xmm9
3738 vpxor %xmm12,%xmm6,%xmm6
3739 vpxor %xmm3,%xmm1,%xmm1
3741 vpslld $30,%xmm11,%xmm7
3742 vpor %xmm9,%xmm8,%xmm8
3743 vpaddd %xmm6,%xmm14,%xmm14
3744 vpsrld $31,%xmm1,%xmm5
3745 vpaddd %xmm1,%xmm1,%xmm1
3747 vpsrld $2,%xmm11,%xmm11
3748 vpaddd %xmm8,%xmm14,%xmm14
3749 vpor %xmm5,%xmm1,%xmm1
3750 vpor %xmm7,%xmm11,%xmm11
3751 vpxor %xmm4,%xmm2,%xmm2
3752 vmovdqa 32-128(%rax),%xmm4
3754 vpslld $5,%xmm14,%xmm8
3755 vpaddd %xmm15,%xmm13,%xmm13
3756 vpxor %xmm10,%xmm12,%xmm6
3757 vmovdqa %xmm1,240-128(%rax)
3758 vpaddd %xmm1,%xmm13,%xmm13
3759 vpxor 128-128(%rax),%xmm2,%xmm2
3760 vpsrld $27,%xmm14,%xmm9
3761 vpxor %xmm11,%xmm6,%xmm6
3762 vpxor %xmm4,%xmm2,%xmm2
3764 vpslld $30,%xmm10,%xmm7
3765 vpor %xmm9,%xmm8,%xmm8
3766 vpaddd %xmm6,%xmm13,%xmm13
3767 vpsrld $31,%xmm2,%xmm5
3768 vpaddd %xmm2,%xmm2,%xmm2
3770 vpsrld $2,%xmm10,%xmm10
3771 vpaddd %xmm8,%xmm13,%xmm13
3772 vpor %xmm5,%xmm2,%xmm2
3773 vpor %xmm7,%xmm10,%xmm10
3774 vpxor %xmm0,%xmm3,%xmm3
3775 vmovdqa 48-128(%rax),%xmm0
3777 vpslld $5,%xmm13,%xmm8
3778 vpaddd %xmm15,%xmm12,%xmm12
3779 vpxor %xmm14,%xmm11,%xmm6
3780 vmovdqa %xmm2,0-128(%rax)
3781 vpaddd %xmm2,%xmm12,%xmm12
3782 vpxor 144-128(%rax),%xmm3,%xmm3
3783 vpsrld $27,%xmm13,%xmm9
3784 vpxor %xmm10,%xmm6,%xmm6
3785 vpxor %xmm0,%xmm3,%xmm3
3787 vpslld $30,%xmm14,%xmm7
3788 vpor %xmm9,%xmm8,%xmm8
3789 vpaddd %xmm6,%xmm12,%xmm12
3790 vpsrld $31,%xmm3,%xmm5
3791 vpaddd %xmm3,%xmm3,%xmm3
3793 vpsrld $2,%xmm14,%xmm14
3794 vpaddd %xmm8,%xmm12,%xmm12
3795 vpor %xmm5,%xmm3,%xmm3
3796 vpor %xmm7,%xmm14,%xmm14
3797 vpxor %xmm1,%xmm4,%xmm4
3798 vmovdqa 64-128(%rax),%xmm1
3800 vpslld $5,%xmm12,%xmm8
3801 vpaddd %xmm15,%xmm11,%xmm11
3802 vpxor %xmm13,%xmm10,%xmm6
3803 vmovdqa %xmm3,16-128(%rax)
3804 vpaddd %xmm3,%xmm11,%xmm11
3805 vpxor 160-128(%rax),%xmm4,%xmm4
3806 vpsrld $27,%xmm12,%xmm9
3807 vpxor %xmm14,%xmm6,%xmm6
3808 vpxor %xmm1,%xmm4,%xmm4
3810 vpslld $30,%xmm13,%xmm7
3811 vpor %xmm9,%xmm8,%xmm8
3812 vpaddd %xmm6,%xmm11,%xmm11
3813 vpsrld $31,%xmm4,%xmm5
3814 vpaddd %xmm4,%xmm4,%xmm4
3816 vpsrld $2,%xmm13,%xmm13
3817 vpaddd %xmm8,%xmm11,%xmm11
3818 vpor %xmm5,%xmm4,%xmm4
3819 vpor %xmm7,%xmm13,%xmm13
3820 vpxor %xmm2,%xmm0,%xmm0
3821 vmovdqa 80-128(%rax),%xmm2
3823 vpslld $5,%xmm11,%xmm8
3824 vpaddd %xmm15,%xmm10,%xmm10
3825 vpxor %xmm12,%xmm14,%xmm6
3826 vmovdqa %xmm4,32-128(%rax)
3827 vpaddd %xmm4,%xmm10,%xmm10
3828 vpxor 176-128(%rax),%xmm0,%xmm0
3829 vpsrld $27,%xmm11,%xmm9
3830 vpxor %xmm13,%xmm6,%xmm6
3831 vpxor %xmm2,%xmm0,%xmm0
3833 vpslld $30,%xmm12,%xmm7
3834 vpor %xmm9,%xmm8,%xmm8
3835 vpaddd %xmm6,%xmm10,%xmm10
3836 vpsrld $31,%xmm0,%xmm5
3837 vpaddd %xmm0,%xmm0,%xmm0
3839 vpsrld $2,%xmm12,%xmm12
3840 vpaddd %xmm8,%xmm10,%xmm10
3841 vpor %xmm5,%xmm0,%xmm0
3842 vpor %xmm7,%xmm12,%xmm12
3843 vpxor %xmm3,%xmm1,%xmm1
3844 vmovdqa 96-128(%rax),%xmm3
3846 vpslld $5,%xmm10,%xmm8
3847 vpaddd %xmm15,%xmm14,%xmm14
3848 vpxor %xmm11,%xmm13,%xmm6
3849 vmovdqa %xmm0,48-128(%rax)
3850 vpaddd %xmm0,%xmm14,%xmm14
3851 vpxor 192-128(%rax),%xmm1,%xmm1
3852 vpsrld $27,%xmm10,%xmm9
3853 vpxor %xmm12,%xmm6,%xmm6
3854 vpxor %xmm3,%xmm1,%xmm1
3856 vpslld $30,%xmm11,%xmm7
3857 vpor %xmm9,%xmm8,%xmm8
3858 vpaddd %xmm6,%xmm14,%xmm14
3859 vpsrld $31,%xmm1,%xmm5
3860 vpaddd %xmm1,%xmm1,%xmm1
3862 vpsrld $2,%xmm11,%xmm11
3863 vpaddd %xmm8,%xmm14,%xmm14
3864 vpor %xmm5,%xmm1,%xmm1
3865 vpor %xmm7,%xmm11,%xmm11
3866 vpxor %xmm4,%xmm2,%xmm2
3867 vmovdqa 112-128(%rax),%xmm4
3869 vpslld $5,%xmm14,%xmm8
3870 vpaddd %xmm15,%xmm13,%xmm13
3871 vpxor %xmm10,%xmm12,%xmm6
3872 vmovdqa %xmm1,64-128(%rax)
3873 vpaddd %xmm1,%xmm13,%xmm13
3874 vpxor 208-128(%rax),%xmm2,%xmm2
3875 vpsrld $27,%xmm14,%xmm9
3876 vpxor %xmm11,%xmm6,%xmm6
3877 vpxor %xmm4,%xmm2,%xmm2
3879 vpslld $30,%xmm10,%xmm7
3880 vpor %xmm9,%xmm8,%xmm8
3881 vpaddd %xmm6,%xmm13,%xmm13
3882 vpsrld $31,%xmm2,%xmm5
3883 vpaddd %xmm2,%xmm2,%xmm2
3885 vpsrld $2,%xmm10,%xmm10
3886 vpaddd %xmm8,%xmm13,%xmm13
3887 vpor %xmm5,%xmm2,%xmm2
3888 vpor %xmm7,%xmm10,%xmm10
3889 vpxor %xmm0,%xmm3,%xmm3
3890 vmovdqa 128-128(%rax),%xmm0
3892 vpslld $5,%xmm13,%xmm8
3893 vpaddd %xmm15,%xmm12,%xmm12
3894 vpxor %xmm14,%xmm11,%xmm6
3895 vmovdqa %xmm2,80-128(%rax)
3896 vpaddd %xmm2,%xmm12,%xmm12
3897 vpxor 224-128(%rax),%xmm3,%xmm3
3898 vpsrld $27,%xmm13,%xmm9
3899 vpxor %xmm10,%xmm6,%xmm6
3900 vpxor %xmm0,%xmm3,%xmm3
3902 vpslld $30,%xmm14,%xmm7
3903 vpor %xmm9,%xmm8,%xmm8
3904 vpaddd %xmm6,%xmm12,%xmm12
3905 vpsrld $31,%xmm3,%xmm5
3906 vpaddd %xmm3,%xmm3,%xmm3
3908 vpsrld $2,%xmm14,%xmm14
3909 vpaddd %xmm8,%xmm12,%xmm12
3910 vpor %xmm5,%xmm3,%xmm3
3911 vpor %xmm7,%xmm14,%xmm14
3912 vpxor %xmm1,%xmm4,%xmm4
3913 vmovdqa 144-128(%rax),%xmm1
3915 vpslld $5,%xmm12,%xmm8
3916 vpaddd %xmm15,%xmm11,%xmm11
3917 vpxor %xmm13,%xmm10,%xmm6
3918 vmovdqa %xmm3,96-128(%rax)
3919 vpaddd %xmm3,%xmm11,%xmm11
3920 vpxor 240-128(%rax),%xmm4,%xmm4
3921 vpsrld $27,%xmm12,%xmm9
3922 vpxor %xmm14,%xmm6,%xmm6
3923 vpxor %xmm1,%xmm4,%xmm4
3925 vpslld $30,%xmm13,%xmm7
3926 vpor %xmm9,%xmm8,%xmm8
3927 vpaddd %xmm6,%xmm11,%xmm11
3928 vpsrld $31,%xmm4,%xmm5
3929 vpaddd %xmm4,%xmm4,%xmm4
3931 vpsrld $2,%xmm13,%xmm13
3932 vpaddd %xmm8,%xmm11,%xmm11
3933 vpor %xmm5,%xmm4,%xmm4
3934 vpor %xmm7,%xmm13,%xmm13
3935 vpxor %xmm2,%xmm0,%xmm0
3936 vmovdqa 160-128(%rax),%xmm2
3938 vpslld $5,%xmm11,%xmm8
3939 vpaddd %xmm15,%xmm10,%xmm10
3940 vpxor %xmm12,%xmm14,%xmm6
3941 vmovdqa %xmm4,112-128(%rax)
3942 vpaddd %xmm4,%xmm10,%xmm10
3943 vpxor 0-128(%rax),%xmm0,%xmm0
3944 vpsrld $27,%xmm11,%xmm9
3945 vpxor %xmm13,%xmm6,%xmm6
3946 vpxor %xmm2,%xmm0,%xmm0
3948 vpslld $30,%xmm12,%xmm7
3949 vpor %xmm9,%xmm8,%xmm8
3950 vpaddd %xmm6,%xmm10,%xmm10
3951 vpsrld $31,%xmm0,%xmm5
3952 vpaddd %xmm0,%xmm0,%xmm0
3954 vpsrld $2,%xmm12,%xmm12
3955 vpaddd %xmm8,%xmm10,%xmm10
3956 vpor %xmm5,%xmm0,%xmm0
3957 vpor %xmm7,%xmm12,%xmm12
3958 vmovdqa 32(%rbp),%xmm15
3959 vpxor %xmm3,%xmm1,%xmm1
3960 vmovdqa 176-128(%rax),%xmm3
3962 vpaddd %xmm15,%xmm14,%xmm14
3963 vpslld $5,%xmm10,%xmm8
3964 vpand %xmm12,%xmm13,%xmm7
3965 vpxor 16-128(%rax),%xmm1,%xmm1
3967 vpaddd %xmm7,%xmm14,%xmm14
3968 vpsrld $27,%xmm10,%xmm9
3969 vpxor %xmm12,%xmm13,%xmm6
3970 vpxor %xmm3,%xmm1,%xmm1
3972 vmovdqu %xmm0,128-128(%rax)
3973 vpaddd %xmm0,%xmm14,%xmm14
3974 vpor %xmm9,%xmm8,%xmm8
3975 vpsrld $31,%xmm1,%xmm5
3976 vpand %xmm11,%xmm6,%xmm6
3977 vpaddd %xmm1,%xmm1,%xmm1
3979 vpslld $30,%xmm11,%xmm7
3980 vpaddd %xmm6,%xmm14,%xmm14
3982 vpsrld $2,%xmm11,%xmm11
3983 vpaddd %xmm8,%xmm14,%xmm14
3984 vpor %xmm5,%xmm1,%xmm1
3985 vpor %xmm7,%xmm11,%xmm11
3986 vpxor %xmm4,%xmm2,%xmm2
3987 vmovdqa 192-128(%rax),%xmm4
3989 vpaddd %xmm15,%xmm13,%xmm13
3990 vpslld $5,%xmm14,%xmm8
3991 vpand %xmm11,%xmm12,%xmm7
3992 vpxor 32-128(%rax),%xmm2,%xmm2
3994 vpaddd %xmm7,%xmm13,%xmm13
3995 vpsrld $27,%xmm14,%xmm9
3996 vpxor %xmm11,%xmm12,%xmm6
3997 vpxor %xmm4,%xmm2,%xmm2
3999 vmovdqu %xmm1,144-128(%rax)
4000 vpaddd %xmm1,%xmm13,%xmm13
4001 vpor %xmm9,%xmm8,%xmm8
4002 vpsrld $31,%xmm2,%xmm5
4003 vpand %xmm10,%xmm6,%xmm6
4004 vpaddd %xmm2,%xmm2,%xmm2
4006 vpslld $30,%xmm10,%xmm7
4007 vpaddd %xmm6,%xmm13,%xmm13
4009 vpsrld $2,%xmm10,%xmm10
4010 vpaddd %xmm8,%xmm13,%xmm13
4011 vpor %xmm5,%xmm2,%xmm2
4012 vpor %xmm7,%xmm10,%xmm10
4013 vpxor %xmm0,%xmm3,%xmm3
4014 vmovdqa 208-128(%rax),%xmm0
4016 vpaddd %xmm15,%xmm12,%xmm12
4017 vpslld $5,%xmm13,%xmm8
4018 vpand %xmm10,%xmm11,%xmm7
4019 vpxor 48-128(%rax),%xmm3,%xmm3
4021 vpaddd %xmm7,%xmm12,%xmm12
4022 vpsrld $27,%xmm13,%xmm9
4023 vpxor %xmm10,%xmm11,%xmm6
4024 vpxor %xmm0,%xmm3,%xmm3
4026 vmovdqu %xmm2,160-128(%rax)
4027 vpaddd %xmm2,%xmm12,%xmm12
4028 vpor %xmm9,%xmm8,%xmm8
4029 vpsrld $31,%xmm3,%xmm5
4030 vpand %xmm14,%xmm6,%xmm6
4031 vpaddd %xmm3,%xmm3,%xmm3
4033 vpslld $30,%xmm14,%xmm7
4034 vpaddd %xmm6,%xmm12,%xmm12
4036 vpsrld $2,%xmm14,%xmm14
4037 vpaddd %xmm8,%xmm12,%xmm12
4038 vpor %xmm5,%xmm3,%xmm3
4039 vpor %xmm7,%xmm14,%xmm14
4040 vpxor %xmm1,%xmm4,%xmm4
4041 vmovdqa 224-128(%rax),%xmm1
4043 vpaddd %xmm15,%xmm11,%xmm11
4044 vpslld $5,%xmm12,%xmm8
4045 vpand %xmm14,%xmm10,%xmm7
4046 vpxor 64-128(%rax),%xmm4,%xmm4
4048 vpaddd %xmm7,%xmm11,%xmm11
4049 vpsrld $27,%xmm12,%xmm9
4050 vpxor %xmm14,%xmm10,%xmm6
4051 vpxor %xmm1,%xmm4,%xmm4
4053 vmovdqu %xmm3,176-128(%rax)
4054 vpaddd %xmm3,%xmm11,%xmm11
4055 vpor %xmm9,%xmm8,%xmm8
4056 vpsrld $31,%xmm4,%xmm5
4057 vpand %xmm13,%xmm6,%xmm6
4058 vpaddd %xmm4,%xmm4,%xmm4
4060 vpslld $30,%xmm13,%xmm7
4061 vpaddd %xmm6,%xmm11,%xmm11
4063 vpsrld $2,%xmm13,%xmm13
4064 vpaddd %xmm8,%xmm11,%xmm11
4065 vpor %xmm5,%xmm4,%xmm4
4066 vpor %xmm7,%xmm13,%xmm13
4067 vpxor %xmm2,%xmm0,%xmm0
4068 vmovdqa 240-128(%rax),%xmm2
4070 vpaddd %xmm15,%xmm10,%xmm10
4071 vpslld $5,%xmm11,%xmm8
4072 vpand %xmm13,%xmm14,%xmm7
4073 vpxor 80-128(%rax),%xmm0,%xmm0
4075 vpaddd %xmm7,%xmm10,%xmm10
4076 vpsrld $27,%xmm11,%xmm9
4077 vpxor %xmm13,%xmm14,%xmm6
4078 vpxor %xmm2,%xmm0,%xmm0
4080 vmovdqu %xmm4,192-128(%rax)
4081 vpaddd %xmm4,%xmm10,%xmm10
4082 vpor %xmm9,%xmm8,%xmm8
4083 vpsrld $31,%xmm0,%xmm5
4084 vpand %xmm12,%xmm6,%xmm6
4085 vpaddd %xmm0,%xmm0,%xmm0
4087 vpslld $30,%xmm12,%xmm7
4088 vpaddd %xmm6,%xmm10,%xmm10
4090 vpsrld $2,%xmm12,%xmm12
4091 vpaddd %xmm8,%xmm10,%xmm10
4092 vpor %xmm5,%xmm0,%xmm0
4093 vpor %xmm7,%xmm12,%xmm12
4094 vpxor %xmm3,%xmm1,%xmm1
4095 vmovdqa 0-128(%rax),%xmm3
4097 vpaddd %xmm15,%xmm14,%xmm14
4098 vpslld $5,%xmm10,%xmm8
4099 vpand %xmm12,%xmm13,%xmm7
4100 vpxor 96-128(%rax),%xmm1,%xmm1
4102 vpaddd %xmm7,%xmm14,%xmm14
4103 vpsrld $27,%xmm10,%xmm9
4104 vpxor %xmm12,%xmm13,%xmm6
4105 vpxor %xmm3,%xmm1,%xmm1
4107 vmovdqu %xmm0,208-128(%rax)
4108 vpaddd %xmm0,%xmm14,%xmm14
4109 vpor %xmm9,%xmm8,%xmm8
4110 vpsrld $31,%xmm1,%xmm5
4111 vpand %xmm11,%xmm6,%xmm6
4112 vpaddd %xmm1,%xmm1,%xmm1
4114 vpslld $30,%xmm11,%xmm7
4115 vpaddd %xmm6,%xmm14,%xmm14
4117 vpsrld $2,%xmm11,%xmm11
4118 vpaddd %xmm8,%xmm14,%xmm14
4119 vpor %xmm5,%xmm1,%xmm1
4120 vpor %xmm7,%xmm11,%xmm11
4121 vpxor %xmm4,%xmm2,%xmm2
4122 vmovdqa 16-128(%rax),%xmm4
4124 vpaddd %xmm15,%xmm13,%xmm13
4125 vpslld $5,%xmm14,%xmm8
4126 vpand %xmm11,%xmm12,%xmm7
4127 vpxor 112-128(%rax),%xmm2,%xmm2
4129 vpaddd %xmm7,%xmm13,%xmm13
4130 vpsrld $27,%xmm14,%xmm9
4131 vpxor %xmm11,%xmm12,%xmm6
4132 vpxor %xmm4,%xmm2,%xmm2
4134 vmovdqu %xmm1,224-128(%rax)
4135 vpaddd %xmm1,%xmm13,%xmm13
4136 vpor %xmm9,%xmm8,%xmm8
4137 vpsrld $31,%xmm2,%xmm5
4138 vpand %xmm10,%xmm6,%xmm6
4139 vpaddd %xmm2,%xmm2,%xmm2
4141 vpslld $30,%xmm10,%xmm7
4142 vpaddd %xmm6,%xmm13,%xmm13
4144 vpsrld $2,%xmm10,%xmm10
4145 vpaddd %xmm8,%xmm13,%xmm13
4146 vpor %xmm5,%xmm2,%xmm2
4147 vpor %xmm7,%xmm10,%xmm10
4148 vpxor %xmm0,%xmm3,%xmm3
4149 vmovdqa 32-128(%rax),%xmm0
4151 vpaddd %xmm15,%xmm12,%xmm12
4152 vpslld $5,%xmm13,%xmm8
4153 vpand %xmm10,%xmm11,%xmm7
4154 vpxor 128-128(%rax),%xmm3,%xmm3
4156 vpaddd %xmm7,%xmm12,%xmm12
4157 vpsrld $27,%xmm13,%xmm9
4158 vpxor %xmm10,%xmm11,%xmm6
4159 vpxor %xmm0,%xmm3,%xmm3
4161 vmovdqu %xmm2,240-128(%rax)
4162 vpaddd %xmm2,%xmm12,%xmm12
4163 vpor %xmm9,%xmm8,%xmm8
4164 vpsrld $31,%xmm3,%xmm5
4165 vpand %xmm14,%xmm6,%xmm6
4166 vpaddd %xmm3,%xmm3,%xmm3
4168 vpslld $30,%xmm14,%xmm7
4169 vpaddd %xmm6,%xmm12,%xmm12
4171 vpsrld $2,%xmm14,%xmm14
4172 vpaddd %xmm8,%xmm12,%xmm12
4173 vpor %xmm5,%xmm3,%xmm3
4174 vpor %xmm7,%xmm14,%xmm14
4175 vpxor %xmm1,%xmm4,%xmm4
4176 vmovdqa 48-128(%rax),%xmm1
4178 vpaddd %xmm15,%xmm11,%xmm11
4179 vpslld $5,%xmm12,%xmm8
4180 vpand %xmm14,%xmm10,%xmm7
4181 vpxor 144-128(%rax),%xmm4,%xmm4
4183 vpaddd %xmm7,%xmm11,%xmm11
4184 vpsrld $27,%xmm12,%xmm9
4185 vpxor %xmm14,%xmm10,%xmm6
4186 vpxor %xmm1,%xmm4,%xmm4
4188 vmovdqu %xmm3,0-128(%rax)
4189 vpaddd %xmm3,%xmm11,%xmm11
4190 vpor %xmm9,%xmm8,%xmm8
4191 vpsrld $31,%xmm4,%xmm5
4192 vpand %xmm13,%xmm6,%xmm6
4193 vpaddd %xmm4,%xmm4,%xmm4
4195 vpslld $30,%xmm13,%xmm7
4196 vpaddd %xmm6,%xmm11,%xmm11
4198 vpsrld $2,%xmm13,%xmm13
4199 vpaddd %xmm8,%xmm11,%xmm11
4200 vpor %xmm5,%xmm4,%xmm4
4201 vpor %xmm7,%xmm13,%xmm13
4202 vpxor %xmm2,%xmm0,%xmm0
4203 vmovdqa 64-128(%rax),%xmm2
4205 vpaddd %xmm15,%xmm10,%xmm10
4206 vpslld $5,%xmm11,%xmm8
4207 vpand %xmm13,%xmm14,%xmm7
4208 vpxor 160-128(%rax),%xmm0,%xmm0
4210 vpaddd %xmm7,%xmm10,%xmm10
4211 vpsrld $27,%xmm11,%xmm9
4212 vpxor %xmm13,%xmm14,%xmm6
4213 vpxor %xmm2,%xmm0,%xmm0
4215 vmovdqu %xmm4,16-128(%rax)
4216 vpaddd %xmm4,%xmm10,%xmm10
4217 vpor %xmm9,%xmm8,%xmm8
4218 vpsrld $31,%xmm0,%xmm5
4219 vpand %xmm12,%xmm6,%xmm6
4220 vpaddd %xmm0,%xmm0,%xmm0
4222 vpslld $30,%xmm12,%xmm7
4223 vpaddd %xmm6,%xmm10,%xmm10
4225 vpsrld $2,%xmm12,%xmm12
4226 vpaddd %xmm8,%xmm10,%xmm10
4227 vpor %xmm5,%xmm0,%xmm0
4228 vpor %xmm7,%xmm12,%xmm12
4229 vpxor %xmm3,%xmm1,%xmm1
4230 vmovdqa 80-128(%rax),%xmm3
4232 vpaddd %xmm15,%xmm14,%xmm14
4233 vpslld $5,%xmm10,%xmm8
4234 vpand %xmm12,%xmm13,%xmm7
4235 vpxor 176-128(%rax),%xmm1,%xmm1
4237 vpaddd %xmm7,%xmm14,%xmm14
4238 vpsrld $27,%xmm10,%xmm9
4239 vpxor %xmm12,%xmm13,%xmm6
4240 vpxor %xmm3,%xmm1,%xmm1
4242 vmovdqu %xmm0,32-128(%rax)
4243 vpaddd %xmm0,%xmm14,%xmm14
4244 vpor %xmm9,%xmm8,%xmm8
4245 vpsrld $31,%xmm1,%xmm5
4246 vpand %xmm11,%xmm6,%xmm6
4247 vpaddd %xmm1,%xmm1,%xmm1
4249 vpslld $30,%xmm11,%xmm7
4250 vpaddd %xmm6,%xmm14,%xmm14
4252 vpsrld $2,%xmm11,%xmm11
4253 vpaddd %xmm8,%xmm14,%xmm14
4254 vpor %xmm5,%xmm1,%xmm1
4255 vpor %xmm7,%xmm11,%xmm11
4256 vpxor %xmm4,%xmm2,%xmm2
4257 vmovdqa 96-128(%rax),%xmm4
4259 vpaddd %xmm15,%xmm13,%xmm13
4260 vpslld $5,%xmm14,%xmm8
4261 vpand %xmm11,%xmm12,%xmm7
4262 vpxor 192-128(%rax),%xmm2,%xmm2
4264 vpaddd %xmm7,%xmm13,%xmm13
4265 vpsrld $27,%xmm14,%xmm9
4266 vpxor %xmm11,%xmm12,%xmm6
4267 vpxor %xmm4,%xmm2,%xmm2
4269 vmovdqu %xmm1,48-128(%rax)
4270 vpaddd %xmm1,%xmm13,%xmm13
4271 vpor %xmm9,%xmm8,%xmm8
4272 vpsrld $31,%xmm2,%xmm5
4273 vpand %xmm10,%xmm6,%xmm6
4274 vpaddd %xmm2,%xmm2,%xmm2
4276 vpslld $30,%xmm10,%xmm7
4277 vpaddd %xmm6,%xmm13,%xmm13
4279 vpsrld $2,%xmm10,%xmm10
4280 vpaddd %xmm8,%xmm13,%xmm13
4281 vpor %xmm5,%xmm2,%xmm2
4282 vpor %xmm7,%xmm10,%xmm10
4283 vpxor %xmm0,%xmm3,%xmm3
4284 vmovdqa 112-128(%rax),%xmm0
4286 vpaddd %xmm15,%xmm12,%xmm12
4287 vpslld $5,%xmm13,%xmm8
4288 vpand %xmm10,%xmm11,%xmm7
4289 vpxor 208-128(%rax),%xmm3,%xmm3
4291 vpaddd %xmm7,%xmm12,%xmm12
4292 vpsrld $27,%xmm13,%xmm9
4293 vpxor %xmm10,%xmm11,%xmm6
4294 vpxor %xmm0,%xmm3,%xmm3
4296 vmovdqu %xmm2,64-128(%rax)
4297 vpaddd %xmm2,%xmm12,%xmm12
4298 vpor %xmm9,%xmm8,%xmm8
4299 vpsrld $31,%xmm3,%xmm5
4300 vpand %xmm14,%xmm6,%xmm6
4301 vpaddd %xmm3,%xmm3,%xmm3
4303 vpslld $30,%xmm14,%xmm7
4304 vpaddd %xmm6,%xmm12,%xmm12
4306 vpsrld $2,%xmm14,%xmm14
4307 vpaddd %xmm8,%xmm12,%xmm12
4308 vpor %xmm5,%xmm3,%xmm3
4309 vpor %xmm7,%xmm14,%xmm14
4310 vpxor %xmm1,%xmm4,%xmm4
4311 vmovdqa 128-128(%rax),%xmm1
4313 vpaddd %xmm15,%xmm11,%xmm11
4314 vpslld $5,%xmm12,%xmm8
4315 vpand %xmm14,%xmm10,%xmm7
4316 vpxor 224-128(%rax),%xmm4,%xmm4
4318 vpaddd %xmm7,%xmm11,%xmm11
4319 vpsrld $27,%xmm12,%xmm9
4320 vpxor %xmm14,%xmm10,%xmm6
4321 vpxor %xmm1,%xmm4,%xmm4
4323 vmovdqu %xmm3,80-128(%rax)
4324 vpaddd %xmm3,%xmm11,%xmm11
4325 vpor %xmm9,%xmm8,%xmm8
4326 vpsrld $31,%xmm4,%xmm5
4327 vpand %xmm13,%xmm6,%xmm6
4328 vpaddd %xmm4,%xmm4,%xmm4
4330 vpslld $30,%xmm13,%xmm7
4331 vpaddd %xmm6,%xmm11,%xmm11
4333 vpsrld $2,%xmm13,%xmm13
4334 vpaddd %xmm8,%xmm11,%xmm11
4335 vpor %xmm5,%xmm4,%xmm4
4336 vpor %xmm7,%xmm13,%xmm13
4337 vpxor %xmm2,%xmm0,%xmm0
4338 vmovdqa 144-128(%rax),%xmm2
4340 vpaddd %xmm15,%xmm10,%xmm10
4341 vpslld $5,%xmm11,%xmm8
4342 vpand %xmm13,%xmm14,%xmm7
4343 vpxor 240-128(%rax),%xmm0,%xmm0
4345 vpaddd %xmm7,%xmm10,%xmm10
4346 vpsrld $27,%xmm11,%xmm9
4347 vpxor %xmm13,%xmm14,%xmm6
4348 vpxor %xmm2,%xmm0,%xmm0
4350 vmovdqu %xmm4,96-128(%rax)
4351 vpaddd %xmm4,%xmm10,%xmm10
4352 vpor %xmm9,%xmm8,%xmm8
4353 vpsrld $31,%xmm0,%xmm5
4354 vpand %xmm12,%xmm6,%xmm6
4355 vpaddd %xmm0,%xmm0,%xmm0
4357 vpslld $30,%xmm12,%xmm7
4358 vpaddd %xmm6,%xmm10,%xmm10
4360 vpsrld $2,%xmm12,%xmm12
4361 vpaddd %xmm8,%xmm10,%xmm10
4362 vpor %xmm5,%xmm0,%xmm0
4363 vpor %xmm7,%xmm12,%xmm12
4364 vpxor %xmm3,%xmm1,%xmm1
4365 vmovdqa 160-128(%rax),%xmm3
4367 vpaddd %xmm15,%xmm14,%xmm14
4368 vpslld $5,%xmm10,%xmm8
4369 vpand %xmm12,%xmm13,%xmm7
4370 vpxor 0-128(%rax),%xmm1,%xmm1
4372 vpaddd %xmm7,%xmm14,%xmm14
4373 vpsrld $27,%xmm10,%xmm9
4374 vpxor %xmm12,%xmm13,%xmm6
4375 vpxor %xmm3,%xmm1,%xmm1
4377 vmovdqu %xmm0,112-128(%rax)
4378 vpaddd %xmm0,%xmm14,%xmm14
4379 vpor %xmm9,%xmm8,%xmm8
4380 vpsrld $31,%xmm1,%xmm5
4381 vpand %xmm11,%xmm6,%xmm6
4382 vpaddd %xmm1,%xmm1,%xmm1
4384 vpslld $30,%xmm11,%xmm7
4385 vpaddd %xmm6,%xmm14,%xmm14
4387 vpsrld $2,%xmm11,%xmm11
4388 vpaddd %xmm8,%xmm14,%xmm14
4389 vpor %xmm5,%xmm1,%xmm1
4390 vpor %xmm7,%xmm11,%xmm11
4391 vpxor %xmm4,%xmm2,%xmm2
4392 vmovdqa 176-128(%rax),%xmm4
4394 vpaddd %xmm15,%xmm13,%xmm13
4395 vpslld $5,%xmm14,%xmm8
4396 vpand %xmm11,%xmm12,%xmm7
4397 vpxor 16-128(%rax),%xmm2,%xmm2
4399 vpaddd %xmm7,%xmm13,%xmm13
4400 vpsrld $27,%xmm14,%xmm9
4401 vpxor %xmm11,%xmm12,%xmm6
4402 vpxor %xmm4,%xmm2,%xmm2
4404 vmovdqu %xmm1,128-128(%rax)
4405 vpaddd %xmm1,%xmm13,%xmm13
4406 vpor %xmm9,%xmm8,%xmm8
4407 vpsrld $31,%xmm2,%xmm5
4408 vpand %xmm10,%xmm6,%xmm6
4409 vpaddd %xmm2,%xmm2,%xmm2
4411 vpslld $30,%xmm10,%xmm7
4412 vpaddd %xmm6,%xmm13,%xmm13
4414 vpsrld $2,%xmm10,%xmm10
4415 vpaddd %xmm8,%xmm13,%xmm13
4416 vpor %xmm5,%xmm2,%xmm2
4417 vpor %xmm7,%xmm10,%xmm10
4418 vpxor %xmm0,%xmm3,%xmm3
4419 vmovdqa 192-128(%rax),%xmm0
4421 vpaddd %xmm15,%xmm12,%xmm12
4422 vpslld $5,%xmm13,%xmm8
4423 vpand %xmm10,%xmm11,%xmm7
4424 vpxor 32-128(%rax),%xmm3,%xmm3
4426 vpaddd %xmm7,%xmm12,%xmm12
4427 vpsrld $27,%xmm13,%xmm9
4428 vpxor %xmm10,%xmm11,%xmm6
4429 vpxor %xmm0,%xmm3,%xmm3
4431 vmovdqu %xmm2,144-128(%rax)
4432 vpaddd %xmm2,%xmm12,%xmm12
4433 vpor %xmm9,%xmm8,%xmm8
4434 vpsrld $31,%xmm3,%xmm5
4435 vpand %xmm14,%xmm6,%xmm6
4436 vpaddd %xmm3,%xmm3,%xmm3
4438 vpslld $30,%xmm14,%xmm7
4439 vpaddd %xmm6,%xmm12,%xmm12
4441 vpsrld $2,%xmm14,%xmm14
4442 vpaddd %xmm8,%xmm12,%xmm12
4443 vpor %xmm5,%xmm3,%xmm3
4444 vpor %xmm7,%xmm14,%xmm14
4445 vpxor %xmm1,%xmm4,%xmm4
4446 vmovdqa 208-128(%rax),%xmm1
4448 vpaddd %xmm15,%xmm11,%xmm11
4449 vpslld $5,%xmm12,%xmm8
4450 vpand %xmm14,%xmm10,%xmm7
4451 vpxor 48-128(%rax),%xmm4,%xmm4
4453 vpaddd %xmm7,%xmm11,%xmm11
4454 vpsrld $27,%xmm12,%xmm9
4455 vpxor %xmm14,%xmm10,%xmm6
4456 vpxor %xmm1,%xmm4,%xmm4
4458 vmovdqu %xmm3,160-128(%rax)
4459 vpaddd %xmm3,%xmm11,%xmm11
4460 vpor %xmm9,%xmm8,%xmm8
4461 vpsrld $31,%xmm4,%xmm5
4462 vpand %xmm13,%xmm6,%xmm6
4463 vpaddd %xmm4,%xmm4,%xmm4
4465 vpslld $30,%xmm13,%xmm7
4466 vpaddd %xmm6,%xmm11,%xmm11
4468 vpsrld $2,%xmm13,%xmm13
4469 vpaddd %xmm8,%xmm11,%xmm11
4470 vpor %xmm5,%xmm4,%xmm4
4471 vpor %xmm7,%xmm13,%xmm13
4472 vpxor %xmm2,%xmm0,%xmm0
4473 vmovdqa 224-128(%rax),%xmm2
4475 vpaddd %xmm15,%xmm10,%xmm10
4476 vpslld $5,%xmm11,%xmm8
4477 vpand %xmm13,%xmm14,%xmm7
4478 vpxor 64-128(%rax),%xmm0,%xmm0
4480 vpaddd %xmm7,%xmm10,%xmm10
4481 vpsrld $27,%xmm11,%xmm9
4482 vpxor %xmm13,%xmm14,%xmm6
4483 vpxor %xmm2,%xmm0,%xmm0
4485 vmovdqu %xmm4,176-128(%rax)
4486 vpaddd %xmm4,%xmm10,%xmm10
4487 vpor %xmm9,%xmm8,%xmm8
4488 vpsrld $31,%xmm0,%xmm5
4489 vpand %xmm12,%xmm6,%xmm6
4490 vpaddd %xmm0,%xmm0,%xmm0
4492 vpslld $30,%xmm12,%xmm7
4493 vpaddd %xmm6,%xmm10,%xmm10
4495 vpsrld $2,%xmm12,%xmm12
4496 vpaddd %xmm8,%xmm10,%xmm10
4497 vpor %xmm5,%xmm0,%xmm0
4498 vpor %xmm7,%xmm12,%xmm12
4499 vmovdqa 64(%rbp),%xmm15
4500 vpxor %xmm3,%xmm1,%xmm1
4501 vmovdqa 240-128(%rax),%xmm3
4503 vpslld $5,%xmm10,%xmm8
4504 vpaddd %xmm15,%xmm14,%xmm14
4505 vpxor %xmm11,%xmm13,%xmm6
4506 vmovdqa %xmm0,192-128(%rax)
4507 vpaddd %xmm0,%xmm14,%xmm14
4508 vpxor 80-128(%rax),%xmm1,%xmm1
4509 vpsrld $27,%xmm10,%xmm9
4510 vpxor %xmm12,%xmm6,%xmm6
4511 vpxor %xmm3,%xmm1,%xmm1
4513 vpslld $30,%xmm11,%xmm7
4514 vpor %xmm9,%xmm8,%xmm8
4515 vpaddd %xmm6,%xmm14,%xmm14
4516 vpsrld $31,%xmm1,%xmm5
4517 vpaddd %xmm1,%xmm1,%xmm1
4519 vpsrld $2,%xmm11,%xmm11
4520 vpaddd %xmm8,%xmm14,%xmm14
4521 vpor %xmm5,%xmm1,%xmm1
4522 vpor %xmm7,%xmm11,%xmm11
4523 vpxor %xmm4,%xmm2,%xmm2
4524 vmovdqa 0-128(%rax),%xmm4
4526 vpslld $5,%xmm14,%xmm8
4527 vpaddd %xmm15,%xmm13,%xmm13
4528 vpxor %xmm10,%xmm12,%xmm6
4529 vmovdqa %xmm1,208-128(%rax)
4530 vpaddd %xmm1,%xmm13,%xmm13
4531 vpxor 96-128(%rax),%xmm2,%xmm2
4532 vpsrld $27,%xmm14,%xmm9
4533 vpxor %xmm11,%xmm6,%xmm6
4534 vpxor %xmm4,%xmm2,%xmm2
4536 vpslld $30,%xmm10,%xmm7
4537 vpor %xmm9,%xmm8,%xmm8
4538 vpaddd %xmm6,%xmm13,%xmm13
4539 vpsrld $31,%xmm2,%xmm5
4540 vpaddd %xmm2,%xmm2,%xmm2
4542 vpsrld $2,%xmm10,%xmm10
4543 vpaddd %xmm8,%xmm13,%xmm13
4544 vpor %xmm5,%xmm2,%xmm2
4545 vpor %xmm7,%xmm10,%xmm10
4546 vpxor %xmm0,%xmm3,%xmm3
4547 vmovdqa 16-128(%rax),%xmm0
4549 vpslld $5,%xmm13,%xmm8
4550 vpaddd %xmm15,%xmm12,%xmm12
4551 vpxor %xmm14,%xmm11,%xmm6
4552 vmovdqa %xmm2,224-128(%rax)
4553 vpaddd %xmm2,%xmm12,%xmm12
4554 vpxor 112-128(%rax),%xmm3,%xmm3
4555 vpsrld $27,%xmm13,%xmm9
4556 vpxor %xmm10,%xmm6,%xmm6
4557 vpxor %xmm0,%xmm3,%xmm3
4559 vpslld $30,%xmm14,%xmm7
4560 vpor %xmm9,%xmm8,%xmm8
4561 vpaddd %xmm6,%xmm12,%xmm12
4562 vpsrld $31,%xmm3,%xmm5
4563 vpaddd %xmm3,%xmm3,%xmm3
4565 vpsrld $2,%xmm14,%xmm14
4566 vpaddd %xmm8,%xmm12,%xmm12
4567 vpor %xmm5,%xmm3,%xmm3
4568 vpor %xmm7,%xmm14,%xmm14
4569 vpxor %xmm1,%xmm4,%xmm4
4570 vmovdqa 32-128(%rax),%xmm1
4572 vpslld $5,%xmm12,%xmm8
4573 vpaddd %xmm15,%xmm11,%xmm11
4574 vpxor %xmm13,%xmm10,%xmm6
4575 vmovdqa %xmm3,240-128(%rax)
4576 vpaddd %xmm3,%xmm11,%xmm11
4577 vpxor 128-128(%rax),%xmm4,%xmm4
4578 vpsrld $27,%xmm12,%xmm9
4579 vpxor %xmm14,%xmm6,%xmm6
4580 vpxor %xmm1,%xmm4,%xmm4
4582 vpslld $30,%xmm13,%xmm7
4583 vpor %xmm9,%xmm8,%xmm8
4584 vpaddd %xmm6,%xmm11,%xmm11
4585 vpsrld $31,%xmm4,%xmm5
4586 vpaddd %xmm4,%xmm4,%xmm4
4588 vpsrld $2,%xmm13,%xmm13
4589 vpaddd %xmm8,%xmm11,%xmm11
4590 vpor %xmm5,%xmm4,%xmm4
4591 vpor %xmm7,%xmm13,%xmm13
4592 vpxor %xmm2,%xmm0,%xmm0
4593 vmovdqa 48-128(%rax),%xmm2
4595 vpslld $5,%xmm11,%xmm8
4596 vpaddd %xmm15,%xmm10,%xmm10
4597 vpxor %xmm12,%xmm14,%xmm6
4598 vmovdqa %xmm4,0-128(%rax)
4599 vpaddd %xmm4,%xmm10,%xmm10
4600 vpxor 144-128(%rax),%xmm0,%xmm0
4601 vpsrld $27,%xmm11,%xmm9
4602 vpxor %xmm13,%xmm6,%xmm6
4603 vpxor %xmm2,%xmm0,%xmm0
4605 vpslld $30,%xmm12,%xmm7
4606 vpor %xmm9,%xmm8,%xmm8
4607 vpaddd %xmm6,%xmm10,%xmm10
4608 vpsrld $31,%xmm0,%xmm5
4609 vpaddd %xmm0,%xmm0,%xmm0
4611 vpsrld $2,%xmm12,%xmm12
4612 vpaddd %xmm8,%xmm10,%xmm10
4613 vpor %xmm5,%xmm0,%xmm0
4614 vpor %xmm7,%xmm12,%xmm12
4615 vpxor %xmm3,%xmm1,%xmm1
4616 vmovdqa 64-128(%rax),%xmm3
4618 vpslld $5,%xmm10,%xmm8
4619 vpaddd %xmm15,%xmm14,%xmm14
4620 vpxor %xmm11,%xmm13,%xmm6
4621 vmovdqa %xmm0,16-128(%rax)
4622 vpaddd %xmm0,%xmm14,%xmm14
4623 vpxor 160-128(%rax),%xmm1,%xmm1
4624 vpsrld $27,%xmm10,%xmm9
4625 vpxor %xmm12,%xmm6,%xmm6
4626 vpxor %xmm3,%xmm1,%xmm1
4628 vpslld $30,%xmm11,%xmm7
4629 vpor %xmm9,%xmm8,%xmm8
4630 vpaddd %xmm6,%xmm14,%xmm14
4631 vpsrld $31,%xmm1,%xmm5
4632 vpaddd %xmm1,%xmm1,%xmm1
4634 vpsrld $2,%xmm11,%xmm11
4635 vpaddd %xmm8,%xmm14,%xmm14
4636 vpor %xmm5,%xmm1,%xmm1
4637 vpor %xmm7,%xmm11,%xmm11
4638 vpxor %xmm4,%xmm2,%xmm2
4639 vmovdqa 80-128(%rax),%xmm4
4641 vpslld $5,%xmm14,%xmm8
4642 vpaddd %xmm15,%xmm13,%xmm13
4643 vpxor %xmm10,%xmm12,%xmm6
4644 vmovdqa %xmm1,32-128(%rax)
4645 vpaddd %xmm1,%xmm13,%xmm13
4646 vpxor 176-128(%rax),%xmm2,%xmm2
4647 vpsrld $27,%xmm14,%xmm9
4648 vpxor %xmm11,%xmm6,%xmm6
4649 vpxor %xmm4,%xmm2,%xmm2
4651 vpslld $30,%xmm10,%xmm7
4652 vpor %xmm9,%xmm8,%xmm8
4653 vpaddd %xmm6,%xmm13,%xmm13
4654 vpsrld $31,%xmm2,%xmm5
4655 vpaddd %xmm2,%xmm2,%xmm2
4657 vpsrld $2,%xmm10,%xmm10
4658 vpaddd %xmm8,%xmm13,%xmm13
4659 vpor %xmm5,%xmm2,%xmm2
4660 vpor %xmm7,%xmm10,%xmm10
4661 vpxor %xmm0,%xmm3,%xmm3
4662 vmovdqa 96-128(%rax),%xmm0
4664 vpslld $5,%xmm13,%xmm8
4665 vpaddd %xmm15,%xmm12,%xmm12
4666 vpxor %xmm14,%xmm11,%xmm6
4667 vmovdqa %xmm2,48-128(%rax)
4668 vpaddd %xmm2,%xmm12,%xmm12
4669 vpxor 192-128(%rax),%xmm3,%xmm3
4670 vpsrld $27,%xmm13,%xmm9
4671 vpxor %xmm10,%xmm6,%xmm6
4672 vpxor %xmm0,%xmm3,%xmm3
4674 vpslld $30,%xmm14,%xmm7
4675 vpor %xmm9,%xmm8,%xmm8
4676 vpaddd %xmm6,%xmm12,%xmm12
4677 vpsrld $31,%xmm3,%xmm5
4678 vpaddd %xmm3,%xmm3,%xmm3
4680 vpsrld $2,%xmm14,%xmm14
4681 vpaddd %xmm8,%xmm12,%xmm12
4682 vpor %xmm5,%xmm3,%xmm3
4683 vpor %xmm7,%xmm14,%xmm14
4684 vpxor %xmm1,%xmm4,%xmm4
4685 vmovdqa 112-128(%rax),%xmm1
4687 vpslld $5,%xmm12,%xmm8
4688 vpaddd %xmm15,%xmm11,%xmm11
4689 vpxor %xmm13,%xmm10,%xmm6
4690 vmovdqa %xmm3,64-128(%rax)
4691 vpaddd %xmm3,%xmm11,%xmm11
4692 vpxor 208-128(%rax),%xmm4,%xmm4
4693 vpsrld $27,%xmm12,%xmm9
4694 vpxor %xmm14,%xmm6,%xmm6
4695 vpxor %xmm1,%xmm4,%xmm4
4697 vpslld $30,%xmm13,%xmm7
4698 vpor %xmm9,%xmm8,%xmm8
4699 vpaddd %xmm6,%xmm11,%xmm11
4700 vpsrld $31,%xmm4,%xmm5
4701 vpaddd %xmm4,%xmm4,%xmm4
4703 vpsrld $2,%xmm13,%xmm13
4704 vpaddd %xmm8,%xmm11,%xmm11
4705 vpor %xmm5,%xmm4,%xmm4
4706 vpor %xmm7,%xmm13,%xmm13
4707 vpxor %xmm2,%xmm0,%xmm0
4708 vmovdqa 128-128(%rax),%xmm2
4710 vpslld $5,%xmm11,%xmm8
4711 vpaddd %xmm15,%xmm10,%xmm10
4712 vpxor %xmm12,%xmm14,%xmm6
4713 vmovdqa %xmm4,80-128(%rax)
4714 vpaddd %xmm4,%xmm10,%xmm10
4715 vpxor 224-128(%rax),%xmm0,%xmm0
4716 vpsrld $27,%xmm11,%xmm9
4717 vpxor %xmm13,%xmm6,%xmm6
4718 vpxor %xmm2,%xmm0,%xmm0
4720 vpslld $30,%xmm12,%xmm7
4721 vpor %xmm9,%xmm8,%xmm8
4722 vpaddd %xmm6,%xmm10,%xmm10
4723 vpsrld $31,%xmm0,%xmm5
4724 vpaddd %xmm0,%xmm0,%xmm0
4726 vpsrld $2,%xmm12,%xmm12
4727 vpaddd %xmm8,%xmm10,%xmm10
4728 vpor %xmm5,%xmm0,%xmm0
4729 vpor %xmm7,%xmm12,%xmm12
4730 vpxor %xmm3,%xmm1,%xmm1
4731 vmovdqa 144-128(%rax),%xmm3
4733 vpslld $5,%xmm10,%xmm8
4734 vpaddd %xmm15,%xmm14,%xmm14
4735 vpxor %xmm11,%xmm13,%xmm6
4736 vmovdqa %xmm0,96-128(%rax)
4737 vpaddd %xmm0,%xmm14,%xmm14
4738 vpxor 240-128(%rax),%xmm1,%xmm1
4739 vpsrld $27,%xmm10,%xmm9
4740 vpxor %xmm12,%xmm6,%xmm6
4741 vpxor %xmm3,%xmm1,%xmm1
4743 vpslld $30,%xmm11,%xmm7
4744 vpor %xmm9,%xmm8,%xmm8
4745 vpaddd %xmm6,%xmm14,%xmm14
4746 vpsrld $31,%xmm1,%xmm5
4747 vpaddd %xmm1,%xmm1,%xmm1
4749 vpsrld $2,%xmm11,%xmm11
4750 vpaddd %xmm8,%xmm14,%xmm14
4751 vpor %xmm5,%xmm1,%xmm1
4752 vpor %xmm7,%xmm11,%xmm11
4753 vpxor %xmm4,%xmm2,%xmm2
4754 vmovdqa 160-128(%rax),%xmm4
4756 vpslld $5,%xmm14,%xmm8
4757 vpaddd %xmm15,%xmm13,%xmm13
4758 vpxor %xmm10,%xmm12,%xmm6
4759 vmovdqa %xmm1,112-128(%rax)
4760 vpaddd %xmm1,%xmm13,%xmm13
4761 vpxor 0-128(%rax),%xmm2,%xmm2
4762 vpsrld $27,%xmm14,%xmm9
4763 vpxor %xmm11,%xmm6,%xmm6
4764 vpxor %xmm4,%xmm2,%xmm2
4766 vpslld $30,%xmm10,%xmm7
4767 vpor %xmm9,%xmm8,%xmm8
4768 vpaddd %xmm6,%xmm13,%xmm13
4769 vpsrld $31,%xmm2,%xmm5
4770 vpaddd %xmm2,%xmm2,%xmm2
4772 vpsrld $2,%xmm10,%xmm10
4773 vpaddd %xmm8,%xmm13,%xmm13
4774 vpor %xmm5,%xmm2,%xmm2
4775 vpor %xmm7,%xmm10,%xmm10
4776 vpxor %xmm0,%xmm3,%xmm3
4777 vmovdqa 176-128(%rax),%xmm0
4779 vpslld $5,%xmm13,%xmm8
4780 vpaddd %xmm15,%xmm12,%xmm12
4781 vpxor %xmm14,%xmm11,%xmm6
4782 vpaddd %xmm2,%xmm12,%xmm12
4783 vpxor 16-128(%rax),%xmm3,%xmm3
4784 vpsrld $27,%xmm13,%xmm9
4785 vpxor %xmm10,%xmm6,%xmm6
4786 vpxor %xmm0,%xmm3,%xmm3
4788 vpslld $30,%xmm14,%xmm7
4789 vpor %xmm9,%xmm8,%xmm8
4790 vpaddd %xmm6,%xmm12,%xmm12
4791 vpsrld $31,%xmm3,%xmm5
4792 vpaddd %xmm3,%xmm3,%xmm3
4794 vpsrld $2,%xmm14,%xmm14
4795 vpaddd %xmm8,%xmm12,%xmm12
4796 vpor %xmm5,%xmm3,%xmm3
4797 vpor %xmm7,%xmm14,%xmm14
4798 vpxor %xmm1,%xmm4,%xmm4
4799 vmovdqa 192-128(%rax),%xmm1
4801 vpslld $5,%xmm12,%xmm8
4802 vpaddd %xmm15,%xmm11,%xmm11
4803 vpxor %xmm13,%xmm10,%xmm6
4804 vpaddd %xmm3,%xmm11,%xmm11
4805 vpxor 32-128(%rax),%xmm4,%xmm4
4806 vpsrld $27,%xmm12,%xmm9
4807 vpxor %xmm14,%xmm6,%xmm6
4808 vpxor %xmm1,%xmm4,%xmm4
4810 vpslld $30,%xmm13,%xmm7
4811 vpor %xmm9,%xmm8,%xmm8
4812 vpaddd %xmm6,%xmm11,%xmm11
4813 vpsrld $31,%xmm4,%xmm5
4814 vpaddd %xmm4,%xmm4,%xmm4
4816 vpsrld $2,%xmm13,%xmm13
4817 vpaddd %xmm8,%xmm11,%xmm11
4818 vpor %xmm5,%xmm4,%xmm4
4819 vpor %xmm7,%xmm13,%xmm13
4820 vpxor %xmm2,%xmm0,%xmm0
4821 vmovdqa 208-128(%rax),%xmm2
4823 vpslld $5,%xmm11,%xmm8
4824 vpaddd %xmm15,%xmm10,%xmm10
4825 vpxor %xmm12,%xmm14,%xmm6
4826 vpaddd %xmm4,%xmm10,%xmm10
4827 vpxor 48-128(%rax),%xmm0,%xmm0
4828 vpsrld $27,%xmm11,%xmm9
4829 vpxor %xmm13,%xmm6,%xmm6
4830 vpxor %xmm2,%xmm0,%xmm0
4832 vpslld $30,%xmm12,%xmm7
4833 vpor %xmm9,%xmm8,%xmm8
4834 vpaddd %xmm6,%xmm10,%xmm10
4835 vpsrld $31,%xmm0,%xmm5
4836 vpaddd %xmm0,%xmm0,%xmm0
4838 vpsrld $2,%xmm12,%xmm12
4839 vpaddd %xmm8,%xmm10,%xmm10
4840 vpor %xmm5,%xmm0,%xmm0
4841 vpor %xmm7,%xmm12,%xmm12
4842 vpxor %xmm3,%xmm1,%xmm1
4843 vmovdqa 224-128(%rax),%xmm3
4845 vpslld $5,%xmm10,%xmm8
4846 vpaddd %xmm15,%xmm14,%xmm14
4847 vpxor %xmm11,%xmm13,%xmm6
4848 vpaddd %xmm0,%xmm14,%xmm14
4849 vpxor 64-128(%rax),%xmm1,%xmm1
4850 vpsrld $27,%xmm10,%xmm9
4851 vpxor %xmm12,%xmm6,%xmm6
4852 vpxor %xmm3,%xmm1,%xmm1
4854 vpslld $30,%xmm11,%xmm7
4855 vpor %xmm9,%xmm8,%xmm8
4856 vpaddd %xmm6,%xmm14,%xmm14
4857 vpsrld $31,%xmm1,%xmm5
4858 vpaddd %xmm1,%xmm1,%xmm1
4860 vpsrld $2,%xmm11,%xmm11
4861 vpaddd %xmm8,%xmm14,%xmm14
4862 vpor %xmm5,%xmm1,%xmm1
4863 vpor %xmm7,%xmm11,%xmm11
4864 vpxor %xmm4,%xmm2,%xmm2
4865 vmovdqa 240-128(%rax),%xmm4
4867 vpslld $5,%xmm14,%xmm8
4868 vpaddd %xmm15,%xmm13,%xmm13
4869 vpxor %xmm10,%xmm12,%xmm6
4870 vpaddd %xmm1,%xmm13,%xmm13
4871 vpxor 80-128(%rax),%xmm2,%xmm2
4872 vpsrld $27,%xmm14,%xmm9
4873 vpxor %xmm11,%xmm6,%xmm6
4874 vpxor %xmm4,%xmm2,%xmm2
4876 vpslld $30,%xmm10,%xmm7
4877 vpor %xmm9,%xmm8,%xmm8
4878 vpaddd %xmm6,%xmm13,%xmm13
4879 vpsrld $31,%xmm2,%xmm5
4880 vpaddd %xmm2,%xmm2,%xmm2
4882 vpsrld $2,%xmm10,%xmm10
4883 vpaddd %xmm8,%xmm13,%xmm13
4884 vpor %xmm5,%xmm2,%xmm2
4885 vpor %xmm7,%xmm10,%xmm10
4886 vpxor %xmm0,%xmm3,%xmm3
4887 vmovdqa 0-128(%rax),%xmm0
4889 vpslld $5,%xmm13,%xmm8
4890 vpaddd %xmm15,%xmm12,%xmm12
4891 vpxor %xmm14,%xmm11,%xmm6
4892 vpaddd %xmm2,%xmm12,%xmm12
4893 vpxor 96-128(%rax),%xmm3,%xmm3
4894 vpsrld $27,%xmm13,%xmm9
4895 vpxor %xmm10,%xmm6,%xmm6
4896 vpxor %xmm0,%xmm3,%xmm3
4898 vpslld $30,%xmm14,%xmm7
4899 vpor %xmm9,%xmm8,%xmm8
4900 vpaddd %xmm6,%xmm12,%xmm12
4901 vpsrld $31,%xmm3,%xmm5
4902 vpaddd %xmm3,%xmm3,%xmm3
4904 vpsrld $2,%xmm14,%xmm14
4905 vpaddd %xmm8,%xmm12,%xmm12
4906 vpor %xmm5,%xmm3,%xmm3
4907 vpor %xmm7,%xmm14,%xmm14
4908 vpxor %xmm1,%xmm4,%xmm4
4909 vmovdqa 16-128(%rax),%xmm1
4911 vpslld $5,%xmm12,%xmm8
4912 vpaddd %xmm15,%xmm11,%xmm11
4913 vpxor %xmm13,%xmm10,%xmm6
4914 vpaddd %xmm3,%xmm11,%xmm11
4915 vpxor 112-128(%rax),%xmm4,%xmm4
4916 vpsrld $27,%xmm12,%xmm9
4917 vpxor %xmm14,%xmm6,%xmm6
4918 vpxor %xmm1,%xmm4,%xmm4
4920 vpslld $30,%xmm13,%xmm7
4921 vpor %xmm9,%xmm8,%xmm8
4922 vpaddd %xmm6,%xmm11,%xmm11
4923 vpsrld $31,%xmm4,%xmm5
4924 vpaddd %xmm4,%xmm4,%xmm4
4926 vpsrld $2,%xmm13,%xmm13
4927 vpaddd %xmm8,%xmm11,%xmm11
4928 vpor %xmm5,%xmm4,%xmm4
4929 vpor %xmm7,%xmm13,%xmm13
4930 vpslld $5,%xmm11,%xmm8
4931 vpaddd %xmm15,%xmm10,%xmm10
4932 vpxor %xmm12,%xmm14,%xmm6
4934 vpsrld $27,%xmm11,%xmm9
4935 vpaddd %xmm4,%xmm10,%xmm10
4936 vpxor %xmm13,%xmm6,%xmm6
4938 vpslld $30,%xmm12,%xmm7
4939 vpor %xmm9,%xmm8,%xmm8
4940 vpaddd %xmm6,%xmm10,%xmm10
4942 vpsrld $2,%xmm12,%xmm12
4943 vpaddd %xmm8,%xmm10,%xmm10
4944 vpor %xmm7,%xmm12,%xmm12
4945 movl $1,%ecx
4946 cmpl 0(%rbx),%ecx
4947 cmovgeq %rbp,%r8
4948 cmpl 4(%rbx),%ecx
4949 cmovgeq %rbp,%r9
4950 cmpl 8(%rbx),%ecx
4951 cmovgeq %rbp,%r10
4952 cmpl 12(%rbx),%ecx
4953 cmovgeq %rbp,%r11
4954 vmovdqu (%rbx),%xmm6
4955 vpxor %xmm8,%xmm8,%xmm8
4956 vmovdqa %xmm6,%xmm7
4957 vpcmpgtd %xmm8,%xmm7,%xmm7
4958 vpaddd %xmm7,%xmm6,%xmm6
4960 vpand %xmm7,%xmm10,%xmm10
4961 vpand %xmm7,%xmm11,%xmm11
4962 vpaddd 0(%rdi),%xmm10,%xmm10
4963 vpand %xmm7,%xmm12,%xmm12
4964 vpaddd 32(%rdi),%xmm11,%xmm11
4965 vpand %xmm7,%xmm13,%xmm13
4966 vpaddd 64(%rdi),%xmm12,%xmm12
4967 vpand %xmm7,%xmm14,%xmm14
4968 vpaddd 96(%rdi),%xmm13,%xmm13
4969 vpaddd 128(%rdi),%xmm14,%xmm14
4970 vmovdqu %xmm10,0(%rdi)
4971 vmovdqu %xmm11,32(%rdi)
4972 vmovdqu %xmm12,64(%rdi)
4973 vmovdqu %xmm13,96(%rdi)
4974 vmovdqu %xmm14,128(%rdi)
4976 vmovdqu %xmm6,(%rbx)
4977 vmovdqu 96(%rbp),%xmm5
4978 decl %edx
4979 jnz .Loop_avx
4981 movl 280(%rsp),%edx
4982 leaq 16(%rdi),%rdi
4983 leaq 64(%rsi),%rsi
4984 decl %edx
4985 jnz .Loop_grande_avx
4987 .Ldone_avx:
4988 movq 272(%rsp),%rax
4989 vzeroupper
4990 movq -16(%rax),%rbp
4991 movq -8(%rax),%rbx
4992 leaq (%rax),%rsp
4993 .Lepilogue_avx:
4994 .byte 0xf3,0xc3
4995 .size sha1_multi_block_avx,.-sha1_multi_block_avx
4996 .type sha1_multi_block_avx2,@function
4997 .align 32
4998 sha1_multi_block_avx2:
4999 _avx2_shortcut:
5000 movq %rsp,%rax
5001 pushq %rbx
5002 pushq %rbp
5003 pushq %r12
5004 pushq %r13
5005 pushq %r14
5006 pushq %r15
5007 subq $576,%rsp
5008 andq $-256,%rsp
5009 movq %rax,544(%rsp)
5010 .Lbody_avx2:
5011 leaq K_XX_XX(%rip),%rbp
5012 shrl $1,%edx
5014 vzeroupper
5015 .Loop_grande_avx2:
5016 movl %edx,552(%rsp)
5017 xorl %edx,%edx
5018 leaq 512(%rsp),%rbx
5019 movq 0(%rsi),%r12
5020 movl 8(%rsi),%ecx
5021 cmpl %edx,%ecx
5022 cmovgl %ecx,%edx
5023 testl %ecx,%ecx
5024 movl %ecx,0(%rbx)
5025 cmovleq %rbp,%r12
5026 movq 16(%rsi),%r13
5027 movl 24(%rsi),%ecx
5028 cmpl %edx,%ecx
5029 cmovgl %ecx,%edx
5030 testl %ecx,%ecx
5031 movl %ecx,4(%rbx)
5032 cmovleq %rbp,%r13
5033 movq 32(%rsi),%r14
5034 movl 40(%rsi),%ecx
5035 cmpl %edx,%ecx
5036 cmovgl %ecx,%edx
5037 testl %ecx,%ecx
5038 movl %ecx,8(%rbx)
5039 cmovleq %rbp,%r14
5040 movq 48(%rsi),%r15
5041 movl 56(%rsi),%ecx
5042 cmpl %edx,%ecx
5043 cmovgl %ecx,%edx
5044 testl %ecx,%ecx
5045 movl %ecx,12(%rbx)
5046 cmovleq %rbp,%r15
5047 movq 64(%rsi),%r8
5048 movl 72(%rsi),%ecx
5049 cmpl %edx,%ecx
5050 cmovgl %ecx,%edx
5051 testl %ecx,%ecx
5052 movl %ecx,16(%rbx)
5053 cmovleq %rbp,%r8
5054 movq 80(%rsi),%r9
5055 movl 88(%rsi),%ecx
5056 cmpl %edx,%ecx
5057 cmovgl %ecx,%edx
5058 testl %ecx,%ecx
5059 movl %ecx,20(%rbx)
5060 cmovleq %rbp,%r9
5061 movq 96(%rsi),%r10
5062 movl 104(%rsi),%ecx
5063 cmpl %edx,%ecx
5064 cmovgl %ecx,%edx
5065 testl %ecx,%ecx
5066 movl %ecx,24(%rbx)
5067 cmovleq %rbp,%r10
5068 movq 112(%rsi),%r11
5069 movl 120(%rsi),%ecx
5070 cmpl %edx,%ecx
5071 cmovgl %ecx,%edx
5072 testl %ecx,%ecx
5073 movl %ecx,28(%rbx)
5074 cmovleq %rbp,%r11
5075 vmovdqu 0(%rdi),%ymm0
5076 leaq 128(%rsp),%rax
5077 vmovdqu 32(%rdi),%ymm1
5078 leaq 256+128(%rsp),%rbx
5079 vmovdqu 64(%rdi),%ymm2
5080 vmovdqu 96(%rdi),%ymm3
5081 vmovdqu 128(%rdi),%ymm4
5082 vmovdqu 96(%rbp),%ymm9
5083 jmp .Loop_avx2
5085 .align 32
5086 .Loop_avx2:
5087 vmovdqa -32(%rbp),%ymm15
5088 vmovd (%r12),%xmm10
5089 leaq 64(%r12),%r12
5090 vmovd (%r8),%xmm12
5091 leaq 64(%r8),%r8
5092 vmovd (%r13),%xmm7
5093 leaq 64(%r13),%r13
5094 vmovd (%r9),%xmm6
5095 leaq 64(%r9),%r9
5096 vpinsrd $1,(%r14),%xmm10,%xmm10
5097 leaq 64(%r14),%r14
5098 vpinsrd $1,(%r10),%xmm12,%xmm12
5099 leaq 64(%r10),%r10
5100 vpinsrd $1,(%r15),%xmm7,%xmm7
5101 leaq 64(%r15),%r15
5102 vpunpckldq %ymm7,%ymm10,%ymm10
5103 vpinsrd $1,(%r11),%xmm6,%xmm6
5104 leaq 64(%r11),%r11
5105 vpunpckldq %ymm6,%ymm12,%ymm12
5106 vmovd -60(%r12),%xmm11
5107 vinserti128 $1,%xmm12,%ymm10,%ymm10
5108 vmovd -60(%r8),%xmm8
5109 vpshufb %ymm9,%ymm10,%ymm10
5110 vmovd -60(%r13),%xmm7
5111 vmovd -60(%r9),%xmm6
5112 vpinsrd $1,-60(%r14),%xmm11,%xmm11
5113 vpinsrd $1,-60(%r10),%xmm8,%xmm8
5114 vpinsrd $1,-60(%r15),%xmm7,%xmm7
5115 vpunpckldq %ymm7,%ymm11,%ymm11
5116 vpinsrd $1,-60(%r11),%xmm6,%xmm6
5117 vpunpckldq %ymm6,%ymm8,%ymm8
5118 vpaddd %ymm15,%ymm4,%ymm4
5119 vpslld $5,%ymm0,%ymm7
5120 vpandn %ymm3,%ymm1,%ymm6
5121 vpand %ymm2,%ymm1,%ymm5
5123 vmovdqa %ymm10,0-128(%rax)
5124 vpaddd %ymm10,%ymm4,%ymm4
5125 vinserti128 $1,%xmm8,%ymm11,%ymm11
5126 vpsrld $27,%ymm0,%ymm8
5127 vpxor %ymm6,%ymm5,%ymm5
5128 vmovd -56(%r12),%xmm12
5130 vpslld $30,%ymm1,%ymm6
5131 vpor %ymm8,%ymm7,%ymm7
5132 vmovd -56(%r8),%xmm8
5133 vpaddd %ymm5,%ymm4,%ymm4
5135 vpsrld $2,%ymm1,%ymm1
5136 vpaddd %ymm7,%ymm4,%ymm4
5137 vpshufb %ymm9,%ymm11,%ymm11
5138 vpor %ymm6,%ymm1,%ymm1
5139 vmovd -56(%r13),%xmm7
5140 vmovd -56(%r9),%xmm6
5141 vpinsrd $1,-56(%r14),%xmm12,%xmm12
5142 vpinsrd $1,-56(%r10),%xmm8,%xmm8
5143 vpinsrd $1,-56(%r15),%xmm7,%xmm7
5144 vpunpckldq %ymm7,%ymm12,%ymm12
5145 vpinsrd $1,-56(%r11),%xmm6,%xmm6
5146 vpunpckldq %ymm6,%ymm8,%ymm8
5147 vpaddd %ymm15,%ymm3,%ymm3
5148 vpslld $5,%ymm4,%ymm7
5149 vpandn %ymm2,%ymm0,%ymm6
5150 vpand %ymm1,%ymm0,%ymm5
5152 vmovdqa %ymm11,32-128(%rax)
5153 vpaddd %ymm11,%ymm3,%ymm3
5154 vinserti128 $1,%xmm8,%ymm12,%ymm12
5155 vpsrld $27,%ymm4,%ymm8
5156 vpxor %ymm6,%ymm5,%ymm5
5157 vmovd -52(%r12),%xmm13
5159 vpslld $30,%ymm0,%ymm6
5160 vpor %ymm8,%ymm7,%ymm7
5161 vmovd -52(%r8),%xmm8
5162 vpaddd %ymm5,%ymm3,%ymm3
5164 vpsrld $2,%ymm0,%ymm0
5165 vpaddd %ymm7,%ymm3,%ymm3
5166 vpshufb %ymm9,%ymm12,%ymm12
5167 vpor %ymm6,%ymm0,%ymm0
5168 vmovd -52(%r13),%xmm7
5169 vmovd -52(%r9),%xmm6
5170 vpinsrd $1,-52(%r14),%xmm13,%xmm13
5171 vpinsrd $1,-52(%r10),%xmm8,%xmm8
5172 vpinsrd $1,-52(%r15),%xmm7,%xmm7
5173 vpunpckldq %ymm7,%ymm13,%ymm13
5174 vpinsrd $1,-52(%r11),%xmm6,%xmm6
5175 vpunpckldq %ymm6,%ymm8,%ymm8
5176 vpaddd %ymm15,%ymm2,%ymm2
5177 vpslld $5,%ymm3,%ymm7
5178 vpandn %ymm1,%ymm4,%ymm6
5179 vpand %ymm0,%ymm4,%ymm5
5181 vmovdqa %ymm12,64-128(%rax)
5182 vpaddd %ymm12,%ymm2,%ymm2
5183 vinserti128 $1,%xmm8,%ymm13,%ymm13
5184 vpsrld $27,%ymm3,%ymm8
5185 vpxor %ymm6,%ymm5,%ymm5
5186 vmovd -48(%r12),%xmm14
5188 vpslld $30,%ymm4,%ymm6
5189 vpor %ymm8,%ymm7,%ymm7
5190 vmovd -48(%r8),%xmm8
5191 vpaddd %ymm5,%ymm2,%ymm2
5193 vpsrld $2,%ymm4,%ymm4
5194 vpaddd %ymm7,%ymm2,%ymm2
5195 vpshufb %ymm9,%ymm13,%ymm13
5196 vpor %ymm6,%ymm4,%ymm4
5197 vmovd -48(%r13),%xmm7
5198 vmovd -48(%r9),%xmm6
5199 vpinsrd $1,-48(%r14),%xmm14,%xmm14
5200 vpinsrd $1,-48(%r10),%xmm8,%xmm8
5201 vpinsrd $1,-48(%r15),%xmm7,%xmm7
5202 vpunpckldq %ymm7,%ymm14,%ymm14
5203 vpinsrd $1,-48(%r11),%xmm6,%xmm6
5204 vpunpckldq %ymm6,%ymm8,%ymm8
5205 vpaddd %ymm15,%ymm1,%ymm1
5206 vpslld $5,%ymm2,%ymm7
5207 vpandn %ymm0,%ymm3,%ymm6
5208 vpand %ymm4,%ymm3,%ymm5
5210 vmovdqa %ymm13,96-128(%rax)
5211 vpaddd %ymm13,%ymm1,%ymm1
5212 vinserti128 $1,%xmm8,%ymm14,%ymm14
5213 vpsrld $27,%ymm2,%ymm8
5214 vpxor %ymm6,%ymm5,%ymm5
5215 vmovd -44(%r12),%xmm10
5217 vpslld $30,%ymm3,%ymm6
5218 vpor %ymm8,%ymm7,%ymm7
5219 vmovd -44(%r8),%xmm8
5220 vpaddd %ymm5,%ymm1,%ymm1
5222 vpsrld $2,%ymm3,%ymm3
5223 vpaddd %ymm7,%ymm1,%ymm1
5224 vpshufb %ymm9,%ymm14,%ymm14
5225 vpor %ymm6,%ymm3,%ymm3
5226 vmovd -44(%r13),%xmm7
5227 vmovd -44(%r9),%xmm6
5228 vpinsrd $1,-44(%r14),%xmm10,%xmm10
5229 vpinsrd $1,-44(%r10),%xmm8,%xmm8
5230 vpinsrd $1,-44(%r15),%xmm7,%xmm7
5231 vpunpckldq %ymm7,%ymm10,%ymm10
5232 vpinsrd $1,-44(%r11),%xmm6,%xmm6
5233 vpunpckldq %ymm6,%ymm8,%ymm8
5234 vpaddd %ymm15,%ymm0,%ymm0
5235 vpslld $5,%ymm1,%ymm7
5236 vpandn %ymm4,%ymm2,%ymm6
5237 vpand %ymm3,%ymm2,%ymm5
5239 vmovdqa %ymm14,128-128(%rax)
5240 vpaddd %ymm14,%ymm0,%ymm0
5241 vinserti128 $1,%xmm8,%ymm10,%ymm10
5242 vpsrld $27,%ymm1,%ymm8
5243 vpxor %ymm6,%ymm5,%ymm5
5244 vmovd -40(%r12),%xmm11
5246 vpslld $30,%ymm2,%ymm6
5247 vpor %ymm8,%ymm7,%ymm7
5248 vmovd -40(%r8),%xmm8
5249 vpaddd %ymm5,%ymm0,%ymm0
5251 vpsrld $2,%ymm2,%ymm2
5252 vpaddd %ymm7,%ymm0,%ymm0
5253 vpshufb %ymm9,%ymm10,%ymm10
5254 vpor %ymm6,%ymm2,%ymm2
5255 vmovd -40(%r13),%xmm7
5256 vmovd -40(%r9),%xmm6
5257 vpinsrd $1,-40(%r14),%xmm11,%xmm11
5258 vpinsrd $1,-40(%r10),%xmm8,%xmm8
5259 vpinsrd $1,-40(%r15),%xmm7,%xmm7
5260 vpunpckldq %ymm7,%ymm11,%ymm11
5261 vpinsrd $1,-40(%r11),%xmm6,%xmm6
5262 vpunpckldq %ymm6,%ymm8,%ymm8
5263 vpaddd %ymm15,%ymm4,%ymm4
5264 vpslld $5,%ymm0,%ymm7
5265 vpandn %ymm3,%ymm1,%ymm6
5266 vpand %ymm2,%ymm1,%ymm5
5268 vmovdqa %ymm10,160-128(%rax)
5269 vpaddd %ymm10,%ymm4,%ymm4
5270 vinserti128 $1,%xmm8,%ymm11,%ymm11
5271 vpsrld $27,%ymm0,%ymm8
5272 vpxor %ymm6,%ymm5,%ymm5
5273 vmovd -36(%r12),%xmm12
5275 vpslld $30,%ymm1,%ymm6
5276 vpor %ymm8,%ymm7,%ymm7
5277 vmovd -36(%r8),%xmm8
5278 vpaddd %ymm5,%ymm4,%ymm4
5280 vpsrld $2,%ymm1,%ymm1
5281 vpaddd %ymm7,%ymm4,%ymm4
5282 vpshufb %ymm9,%ymm11,%ymm11
5283 vpor %ymm6,%ymm1,%ymm1
5284 vmovd -36(%r13),%xmm7
5285 vmovd -36(%r9),%xmm6
5286 vpinsrd $1,-36(%r14),%xmm12,%xmm12
5287 vpinsrd $1,-36(%r10),%xmm8,%xmm8
5288 vpinsrd $1,-36(%r15),%xmm7,%xmm7
5289 vpunpckldq %ymm7,%ymm12,%ymm12
5290 vpinsrd $1,-36(%r11),%xmm6,%xmm6
5291 vpunpckldq %ymm6,%ymm8,%ymm8
5292 vpaddd %ymm15,%ymm3,%ymm3
5293 vpslld $5,%ymm4,%ymm7
5294 vpandn %ymm2,%ymm0,%ymm6
5295 vpand %ymm1,%ymm0,%ymm5
5297 vmovdqa %ymm11,192-128(%rax)
5298 vpaddd %ymm11,%ymm3,%ymm3
5299 vinserti128 $1,%xmm8,%ymm12,%ymm12
5300 vpsrld $27,%ymm4,%ymm8
5301 vpxor %ymm6,%ymm5,%ymm5
5302 vmovd -32(%r12),%xmm13
5304 vpslld $30,%ymm0,%ymm6
5305 vpor %ymm8,%ymm7,%ymm7
5306 vmovd -32(%r8),%xmm8
5307 vpaddd %ymm5,%ymm3,%ymm3
5309 vpsrld $2,%ymm0,%ymm0
5310 vpaddd %ymm7,%ymm3,%ymm3
5311 vpshufb %ymm9,%ymm12,%ymm12
5312 vpor %ymm6,%ymm0,%ymm0
5313 vmovd -32(%r13),%xmm7
5314 vmovd -32(%r9),%xmm6
5315 vpinsrd $1,-32(%r14),%xmm13,%xmm13
5316 vpinsrd $1,-32(%r10),%xmm8,%xmm8
5317 vpinsrd $1,-32(%r15),%xmm7,%xmm7
5318 vpunpckldq %ymm7,%ymm13,%ymm13
5319 vpinsrd $1,-32(%r11),%xmm6,%xmm6
5320 vpunpckldq %ymm6,%ymm8,%ymm8
5321 vpaddd %ymm15,%ymm2,%ymm2
5322 vpslld $5,%ymm3,%ymm7
5323 vpandn %ymm1,%ymm4,%ymm6
5324 vpand %ymm0,%ymm4,%ymm5
5326 vmovdqa %ymm12,224-128(%rax)
5327 vpaddd %ymm12,%ymm2,%ymm2
5328 vinserti128 $1,%xmm8,%ymm13,%ymm13
5329 vpsrld $27,%ymm3,%ymm8
5330 vpxor %ymm6,%ymm5,%ymm5
5331 vmovd -28(%r12),%xmm14
5333 vpslld $30,%ymm4,%ymm6
5334 vpor %ymm8,%ymm7,%ymm7
5335 vmovd -28(%r8),%xmm8
5336 vpaddd %ymm5,%ymm2,%ymm2
5338 vpsrld $2,%ymm4,%ymm4
5339 vpaddd %ymm7,%ymm2,%ymm2
5340 vpshufb %ymm9,%ymm13,%ymm13
5341 vpor %ymm6,%ymm4,%ymm4
5342 vmovd -28(%r13),%xmm7
5343 vmovd -28(%r9),%xmm6
5344 vpinsrd $1,-28(%r14),%xmm14,%xmm14
5345 vpinsrd $1,-28(%r10),%xmm8,%xmm8
5346 vpinsrd $1,-28(%r15),%xmm7,%xmm7
5347 vpunpckldq %ymm7,%ymm14,%ymm14
5348 vpinsrd $1,-28(%r11),%xmm6,%xmm6
5349 vpunpckldq %ymm6,%ymm8,%ymm8
5350 vpaddd %ymm15,%ymm1,%ymm1
5351 vpslld $5,%ymm2,%ymm7
5352 vpandn %ymm0,%ymm3,%ymm6
5353 vpand %ymm4,%ymm3,%ymm5
5355 vmovdqa %ymm13,256-256-128(%rbx)
5356 vpaddd %ymm13,%ymm1,%ymm1
5357 vinserti128 $1,%xmm8,%ymm14,%ymm14
5358 vpsrld $27,%ymm2,%ymm8
5359 vpxor %ymm6,%ymm5,%ymm5
5360 vmovd -24(%r12),%xmm10
5362 vpslld $30,%ymm3,%ymm6
5363 vpor %ymm8,%ymm7,%ymm7
5364 vmovd -24(%r8),%xmm8
5365 vpaddd %ymm5,%ymm1,%ymm1
5367 vpsrld $2,%ymm3,%ymm3
5368 vpaddd %ymm7,%ymm1,%ymm1
5369 vpshufb %ymm9,%ymm14,%ymm14
5370 vpor %ymm6,%ymm3,%ymm3
5371 vmovd -24(%r13),%xmm7
5372 vmovd -24(%r9),%xmm6
5373 vpinsrd $1,-24(%r14),%xmm10,%xmm10
5374 vpinsrd $1,-24(%r10),%xmm8,%xmm8
5375 vpinsrd $1,-24(%r15),%xmm7,%xmm7
5376 vpunpckldq %ymm7,%ymm10,%ymm10
5377 vpinsrd $1,-24(%r11),%xmm6,%xmm6
5378 vpunpckldq %ymm6,%ymm8,%ymm8
5379 vpaddd %ymm15,%ymm0,%ymm0
5380 vpslld $5,%ymm1,%ymm7
5381 vpandn %ymm4,%ymm2,%ymm6
5382 vpand %ymm3,%ymm2,%ymm5
5384 vmovdqa %ymm14,288-256-128(%rbx)
5385 vpaddd %ymm14,%ymm0,%ymm0
5386 vinserti128 $1,%xmm8,%ymm10,%ymm10
5387 vpsrld $27,%ymm1,%ymm8
5388 vpxor %ymm6,%ymm5,%ymm5
5389 vmovd -20(%r12),%xmm11
5391 vpslld $30,%ymm2,%ymm6
5392 vpor %ymm8,%ymm7,%ymm7
5393 vmovd -20(%r8),%xmm8
5394 vpaddd %ymm5,%ymm0,%ymm0
5396 vpsrld $2,%ymm2,%ymm2
5397 vpaddd %ymm7,%ymm0,%ymm0
5398 vpshufb %ymm9,%ymm10,%ymm10
5399 vpor %ymm6,%ymm2,%ymm2
5400 vmovd -20(%r13),%xmm7
5401 vmovd -20(%r9),%xmm6
5402 vpinsrd $1,-20(%r14),%xmm11,%xmm11
5403 vpinsrd $1,-20(%r10),%xmm8,%xmm8
5404 vpinsrd $1,-20(%r15),%xmm7,%xmm7
5405 vpunpckldq %ymm7,%ymm11,%ymm11
5406 vpinsrd $1,-20(%r11),%xmm6,%xmm6
5407 vpunpckldq %ymm6,%ymm8,%ymm8
5408 vpaddd %ymm15,%ymm4,%ymm4
5409 vpslld $5,%ymm0,%ymm7
5410 vpandn %ymm3,%ymm1,%ymm6
5411 vpand %ymm2,%ymm1,%ymm5
5413 vmovdqa %ymm10,320-256-128(%rbx)
5414 vpaddd %ymm10,%ymm4,%ymm4
5415 vinserti128 $1,%xmm8,%ymm11,%ymm11
5416 vpsrld $27,%ymm0,%ymm8
5417 vpxor %ymm6,%ymm5,%ymm5
5418 vmovd -16(%r12),%xmm12
5420 vpslld $30,%ymm1,%ymm6
5421 vpor %ymm8,%ymm7,%ymm7
5422 vmovd -16(%r8),%xmm8
5423 vpaddd %ymm5,%ymm4,%ymm4
5425 vpsrld $2,%ymm1,%ymm1
5426 vpaddd %ymm7,%ymm4,%ymm4
5427 vpshufb %ymm9,%ymm11,%ymm11
5428 vpor %ymm6,%ymm1,%ymm1
5429 vmovd -16(%r13),%xmm7
5430 vmovd -16(%r9),%xmm6
5431 vpinsrd $1,-16(%r14),%xmm12,%xmm12
5432 vpinsrd $1,-16(%r10),%xmm8,%xmm8
5433 vpinsrd $1,-16(%r15),%xmm7,%xmm7
5434 vpunpckldq %ymm7,%ymm12,%ymm12
5435 vpinsrd $1,-16(%r11),%xmm6,%xmm6
5436 vpunpckldq %ymm6,%ymm8,%ymm8
5437 vpaddd %ymm15,%ymm3,%ymm3
5438 vpslld $5,%ymm4,%ymm7
5439 vpandn %ymm2,%ymm0,%ymm6
5440 vpand %ymm1,%ymm0,%ymm5
5442 vmovdqa %ymm11,352-256-128(%rbx)
5443 vpaddd %ymm11,%ymm3,%ymm3
5444 vinserti128 $1,%xmm8,%ymm12,%ymm12
5445 vpsrld $27,%ymm4,%ymm8
5446 vpxor %ymm6,%ymm5,%ymm5
5447 vmovd -12(%r12),%xmm13
5449 vpslld $30,%ymm0,%ymm6
5450 vpor %ymm8,%ymm7,%ymm7
5451 vmovd -12(%r8),%xmm8
5452 vpaddd %ymm5,%ymm3,%ymm3
5454 vpsrld $2,%ymm0,%ymm0
5455 vpaddd %ymm7,%ymm3,%ymm3
5456 vpshufb %ymm9,%ymm12,%ymm12
5457 vpor %ymm6,%ymm0,%ymm0
5458 vmovd -12(%r13),%xmm7
5459 vmovd -12(%r9),%xmm6
5460 vpinsrd $1,-12(%r14),%xmm13,%xmm13
5461 vpinsrd $1,-12(%r10),%xmm8,%xmm8
5462 vpinsrd $1,-12(%r15),%xmm7,%xmm7
5463 vpunpckldq %ymm7,%ymm13,%ymm13
5464 vpinsrd $1,-12(%r11),%xmm6,%xmm6
5465 vpunpckldq %ymm6,%ymm8,%ymm8
5466 vpaddd %ymm15,%ymm2,%ymm2
5467 vpslld $5,%ymm3,%ymm7
5468 vpandn %ymm1,%ymm4,%ymm6
5469 vpand %ymm0,%ymm4,%ymm5
5471 vmovdqa %ymm12,384-256-128(%rbx)
5472 vpaddd %ymm12,%ymm2,%ymm2
5473 vinserti128 $1,%xmm8,%ymm13,%ymm13
5474 vpsrld $27,%ymm3,%ymm8
5475 vpxor %ymm6,%ymm5,%ymm5
5476 vmovd -8(%r12),%xmm14
5478 vpslld $30,%ymm4,%ymm6
5479 vpor %ymm8,%ymm7,%ymm7
5480 vmovd -8(%r8),%xmm8
5481 vpaddd %ymm5,%ymm2,%ymm2
5483 vpsrld $2,%ymm4,%ymm4
5484 vpaddd %ymm7,%ymm2,%ymm2
5485 vpshufb %ymm9,%ymm13,%ymm13
5486 vpor %ymm6,%ymm4,%ymm4
5487 vmovd -8(%r13),%xmm7
5488 vmovd -8(%r9),%xmm6
5489 vpinsrd $1,-8(%r14),%xmm14,%xmm14
5490 vpinsrd $1,-8(%r10),%xmm8,%xmm8
5491 vpinsrd $1,-8(%r15),%xmm7,%xmm7
5492 vpunpckldq %ymm7,%ymm14,%ymm14
5493 vpinsrd $1,-8(%r11),%xmm6,%xmm6
5494 vpunpckldq %ymm6,%ymm8,%ymm8
5495 vpaddd %ymm15,%ymm1,%ymm1
5496 vpslld $5,%ymm2,%ymm7
5497 vpandn %ymm0,%ymm3,%ymm6
5498 vpand %ymm4,%ymm3,%ymm5
5500 vmovdqa %ymm13,416-256-128(%rbx)
5501 vpaddd %ymm13,%ymm1,%ymm1
5502 vinserti128 $1,%xmm8,%ymm14,%ymm14
5503 vpsrld $27,%ymm2,%ymm8
5504 vpxor %ymm6,%ymm5,%ymm5
5505 vmovd -4(%r12),%xmm10
5507 vpslld $30,%ymm3,%ymm6
5508 vpor %ymm8,%ymm7,%ymm7
5509 vmovd -4(%r8),%xmm8
5510 vpaddd %ymm5,%ymm1,%ymm1
5512 vpsrld $2,%ymm3,%ymm3
5513 vpaddd %ymm7,%ymm1,%ymm1
5514 vpshufb %ymm9,%ymm14,%ymm14
5515 vpor %ymm6,%ymm3,%ymm3
5516 vmovdqa 0-128(%rax),%ymm11
5517 vmovd -4(%r13),%xmm7
5518 vmovd -4(%r9),%xmm6
5519 vpinsrd $1,-4(%r14),%xmm10,%xmm10
5520 vpinsrd $1,-4(%r10),%xmm8,%xmm8
5521 vpinsrd $1,-4(%r15),%xmm7,%xmm7
5522 vpunpckldq %ymm7,%ymm10,%ymm10
5523 vpinsrd $1,-4(%r11),%xmm6,%xmm6
5524 vpunpckldq %ymm6,%ymm8,%ymm8
5525 vpaddd %ymm15,%ymm0,%ymm0
5526 prefetcht0 63(%r12)
5527 vpslld $5,%ymm1,%ymm7
5528 vpandn %ymm4,%ymm2,%ymm6
5529 vpand %ymm3,%ymm2,%ymm5
5531 vmovdqa %ymm14,448-256-128(%rbx)
5532 vpaddd %ymm14,%ymm0,%ymm0
5533 vinserti128 $1,%xmm8,%ymm10,%ymm10
5534 vpsrld $27,%ymm1,%ymm8
5535 prefetcht0 63(%r13)
5536 vpxor %ymm6,%ymm5,%ymm5
5538 vpslld $30,%ymm2,%ymm6
5539 vpor %ymm8,%ymm7,%ymm7
5540 prefetcht0 63(%r14)
5541 vpaddd %ymm5,%ymm0,%ymm0
5543 vpsrld $2,%ymm2,%ymm2
5544 vpaddd %ymm7,%ymm0,%ymm0
5545 prefetcht0 63(%r15)
5546 vpshufb %ymm9,%ymm10,%ymm10
5547 vpor %ymm6,%ymm2,%ymm2
5548 vmovdqa 32-128(%rax),%ymm12
5549 vpxor %ymm13,%ymm11,%ymm11
5550 vmovdqa 64-128(%rax),%ymm13
5552 vpaddd %ymm15,%ymm4,%ymm4
5553 vpslld $5,%ymm0,%ymm7
5554 vpandn %ymm3,%ymm1,%ymm6
5555 prefetcht0 63(%r8)
5556 vpand %ymm2,%ymm1,%ymm5
5558 vmovdqa %ymm10,480-256-128(%rbx)
5559 vpaddd %ymm10,%ymm4,%ymm4
5560 vpxor 256-256-128(%rbx),%ymm11,%ymm11
5561 vpsrld $27,%ymm0,%ymm8
5562 vpxor %ymm6,%ymm5,%ymm5
5563 vpxor %ymm13,%ymm11,%ymm11
5564 prefetcht0 63(%r9)
5566 vpslld $30,%ymm1,%ymm6
5567 vpor %ymm8,%ymm7,%ymm7
5568 vpaddd %ymm5,%ymm4,%ymm4
5569 prefetcht0 63(%r10)
5570 vpsrld $31,%ymm11,%ymm9
5571 vpaddd %ymm11,%ymm11,%ymm11
5573 vpsrld $2,%ymm1,%ymm1
5574 prefetcht0 63(%r11)
5575 vpaddd %ymm7,%ymm4,%ymm4
5576 vpor %ymm9,%ymm11,%ymm11
5577 vpor %ymm6,%ymm1,%ymm1
5578 vpxor %ymm14,%ymm12,%ymm12
5579 vmovdqa 96-128(%rax),%ymm14
5581 vpaddd %ymm15,%ymm3,%ymm3
5582 vpslld $5,%ymm4,%ymm7
5583 vpandn %ymm2,%ymm0,%ymm6
5585 vpand %ymm1,%ymm0,%ymm5
5587 vmovdqa %ymm11,0-128(%rax)
5588 vpaddd %ymm11,%ymm3,%ymm3
5589 vpxor 288-256-128(%rbx),%ymm12,%ymm12
5590 vpsrld $27,%ymm4,%ymm8
5591 vpxor %ymm6,%ymm5,%ymm5
5592 vpxor %ymm14,%ymm12,%ymm12
5595 vpslld $30,%ymm0,%ymm6
5596 vpor %ymm8,%ymm7,%ymm7
5597 vpaddd %ymm5,%ymm3,%ymm3
5599 vpsrld $31,%ymm12,%ymm9
5600 vpaddd %ymm12,%ymm12,%ymm12
5602 vpsrld $2,%ymm0,%ymm0
5604 vpaddd %ymm7,%ymm3,%ymm3
5605 vpor %ymm9,%ymm12,%ymm12
5606 vpor %ymm6,%ymm0,%ymm0
5607 vpxor %ymm10,%ymm13,%ymm13
5608 vmovdqa 128-128(%rax),%ymm10
5610 vpaddd %ymm15,%ymm2,%ymm2
5611 vpslld $5,%ymm3,%ymm7
5612 vpandn %ymm1,%ymm4,%ymm6
5614 vpand %ymm0,%ymm4,%ymm5
5616 vmovdqa %ymm12,32-128(%rax)
5617 vpaddd %ymm12,%ymm2,%ymm2
5618 vpxor 320-256-128(%rbx),%ymm13,%ymm13
5619 vpsrld $27,%ymm3,%ymm8
5620 vpxor %ymm6,%ymm5,%ymm5
5621 vpxor %ymm10,%ymm13,%ymm13
5624 vpslld $30,%ymm4,%ymm6
5625 vpor %ymm8,%ymm7,%ymm7
5626 vpaddd %ymm5,%ymm2,%ymm2
5628 vpsrld $31,%ymm13,%ymm9
5629 vpaddd %ymm13,%ymm13,%ymm13
5631 vpsrld $2,%ymm4,%ymm4
5633 vpaddd %ymm7,%ymm2,%ymm2
5634 vpor %ymm9,%ymm13,%ymm13
5635 vpor %ymm6,%ymm4,%ymm4
5636 vpxor %ymm11,%ymm14,%ymm14
5637 vmovdqa 160-128(%rax),%ymm11
5639 vpaddd %ymm15,%ymm1,%ymm1
5640 vpslld $5,%ymm2,%ymm7
5641 vpandn %ymm0,%ymm3,%ymm6
5643 vpand %ymm4,%ymm3,%ymm5
5645 vmovdqa %ymm13,64-128(%rax)
5646 vpaddd %ymm13,%ymm1,%ymm1
5647 vpxor 352-256-128(%rbx),%ymm14,%ymm14
5648 vpsrld $27,%ymm2,%ymm8
5649 vpxor %ymm6,%ymm5,%ymm5
5650 vpxor %ymm11,%ymm14,%ymm14
5653 vpslld $30,%ymm3,%ymm6
5654 vpor %ymm8,%ymm7,%ymm7
5655 vpaddd %ymm5,%ymm1,%ymm1
5657 vpsrld $31,%ymm14,%ymm9
5658 vpaddd %ymm14,%ymm14,%ymm14
5660 vpsrld $2,%ymm3,%ymm3
5662 vpaddd %ymm7,%ymm1,%ymm1
5663 vpor %ymm9,%ymm14,%ymm14
5664 vpor %ymm6,%ymm3,%ymm3
5665 vpxor %ymm12,%ymm10,%ymm10
5666 vmovdqa 192-128(%rax),%ymm12
5668 vpaddd %ymm15,%ymm0,%ymm0
5669 vpslld $5,%ymm1,%ymm7
5670 vpandn %ymm4,%ymm2,%ymm6
5672 vpand %ymm3,%ymm2,%ymm5
5674 vmovdqa %ymm14,96-128(%rax)
5675 vpaddd %ymm14,%ymm0,%ymm0
5676 vpxor 384-256-128(%rbx),%ymm10,%ymm10
5677 vpsrld $27,%ymm1,%ymm8
5678 vpxor %ymm6,%ymm5,%ymm5
5679 vpxor %ymm12,%ymm10,%ymm10
5682 vpslld $30,%ymm2,%ymm6
5683 vpor %ymm8,%ymm7,%ymm7
5684 vpaddd %ymm5,%ymm0,%ymm0
5686 vpsrld $31,%ymm10,%ymm9
5687 vpaddd %ymm10,%ymm10,%ymm10
5689 vpsrld $2,%ymm2,%ymm2
5691 vpaddd %ymm7,%ymm0,%ymm0
5692 vpor %ymm9,%ymm10,%ymm10
5693 vpor %ymm6,%ymm2,%ymm2
5694 vmovdqa 0(%rbp),%ymm15
5695 vpxor %ymm13,%ymm11,%ymm11
5696 vmovdqa 224-128(%rax),%ymm13
5698 vpslld $5,%ymm0,%ymm7
5699 vpaddd %ymm15,%ymm4,%ymm4
5700 vpxor %ymm1,%ymm3,%ymm5
5701 vmovdqa %ymm10,128-128(%rax)
5702 vpaddd %ymm10,%ymm4,%ymm4
5703 vpxor 416-256-128(%rbx),%ymm11,%ymm11
5704 vpsrld $27,%ymm0,%ymm8
5705 vpxor %ymm2,%ymm5,%ymm5
5706 vpxor %ymm13,%ymm11,%ymm11
5708 vpslld $30,%ymm1,%ymm6
5709 vpor %ymm8,%ymm7,%ymm7
5710 vpaddd %ymm5,%ymm4,%ymm4
5711 vpsrld $31,%ymm11,%ymm9
5712 vpaddd %ymm11,%ymm11,%ymm11
5714 vpsrld $2,%ymm1,%ymm1
5715 vpaddd %ymm7,%ymm4,%ymm4
5716 vpor %ymm9,%ymm11,%ymm11
5717 vpor %ymm6,%ymm1,%ymm1
5718 vpxor %ymm14,%ymm12,%ymm12
5719 vmovdqa 256-256-128(%rbx),%ymm14
5721 vpslld $5,%ymm4,%ymm7
5722 vpaddd %ymm15,%ymm3,%ymm3
5723 vpxor %ymm0,%ymm2,%ymm5
5724 vmovdqa %ymm11,160-128(%rax)
5725 vpaddd %ymm11,%ymm3,%ymm3
5726 vpxor 448-256-128(%rbx),%ymm12,%ymm12
5727 vpsrld $27,%ymm4,%ymm8
5728 vpxor %ymm1,%ymm5,%ymm5
5729 vpxor %ymm14,%ymm12,%ymm12
5731 vpslld $30,%ymm0,%ymm6
5732 vpor %ymm8,%ymm7,%ymm7
5733 vpaddd %ymm5,%ymm3,%ymm3
5734 vpsrld $31,%ymm12,%ymm9
5735 vpaddd %ymm12,%ymm12,%ymm12
5737 vpsrld $2,%ymm0,%ymm0
5738 vpaddd %ymm7,%ymm3,%ymm3
5739 vpor %ymm9,%ymm12,%ymm12
5740 vpor %ymm6,%ymm0,%ymm0
5741 vpxor %ymm10,%ymm13,%ymm13
5742 vmovdqa 288-256-128(%rbx),%ymm10
5744 vpslld $5,%ymm3,%ymm7
5745 vpaddd %ymm15,%ymm2,%ymm2
5746 vpxor %ymm4,%ymm1,%ymm5
5747 vmovdqa %ymm12,192-128(%rax)
5748 vpaddd %ymm12,%ymm2,%ymm2
5749 vpxor 480-256-128(%rbx),%ymm13,%ymm13
5750 vpsrld $27,%ymm3,%ymm8
5751 vpxor %ymm0,%ymm5,%ymm5
5752 vpxor %ymm10,%ymm13,%ymm13
5754 vpslld $30,%ymm4,%ymm6
5755 vpor %ymm8,%ymm7,%ymm7
5756 vpaddd %ymm5,%ymm2,%ymm2
5757 vpsrld $31,%ymm13,%ymm9
5758 vpaddd %ymm13,%ymm13,%ymm13
5760 vpsrld $2,%ymm4,%ymm4
5761 vpaddd %ymm7,%ymm2,%ymm2
5762 vpor %ymm9,%ymm13,%ymm13
5763 vpor %ymm6,%ymm4,%ymm4
5764 vpxor %ymm11,%ymm14,%ymm14
5765 vmovdqa 320-256-128(%rbx),%ymm11
5767 vpslld $5,%ymm2,%ymm7
5768 vpaddd %ymm15,%ymm1,%ymm1
5769 vpxor %ymm3,%ymm0,%ymm5
5770 vmovdqa %ymm13,224-128(%rax)
5771 vpaddd %ymm13,%ymm1,%ymm1
5772 vpxor 0-128(%rax),%ymm14,%ymm14
5773 vpsrld $27,%ymm2,%ymm8
5774 vpxor %ymm4,%ymm5,%ymm5
5775 vpxor %ymm11,%ymm14,%ymm14
5777 vpslld $30,%ymm3,%ymm6
5778 vpor %ymm8,%ymm7,%ymm7
5779 vpaddd %ymm5,%ymm1,%ymm1
5780 vpsrld $31,%ymm14,%ymm9
5781 vpaddd %ymm14,%ymm14,%ymm14
5783 vpsrld $2,%ymm3,%ymm3
5784 vpaddd %ymm7,%ymm1,%ymm1
5785 vpor %ymm9,%ymm14,%ymm14
5786 vpor %ymm6,%ymm3,%ymm3
5787 vpxor %ymm12,%ymm10,%ymm10
5788 vmovdqa 352-256-128(%rbx),%ymm12
5790 vpslld $5,%ymm1,%ymm7
5791 vpaddd %ymm15,%ymm0,%ymm0
5792 vpxor %ymm2,%ymm4,%ymm5
5793 vmovdqa %ymm14,256-256-128(%rbx)
5794 vpaddd %ymm14,%ymm0,%ymm0
5795 vpxor 32-128(%rax),%ymm10,%ymm10
5796 vpsrld $27,%ymm1,%ymm8
5797 vpxor %ymm3,%ymm5,%ymm5
5798 vpxor %ymm12,%ymm10,%ymm10
5800 vpslld $30,%ymm2,%ymm6
5801 vpor %ymm8,%ymm7,%ymm7
5802 vpaddd %ymm5,%ymm0,%ymm0
5803 vpsrld $31,%ymm10,%ymm9
5804 vpaddd %ymm10,%ymm10,%ymm10
5806 vpsrld $2,%ymm2,%ymm2
5807 vpaddd %ymm7,%ymm0,%ymm0
5808 vpor %ymm9,%ymm10,%ymm10
5809 vpor %ymm6,%ymm2,%ymm2
5810 vpxor %ymm13,%ymm11,%ymm11
5811 vmovdqa 384-256-128(%rbx),%ymm13
5813 vpslld $5,%ymm0,%ymm7
5814 vpaddd %ymm15,%ymm4,%ymm4
5815 vpxor %ymm1,%ymm3,%ymm5
5816 vmovdqa %ymm10,288-256-128(%rbx)
5817 vpaddd %ymm10,%ymm4,%ymm4
5818 vpxor 64-128(%rax),%ymm11,%ymm11
5819 vpsrld $27,%ymm0,%ymm8
5820 vpxor %ymm2,%ymm5,%ymm5
5821 vpxor %ymm13,%ymm11,%ymm11
5823 vpslld $30,%ymm1,%ymm6
5824 vpor %ymm8,%ymm7,%ymm7
5825 vpaddd %ymm5,%ymm4,%ymm4
5826 vpsrld $31,%ymm11,%ymm9
5827 vpaddd %ymm11,%ymm11,%ymm11
5829 vpsrld $2,%ymm1,%ymm1
5830 vpaddd %ymm7,%ymm4,%ymm4
5831 vpor %ymm9,%ymm11,%ymm11
5832 vpor %ymm6,%ymm1,%ymm1
5833 vpxor %ymm14,%ymm12,%ymm12
5834 vmovdqa 416-256-128(%rbx),%ymm14
5836 vpslld $5,%ymm4,%ymm7
5837 vpaddd %ymm15,%ymm3,%ymm3
5838 vpxor %ymm0,%ymm2,%ymm5
5839 vmovdqa %ymm11,320-256-128(%rbx)
5840 vpaddd %ymm11,%ymm3,%ymm3
5841 vpxor 96-128(%rax),%ymm12,%ymm12
5842 vpsrld $27,%ymm4,%ymm8
5843 vpxor %ymm1,%ymm5,%ymm5
5844 vpxor %ymm14,%ymm12,%ymm12
5846 vpslld $30,%ymm0,%ymm6
5847 vpor %ymm8,%ymm7,%ymm7
5848 vpaddd %ymm5,%ymm3,%ymm3
5849 vpsrld $31,%ymm12,%ymm9
5850 vpaddd %ymm12,%ymm12,%ymm12
5852 vpsrld $2,%ymm0,%ymm0
5853 vpaddd %ymm7,%ymm3,%ymm3
5854 vpor %ymm9,%ymm12,%ymm12
5855 vpor %ymm6,%ymm0,%ymm0
5856 vpxor %ymm10,%ymm13,%ymm13
5857 vmovdqa 448-256-128(%rbx),%ymm10
5859 vpslld $5,%ymm3,%ymm7
5860 vpaddd %ymm15,%ymm2,%ymm2
5861 vpxor %ymm4,%ymm1,%ymm5
5862 vmovdqa %ymm12,352-256-128(%rbx)
5863 vpaddd %ymm12,%ymm2,%ymm2
5864 vpxor 128-128(%rax),%ymm13,%ymm13
5865 vpsrld $27,%ymm3,%ymm8
5866 vpxor %ymm0,%ymm5,%ymm5
5867 vpxor %ymm10,%ymm13,%ymm13
5869 vpslld $30,%ymm4,%ymm6
5870 vpor %ymm8,%ymm7,%ymm7
5871 vpaddd %ymm5,%ymm2,%ymm2
5872 vpsrld $31,%ymm13,%ymm9
5873 vpaddd %ymm13,%ymm13,%ymm13
5875 vpsrld $2,%ymm4,%ymm4
5876 vpaddd %ymm7,%ymm2,%ymm2
5877 vpor %ymm9,%ymm13,%ymm13
5878 vpor %ymm6,%ymm4,%ymm4
5879 vpxor %ymm11,%ymm14,%ymm14
5880 vmovdqa 480-256-128(%rbx),%ymm11
5882 vpslld $5,%ymm2,%ymm7
5883 vpaddd %ymm15,%ymm1,%ymm1
5884 vpxor %ymm3,%ymm0,%ymm5
5885 vmovdqa %ymm13,384-256-128(%rbx)
5886 vpaddd %ymm13,%ymm1,%ymm1
5887 vpxor 160-128(%rax),%ymm14,%ymm14
5888 vpsrld $27,%ymm2,%ymm8
5889 vpxor %ymm4,%ymm5,%ymm5
5890 vpxor %ymm11,%ymm14,%ymm14
5892 vpslld $30,%ymm3,%ymm6
5893 vpor %ymm8,%ymm7,%ymm7
5894 vpaddd %ymm5,%ymm1,%ymm1
5895 vpsrld $31,%ymm14,%ymm9
5896 vpaddd %ymm14,%ymm14,%ymm14
5898 vpsrld $2,%ymm3,%ymm3
5899 vpaddd %ymm7,%ymm1,%ymm1
5900 vpor %ymm9,%ymm14,%ymm14
5901 vpor %ymm6,%ymm3,%ymm3
5902 vpxor %ymm12,%ymm10,%ymm10
5903 vmovdqa 0-128(%rax),%ymm12
5905 vpslld $5,%ymm1,%ymm7
5906 vpaddd %ymm15,%ymm0,%ymm0
5907 vpxor %ymm2,%ymm4,%ymm5
5908 vmovdqa %ymm14,416-256-128(%rbx)
5909 vpaddd %ymm14,%ymm0,%ymm0
5910 vpxor 192-128(%rax),%ymm10,%ymm10
5911 vpsrld $27,%ymm1,%ymm8
5912 vpxor %ymm3,%ymm5,%ymm5
5913 vpxor %ymm12,%ymm10,%ymm10
5915 vpslld $30,%ymm2,%ymm6
5916 vpor %ymm8,%ymm7,%ymm7
5917 vpaddd %ymm5,%ymm0,%ymm0
5918 vpsrld $31,%ymm10,%ymm9
5919 vpaddd %ymm10,%ymm10,%ymm10
5921 vpsrld $2,%ymm2,%ymm2
5922 vpaddd %ymm7,%ymm0,%ymm0
5923 vpor %ymm9,%ymm10,%ymm10
5924 vpor %ymm6,%ymm2,%ymm2
5925 vpxor %ymm13,%ymm11,%ymm11
5926 vmovdqa 32-128(%rax),%ymm13
5928 vpslld $5,%ymm0,%ymm7
5929 vpaddd %ymm15,%ymm4,%ymm4
5930 vpxor %ymm1,%ymm3,%ymm5
5931 vmovdqa %ymm10,448-256-128(%rbx)
5932 vpaddd %ymm10,%ymm4,%ymm4
5933 vpxor 224-128(%rax),%ymm11,%ymm11
5934 vpsrld $27,%ymm0,%ymm8
5935 vpxor %ymm2,%ymm5,%ymm5
5936 vpxor %ymm13,%ymm11,%ymm11
5938 vpslld $30,%ymm1,%ymm6
5939 vpor %ymm8,%ymm7,%ymm7
5940 vpaddd %ymm5,%ymm4,%ymm4
5941 vpsrld $31,%ymm11,%ymm9
5942 vpaddd %ymm11,%ymm11,%ymm11
5944 vpsrld $2,%ymm1,%ymm1
5945 vpaddd %ymm7,%ymm4,%ymm4
5946 vpor %ymm9,%ymm11,%ymm11
5947 vpor %ymm6,%ymm1,%ymm1
5948 vpxor %ymm14,%ymm12,%ymm12
5949 vmovdqa 64-128(%rax),%ymm14
5951 vpslld $5,%ymm4,%ymm7
5952 vpaddd %ymm15,%ymm3,%ymm3
5953 vpxor %ymm0,%ymm2,%ymm5
5954 vmovdqa %ymm11,480-256-128(%rbx)
5955 vpaddd %ymm11,%ymm3,%ymm3
5956 vpxor 256-256-128(%rbx),%ymm12,%ymm12
5957 vpsrld $27,%ymm4,%ymm8
5958 vpxor %ymm1,%ymm5,%ymm5
5959 vpxor %ymm14,%ymm12,%ymm12
5961 vpslld $30,%ymm0,%ymm6
5962 vpor %ymm8,%ymm7,%ymm7
5963 vpaddd %ymm5,%ymm3,%ymm3
5964 vpsrld $31,%ymm12,%ymm9
5965 vpaddd %ymm12,%ymm12,%ymm12
5967 vpsrld $2,%ymm0,%ymm0
5968 vpaddd %ymm7,%ymm3,%ymm3
5969 vpor %ymm9,%ymm12,%ymm12
5970 vpor %ymm6,%ymm0,%ymm0
5971 vpxor %ymm10,%ymm13,%ymm13
5972 vmovdqa 96-128(%rax),%ymm10
5974 vpslld $5,%ymm3,%ymm7
5975 vpaddd %ymm15,%ymm2,%ymm2
5976 vpxor %ymm4,%ymm1,%ymm5
5977 vmovdqa %ymm12,0-128(%rax)
5978 vpaddd %ymm12,%ymm2,%ymm2
5979 vpxor 288-256-128(%rbx),%ymm13,%ymm13
5980 vpsrld $27,%ymm3,%ymm8
5981 vpxor %ymm0,%ymm5,%ymm5
5982 vpxor %ymm10,%ymm13,%ymm13
5984 vpslld $30,%ymm4,%ymm6
5985 vpor %ymm8,%ymm7,%ymm7
5986 vpaddd %ymm5,%ymm2,%ymm2
5987 vpsrld $31,%ymm13,%ymm9
5988 vpaddd %ymm13,%ymm13,%ymm13
5990 vpsrld $2,%ymm4,%ymm4
5991 vpaddd %ymm7,%ymm2,%ymm2
5992 vpor %ymm9,%ymm13,%ymm13
5993 vpor %ymm6,%ymm4,%ymm4
5994 vpxor %ymm11,%ymm14,%ymm14
5995 vmovdqa 128-128(%rax),%ymm11
5997 vpslld $5,%ymm2,%ymm7
5998 vpaddd %ymm15,%ymm1,%ymm1
5999 vpxor %ymm3,%ymm0,%ymm5
6000 vmovdqa %ymm13,32-128(%rax)
6001 vpaddd %ymm13,%ymm1,%ymm1
6002 vpxor 320-256-128(%rbx),%ymm14,%ymm14
6003 vpsrld $27,%ymm2,%ymm8
6004 vpxor %ymm4,%ymm5,%ymm5
6005 vpxor %ymm11,%ymm14,%ymm14
6007 vpslld $30,%ymm3,%ymm6
6008 vpor %ymm8,%ymm7,%ymm7
6009 vpaddd %ymm5,%ymm1,%ymm1
6010 vpsrld $31,%ymm14,%ymm9
6011 vpaddd %ymm14,%ymm14,%ymm14
6013 vpsrld $2,%ymm3,%ymm3
6014 vpaddd %ymm7,%ymm1,%ymm1
6015 vpor %ymm9,%ymm14,%ymm14
6016 vpor %ymm6,%ymm3,%ymm3
6017 vpxor %ymm12,%ymm10,%ymm10
6018 vmovdqa 160-128(%rax),%ymm12
6020 vpslld $5,%ymm1,%ymm7
6021 vpaddd %ymm15,%ymm0,%ymm0
6022 vpxor %ymm2,%ymm4,%ymm5
6023 vmovdqa %ymm14,64-128(%rax)
6024 vpaddd %ymm14,%ymm0,%ymm0
6025 vpxor 352-256-128(%rbx),%ymm10,%ymm10
6026 vpsrld $27,%ymm1,%ymm8
6027 vpxor %ymm3,%ymm5,%ymm5
6028 vpxor %ymm12,%ymm10,%ymm10
6030 vpslld $30,%ymm2,%ymm6
6031 vpor %ymm8,%ymm7,%ymm7
6032 vpaddd %ymm5,%ymm0,%ymm0
6033 vpsrld $31,%ymm10,%ymm9
6034 vpaddd %ymm10,%ymm10,%ymm10
6036 vpsrld $2,%ymm2,%ymm2
6037 vpaddd %ymm7,%ymm0,%ymm0
6038 vpor %ymm9,%ymm10,%ymm10
6039 vpor %ymm6,%ymm2,%ymm2
6040 vpxor %ymm13,%ymm11,%ymm11
6041 vmovdqa 192-128(%rax),%ymm13
6043 vpslld $5,%ymm0,%ymm7
6044 vpaddd %ymm15,%ymm4,%ymm4
6045 vpxor %ymm1,%ymm3,%ymm5
6046 vmovdqa %ymm10,96-128(%rax)
6047 vpaddd %ymm10,%ymm4,%ymm4
6048 vpxor 384-256-128(%rbx),%ymm11,%ymm11
6049 vpsrld $27,%ymm0,%ymm8
6050 vpxor %ymm2,%ymm5,%ymm5
6051 vpxor %ymm13,%ymm11,%ymm11
6053 vpslld $30,%ymm1,%ymm6
6054 vpor %ymm8,%ymm7,%ymm7
6055 vpaddd %ymm5,%ymm4,%ymm4
6056 vpsrld $31,%ymm11,%ymm9
6057 vpaddd %ymm11,%ymm11,%ymm11
6059 vpsrld $2,%ymm1,%ymm1
6060 vpaddd %ymm7,%ymm4,%ymm4
6061 vpor %ymm9,%ymm11,%ymm11
6062 vpor %ymm6,%ymm1,%ymm1
6063 vpxor %ymm14,%ymm12,%ymm12
6064 vmovdqa 224-128(%rax),%ymm14
6066 vpslld $5,%ymm4,%ymm7
6067 vpaddd %ymm15,%ymm3,%ymm3
6068 vpxor %ymm0,%ymm2,%ymm5
6069 vmovdqa %ymm11,128-128(%rax)
6070 vpaddd %ymm11,%ymm3,%ymm3
6071 vpxor 416-256-128(%rbx),%ymm12,%ymm12
6072 vpsrld $27,%ymm4,%ymm8
6073 vpxor %ymm1,%ymm5,%ymm5
6074 vpxor %ymm14,%ymm12,%ymm12
6076 vpslld $30,%ymm0,%ymm6
6077 vpor %ymm8,%ymm7,%ymm7
6078 vpaddd %ymm5,%ymm3,%ymm3
6079 vpsrld $31,%ymm12,%ymm9
6080 vpaddd %ymm12,%ymm12,%ymm12
6082 vpsrld $2,%ymm0,%ymm0
6083 vpaddd %ymm7,%ymm3,%ymm3
6084 vpor %ymm9,%ymm12,%ymm12
6085 vpor %ymm6,%ymm0,%ymm0
6086 vpxor %ymm10,%ymm13,%ymm13
6087 vmovdqa 256-256-128(%rbx),%ymm10
6089 vpslld $5,%ymm3,%ymm7
6090 vpaddd %ymm15,%ymm2,%ymm2
6091 vpxor %ymm4,%ymm1,%ymm5
6092 vmovdqa %ymm12,160-128(%rax)
6093 vpaddd %ymm12,%ymm2,%ymm2
6094 vpxor 448-256-128(%rbx),%ymm13,%ymm13
6095 vpsrld $27,%ymm3,%ymm8
6096 vpxor %ymm0,%ymm5,%ymm5
6097 vpxor %ymm10,%ymm13,%ymm13
6099 vpslld $30,%ymm4,%ymm6
6100 vpor %ymm8,%ymm7,%ymm7
6101 vpaddd %ymm5,%ymm2,%ymm2
6102 vpsrld $31,%ymm13,%ymm9
6103 vpaddd %ymm13,%ymm13,%ymm13
6105 vpsrld $2,%ymm4,%ymm4
6106 vpaddd %ymm7,%ymm2,%ymm2
6107 vpor %ymm9,%ymm13,%ymm13
6108 vpor %ymm6,%ymm4,%ymm4
6109 vpxor %ymm11,%ymm14,%ymm14
6110 vmovdqa 288-256-128(%rbx),%ymm11
6112 vpslld $5,%ymm2,%ymm7
6113 vpaddd %ymm15,%ymm1,%ymm1
6114 vpxor %ymm3,%ymm0,%ymm5
6115 vmovdqa %ymm13,192-128(%rax)
6116 vpaddd %ymm13,%ymm1,%ymm1
6117 vpxor 480-256-128(%rbx),%ymm14,%ymm14
6118 vpsrld $27,%ymm2,%ymm8
6119 vpxor %ymm4,%ymm5,%ymm5
6120 vpxor %ymm11,%ymm14,%ymm14
6122 vpslld $30,%ymm3,%ymm6
6123 vpor %ymm8,%ymm7,%ymm7
6124 vpaddd %ymm5,%ymm1,%ymm1
6125 vpsrld $31,%ymm14,%ymm9
6126 vpaddd %ymm14,%ymm14,%ymm14
6128 vpsrld $2,%ymm3,%ymm3
6129 vpaddd %ymm7,%ymm1,%ymm1
6130 vpor %ymm9,%ymm14,%ymm14
6131 vpor %ymm6,%ymm3,%ymm3
6132 vpxor %ymm12,%ymm10,%ymm10
6133 vmovdqa 320-256-128(%rbx),%ymm12
6135 vpslld $5,%ymm1,%ymm7
6136 vpaddd %ymm15,%ymm0,%ymm0
6137 vpxor %ymm2,%ymm4,%ymm5
6138 vmovdqa %ymm14,224-128(%rax)
6139 vpaddd %ymm14,%ymm0,%ymm0
6140 vpxor 0-128(%rax),%ymm10,%ymm10
6141 vpsrld $27,%ymm1,%ymm8
6142 vpxor %ymm3,%ymm5,%ymm5
6143 vpxor %ymm12,%ymm10,%ymm10
6145 vpslld $30,%ymm2,%ymm6
6146 vpor %ymm8,%ymm7,%ymm7
6147 vpaddd %ymm5,%ymm0,%ymm0
6148 vpsrld $31,%ymm10,%ymm9
6149 vpaddd %ymm10,%ymm10,%ymm10
6151 vpsrld $2,%ymm2,%ymm2
6152 vpaddd %ymm7,%ymm0,%ymm0
6153 vpor %ymm9,%ymm10,%ymm10
6154 vpor %ymm6,%ymm2,%ymm2
6155 vmovdqa 32(%rbp),%ymm15
6156 vpxor %ymm13,%ymm11,%ymm11
6157 vmovdqa 352-256-128(%rbx),%ymm13
6159 vpaddd %ymm15,%ymm4,%ymm4
6160 vpslld $5,%ymm0,%ymm7
6161 vpand %ymm2,%ymm3,%ymm6
6162 vpxor 32-128(%rax),%ymm11,%ymm11
6164 vpaddd %ymm6,%ymm4,%ymm4
6165 vpsrld $27,%ymm0,%ymm8
6166 vpxor %ymm2,%ymm3,%ymm5
6167 vpxor %ymm13,%ymm11,%ymm11
6169 vmovdqu %ymm10,256-256-128(%rbx)
6170 vpaddd %ymm10,%ymm4,%ymm4
6171 vpor %ymm8,%ymm7,%ymm7
6172 vpsrld $31,%ymm11,%ymm9
6173 vpand %ymm1,%ymm5,%ymm5
6174 vpaddd %ymm11,%ymm11,%ymm11
6176 vpslld $30,%ymm1,%ymm6
6177 vpaddd %ymm5,%ymm4,%ymm4
6179 vpsrld $2,%ymm1,%ymm1
6180 vpaddd %ymm7,%ymm4,%ymm4
6181 vpor %ymm9,%ymm11,%ymm11
6182 vpor %ymm6,%ymm1,%ymm1
6183 vpxor %ymm14,%ymm12,%ymm12
6184 vmovdqa 384-256-128(%rbx),%ymm14
6186 vpaddd %ymm15,%ymm3,%ymm3
6187 vpslld $5,%ymm4,%ymm7
6188 vpand %ymm1,%ymm2,%ymm6
6189 vpxor 64-128(%rax),%ymm12,%ymm12
6191 vpaddd %ymm6,%ymm3,%ymm3
6192 vpsrld $27,%ymm4,%ymm8
6193 vpxor %ymm1,%ymm2,%ymm5
6194 vpxor %ymm14,%ymm12,%ymm12
6196 vmovdqu %ymm11,288-256-128(%rbx)
6197 vpaddd %ymm11,%ymm3,%ymm3
6198 vpor %ymm8,%ymm7,%ymm7
6199 vpsrld $31,%ymm12,%ymm9
6200 vpand %ymm0,%ymm5,%ymm5
6201 vpaddd %ymm12,%ymm12,%ymm12
6203 vpslld $30,%ymm0,%ymm6
6204 vpaddd %ymm5,%ymm3,%ymm3
6206 vpsrld $2,%ymm0,%ymm0
6207 vpaddd %ymm7,%ymm3,%ymm3
6208 vpor %ymm9,%ymm12,%ymm12
6209 vpor %ymm6,%ymm0,%ymm0
6210 vpxor %ymm10,%ymm13,%ymm13
6211 vmovdqa 416-256-128(%rbx),%ymm10
6213 vpaddd %ymm15,%ymm2,%ymm2
6214 vpslld $5,%ymm3,%ymm7
6215 vpand %ymm0,%ymm1,%ymm6
6216 vpxor 96-128(%rax),%ymm13,%ymm13
6218 vpaddd %ymm6,%ymm2,%ymm2
6219 vpsrld $27,%ymm3,%ymm8
6220 vpxor %ymm0,%ymm1,%ymm5
6221 vpxor %ymm10,%ymm13,%ymm13
6223 vmovdqu %ymm12,320-256-128(%rbx)
6224 vpaddd %ymm12,%ymm2,%ymm2
6225 vpor %ymm8,%ymm7,%ymm7
6226 vpsrld $31,%ymm13,%ymm9
6227 vpand %ymm4,%ymm5,%ymm5
6228 vpaddd %ymm13,%ymm13,%ymm13
6230 vpslld $30,%ymm4,%ymm6
6231 vpaddd %ymm5,%ymm2,%ymm2
6233 vpsrld $2,%ymm4,%ymm4
6234 vpaddd %ymm7,%ymm2,%ymm2
6235 vpor %ymm9,%ymm13,%ymm13
6236 vpor %ymm6,%ymm4,%ymm4
6237 vpxor %ymm11,%ymm14,%ymm14
6238 vmovdqa 448-256-128(%rbx),%ymm11
6240 vpaddd %ymm15,%ymm1,%ymm1
6241 vpslld $5,%ymm2,%ymm7
6242 vpand %ymm4,%ymm0,%ymm6
6243 vpxor 128-128(%rax),%ymm14,%ymm14
6245 vpaddd %ymm6,%ymm1,%ymm1
6246 vpsrld $27,%ymm2,%ymm8
6247 vpxor %ymm4,%ymm0,%ymm5
6248 vpxor %ymm11,%ymm14,%ymm14
6250 vmovdqu %ymm13,352-256-128(%rbx)
6251 vpaddd %ymm13,%ymm1,%ymm1
6252 vpor %ymm8,%ymm7,%ymm7
6253 vpsrld $31,%ymm14,%ymm9
6254 vpand %ymm3,%ymm5,%ymm5
6255 vpaddd %ymm14,%ymm14,%ymm14
6257 vpslld $30,%ymm3,%ymm6
6258 vpaddd %ymm5,%ymm1,%ymm1
6260 vpsrld $2,%ymm3,%ymm3
6261 vpaddd %ymm7,%ymm1,%ymm1
6262 vpor %ymm9,%ymm14,%ymm14
6263 vpor %ymm6,%ymm3,%ymm3
6264 vpxor %ymm12,%ymm10,%ymm10
6265 vmovdqa 480-256-128(%rbx),%ymm12
6267 vpaddd %ymm15,%ymm0,%ymm0
6268 vpslld $5,%ymm1,%ymm7
6269 vpand %ymm3,%ymm4,%ymm6
6270 vpxor 160-128(%rax),%ymm10,%ymm10
6272 vpaddd %ymm6,%ymm0,%ymm0
6273 vpsrld $27,%ymm1,%ymm8
6274 vpxor %ymm3,%ymm4,%ymm5
6275 vpxor %ymm12,%ymm10,%ymm10
6277 vmovdqu %ymm14,384-256-128(%rbx)
6278 vpaddd %ymm14,%ymm0,%ymm0
6279 vpor %ymm8,%ymm7,%ymm7
6280 vpsrld $31,%ymm10,%ymm9
6281 vpand %ymm2,%ymm5,%ymm5
6282 vpaddd %ymm10,%ymm10,%ymm10
6284 vpslld $30,%ymm2,%ymm6
6285 vpaddd %ymm5,%ymm0,%ymm0
6287 vpsrld $2,%ymm2,%ymm2
6288 vpaddd %ymm7,%ymm0,%ymm0
6289 vpor %ymm9,%ymm10,%ymm10
6290 vpor %ymm6,%ymm2,%ymm2
6291 vpxor %ymm13,%ymm11,%ymm11
6292 vmovdqa 0-128(%rax),%ymm13
6294 vpaddd %ymm15,%ymm4,%ymm4
6295 vpslld $5,%ymm0,%ymm7
6296 vpand %ymm2,%ymm3,%ymm6
6297 vpxor 192-128(%rax),%ymm11,%ymm11
6299 vpaddd %ymm6,%ymm4,%ymm4
6300 vpsrld $27,%ymm0,%ymm8
6301 vpxor %ymm2,%ymm3,%ymm5
6302 vpxor %ymm13,%ymm11,%ymm11
6304 vmovdqu %ymm10,416-256-128(%rbx)
6305 vpaddd %ymm10,%ymm4,%ymm4
6306 vpor %ymm8,%ymm7,%ymm7
6307 vpsrld $31,%ymm11,%ymm9
6308 vpand %ymm1,%ymm5,%ymm5
6309 vpaddd %ymm11,%ymm11,%ymm11
6311 vpslld $30,%ymm1,%ymm6
6312 vpaddd %ymm5,%ymm4,%ymm4
6314 vpsrld $2,%ymm1,%ymm1
6315 vpaddd %ymm7,%ymm4,%ymm4
6316 vpor %ymm9,%ymm11,%ymm11
6317 vpor %ymm6,%ymm1,%ymm1
6318 vpxor %ymm14,%ymm12,%ymm12
6319 vmovdqa 32-128(%rax),%ymm14
6321 vpaddd %ymm15,%ymm3,%ymm3
6322 vpslld $5,%ymm4,%ymm7
6323 vpand %ymm1,%ymm2,%ymm6
6324 vpxor 224-128(%rax),%ymm12,%ymm12
6326 vpaddd %ymm6,%ymm3,%ymm3
6327 vpsrld $27,%ymm4,%ymm8
6328 vpxor %ymm1,%ymm2,%ymm5
6329 vpxor %ymm14,%ymm12,%ymm12
6331 vmovdqu %ymm11,448-256-128(%rbx)
6332 vpaddd %ymm11,%ymm3,%ymm3
6333 vpor %ymm8,%ymm7,%ymm7
6334 vpsrld $31,%ymm12,%ymm9
6335 vpand %ymm0,%ymm5,%ymm5
6336 vpaddd %ymm12,%ymm12,%ymm12
6338 vpslld $30,%ymm0,%ymm6
6339 vpaddd %ymm5,%ymm3,%ymm3
6341 vpsrld $2,%ymm0,%ymm0
6342 vpaddd %ymm7,%ymm3,%ymm3
6343 vpor %ymm9,%ymm12,%ymm12
6344 vpor %ymm6,%ymm0,%ymm0
6345 vpxor %ymm10,%ymm13,%ymm13
6346 vmovdqa 64-128(%rax),%ymm10
6348 vpaddd %ymm15,%ymm2,%ymm2
6349 vpslld $5,%ymm3,%ymm7
6350 vpand %ymm0,%ymm1,%ymm6
6351 vpxor 256-256-128(%rbx),%ymm13,%ymm13
6353 vpaddd %ymm6,%ymm2,%ymm2
6354 vpsrld $27,%ymm3,%ymm8
6355 vpxor %ymm0,%ymm1,%ymm5
6356 vpxor %ymm10,%ymm13,%ymm13
6358 vmovdqu %ymm12,480-256-128(%rbx)
6359 vpaddd %ymm12,%ymm2,%ymm2
6360 vpor %ymm8,%ymm7,%ymm7
6361 vpsrld $31,%ymm13,%ymm9
6362 vpand %ymm4,%ymm5,%ymm5
6363 vpaddd %ymm13,%ymm13,%ymm13
6365 vpslld $30,%ymm4,%ymm6
6366 vpaddd %ymm5,%ymm2,%ymm2
6368 vpsrld $2,%ymm4,%ymm4
6369 vpaddd %ymm7,%ymm2,%ymm2
6370 vpor %ymm9,%ymm13,%ymm13
6371 vpor %ymm6,%ymm4,%ymm4
6372 vpxor %ymm11,%ymm14,%ymm14
6373 vmovdqa 96-128(%rax),%ymm11
6375 vpaddd %ymm15,%ymm1,%ymm1
6376 vpslld $5,%ymm2,%ymm7
6377 vpand %ymm4,%ymm0,%ymm6
6378 vpxor 288-256-128(%rbx),%ymm14,%ymm14
6380 vpaddd %ymm6,%ymm1,%ymm1
6381 vpsrld $27,%ymm2,%ymm8
6382 vpxor %ymm4,%ymm0,%ymm5
6383 vpxor %ymm11,%ymm14,%ymm14
6385 vmovdqu %ymm13,0-128(%rax)
6386 vpaddd %ymm13,%ymm1,%ymm1
6387 vpor %ymm8,%ymm7,%ymm7
6388 vpsrld $31,%ymm14,%ymm9
6389 vpand %ymm3,%ymm5,%ymm5
6390 vpaddd %ymm14,%ymm14,%ymm14
6392 vpslld $30,%ymm3,%ymm6
6393 vpaddd %ymm5,%ymm1,%ymm1
6395 vpsrld $2,%ymm3,%ymm3
6396 vpaddd %ymm7,%ymm1,%ymm1
6397 vpor %ymm9,%ymm14,%ymm14
6398 vpor %ymm6,%ymm3,%ymm3
6399 vpxor %ymm12,%ymm10,%ymm10
6400 vmovdqa 128-128(%rax),%ymm12
6402 vpaddd %ymm15,%ymm0,%ymm0
6403 vpslld $5,%ymm1,%ymm7
6404 vpand %ymm3,%ymm4,%ymm6
6405 vpxor 320-256-128(%rbx),%ymm10,%ymm10
6407 vpaddd %ymm6,%ymm0,%ymm0
6408 vpsrld $27,%ymm1,%ymm8
6409 vpxor %ymm3,%ymm4,%ymm5
6410 vpxor %ymm12,%ymm10,%ymm10
6412 vmovdqu %ymm14,32-128(%rax)
6413 vpaddd %ymm14,%ymm0,%ymm0
6414 vpor %ymm8,%ymm7,%ymm7
6415 vpsrld $31,%ymm10,%ymm9
6416 vpand %ymm2,%ymm5,%ymm5
6417 vpaddd %ymm10,%ymm10,%ymm10
6419 vpslld $30,%ymm2,%ymm6
6420 vpaddd %ymm5,%ymm0,%ymm0
6422 vpsrld $2,%ymm2,%ymm2
6423 vpaddd %ymm7,%ymm0,%ymm0
6424 vpor %ymm9,%ymm10,%ymm10
6425 vpor %ymm6,%ymm2,%ymm2
6426 vpxor %ymm13,%ymm11,%ymm11
6427 vmovdqa 160-128(%rax),%ymm13
6429 vpaddd %ymm15,%ymm4,%ymm4
6430 vpslld $5,%ymm0,%ymm7
6431 vpand %ymm2,%ymm3,%ymm6
6432 vpxor 352-256-128(%rbx),%ymm11,%ymm11
6434 vpaddd %ymm6,%ymm4,%ymm4
6435 vpsrld $27,%ymm0,%ymm8
6436 vpxor %ymm2,%ymm3,%ymm5
6437 vpxor %ymm13,%ymm11,%ymm11
6439 vmovdqu %ymm10,64-128(%rax)
6440 vpaddd %ymm10,%ymm4,%ymm4
6441 vpor %ymm8,%ymm7,%ymm7
6442 vpsrld $31,%ymm11,%ymm9
6443 vpand %ymm1,%ymm5,%ymm5
6444 vpaddd %ymm11,%ymm11,%ymm11
6446 vpslld $30,%ymm1,%ymm6
6447 vpaddd %ymm5,%ymm4,%ymm4
6449 vpsrld $2,%ymm1,%ymm1
6450 vpaddd %ymm7,%ymm4,%ymm4
6451 vpor %ymm9,%ymm11,%ymm11
6452 vpor %ymm6,%ymm1,%ymm1
6453 vpxor %ymm14,%ymm12,%ymm12
6454 vmovdqa 192-128(%rax),%ymm14
6456 vpaddd %ymm15,%ymm3,%ymm3
6457 vpslld $5,%ymm4,%ymm7
6458 vpand %ymm1,%ymm2,%ymm6
6459 vpxor 384-256-128(%rbx),%ymm12,%ymm12
6461 vpaddd %ymm6,%ymm3,%ymm3
6462 vpsrld $27,%ymm4,%ymm8
6463 vpxor %ymm1,%ymm2,%ymm5
6464 vpxor %ymm14,%ymm12,%ymm12
6466 vmovdqu %ymm11,96-128(%rax)
6467 vpaddd %ymm11,%ymm3,%ymm3
6468 vpor %ymm8,%ymm7,%ymm7
6469 vpsrld $31,%ymm12,%ymm9
6470 vpand %ymm0,%ymm5,%ymm5
6471 vpaddd %ymm12,%ymm12,%ymm12
6473 vpslld $30,%ymm0,%ymm6
6474 vpaddd %ymm5,%ymm3,%ymm3
6476 vpsrld $2,%ymm0,%ymm0
6477 vpaddd %ymm7,%ymm3,%ymm3
6478 vpor %ymm9,%ymm12,%ymm12
6479 vpor %ymm6,%ymm0,%ymm0
6480 vpxor %ymm10,%ymm13,%ymm13
6481 vmovdqa 224-128(%rax),%ymm10
6483 vpaddd %ymm15,%ymm2,%ymm2
6484 vpslld $5,%ymm3,%ymm7
6485 vpand %ymm0,%ymm1,%ymm6
6486 vpxor 416-256-128(%rbx),%ymm13,%ymm13
6488 vpaddd %ymm6,%ymm2,%ymm2
6489 vpsrld $27,%ymm3,%ymm8
6490 vpxor %ymm0,%ymm1,%ymm5
6491 vpxor %ymm10,%ymm13,%ymm13
6493 vmovdqu %ymm12,128-128(%rax)
6494 vpaddd %ymm12,%ymm2,%ymm2
6495 vpor %ymm8,%ymm7,%ymm7
6496 vpsrld $31,%ymm13,%ymm9
6497 vpand %ymm4,%ymm5,%ymm5
6498 vpaddd %ymm13,%ymm13,%ymm13
6500 vpslld $30,%ymm4,%ymm6
6501 vpaddd %ymm5,%ymm2,%ymm2
6503 vpsrld $2,%ymm4,%ymm4
6504 vpaddd %ymm7,%ymm2,%ymm2
6505 vpor %ymm9,%ymm13,%ymm13
6506 vpor %ymm6,%ymm4,%ymm4
6507 vpxor %ymm11,%ymm14,%ymm14
6508 vmovdqa 256-256-128(%rbx),%ymm11
6510 vpaddd %ymm15,%ymm1,%ymm1
6511 vpslld $5,%ymm2,%ymm7
6512 vpand %ymm4,%ymm0,%ymm6
6513 vpxor 448-256-128(%rbx),%ymm14,%ymm14
6515 vpaddd %ymm6,%ymm1,%ymm1
6516 vpsrld $27,%ymm2,%ymm8
6517 vpxor %ymm4,%ymm0,%ymm5
6518 vpxor %ymm11,%ymm14,%ymm14
6520 vmovdqu %ymm13,160-128(%rax)
6521 vpaddd %ymm13,%ymm1,%ymm1
6522 vpor %ymm8,%ymm7,%ymm7
6523 vpsrld $31,%ymm14,%ymm9
6524 vpand %ymm3,%ymm5,%ymm5
6525 vpaddd %ymm14,%ymm14,%ymm14
6527 vpslld $30,%ymm3,%ymm6
6528 vpaddd %ymm5,%ymm1,%ymm1
6530 vpsrld $2,%ymm3,%ymm3
6531 vpaddd %ymm7,%ymm1,%ymm1
6532 vpor %ymm9,%ymm14,%ymm14
6533 vpor %ymm6,%ymm3,%ymm3
6534 vpxor %ymm12,%ymm10,%ymm10
6535 vmovdqa 288-256-128(%rbx),%ymm12
6537 vpaddd %ymm15,%ymm0,%ymm0
6538 vpslld $5,%ymm1,%ymm7
6539 vpand %ymm3,%ymm4,%ymm6
6540 vpxor 480-256-128(%rbx),%ymm10,%ymm10
6542 vpaddd %ymm6,%ymm0,%ymm0
6543 vpsrld $27,%ymm1,%ymm8
6544 vpxor %ymm3,%ymm4,%ymm5
6545 vpxor %ymm12,%ymm10,%ymm10
6547 vmovdqu %ymm14,192-128(%rax)
6548 vpaddd %ymm14,%ymm0,%ymm0
6549 vpor %ymm8,%ymm7,%ymm7
6550 vpsrld $31,%ymm10,%ymm9
6551 vpand %ymm2,%ymm5,%ymm5
6552 vpaddd %ymm10,%ymm10,%ymm10
6554 vpslld $30,%ymm2,%ymm6
6555 vpaddd %ymm5,%ymm0,%ymm0
6557 vpsrld $2,%ymm2,%ymm2
6558 vpaddd %ymm7,%ymm0,%ymm0
6559 vpor %ymm9,%ymm10,%ymm10
6560 vpor %ymm6,%ymm2,%ymm2
6561 vpxor %ymm13,%ymm11,%ymm11
6562 vmovdqa 320-256-128(%rbx),%ymm13
6564 vpaddd %ymm15,%ymm4,%ymm4
6565 vpslld $5,%ymm0,%ymm7
6566 vpand %ymm2,%ymm3,%ymm6
6567 vpxor 0-128(%rax),%ymm11,%ymm11
6569 vpaddd %ymm6,%ymm4,%ymm4
6570 vpsrld $27,%ymm0,%ymm8
6571 vpxor %ymm2,%ymm3,%ymm5
6572 vpxor %ymm13,%ymm11,%ymm11
6574 vmovdqu %ymm10,224-128(%rax)
6575 vpaddd %ymm10,%ymm4,%ymm4
6576 vpor %ymm8,%ymm7,%ymm7
6577 vpsrld $31,%ymm11,%ymm9
6578 vpand %ymm1,%ymm5,%ymm5
6579 vpaddd %ymm11,%ymm11,%ymm11
6581 vpslld $30,%ymm1,%ymm6
6582 vpaddd %ymm5,%ymm4,%ymm4
6584 vpsrld $2,%ymm1,%ymm1
6585 vpaddd %ymm7,%ymm4,%ymm4
6586 vpor %ymm9,%ymm11,%ymm11
6587 vpor %ymm6,%ymm1,%ymm1
6588 vpxor %ymm14,%ymm12,%ymm12
6589 vmovdqa 352-256-128(%rbx),%ymm14
6591 vpaddd %ymm15,%ymm3,%ymm3
6592 vpslld $5,%ymm4,%ymm7
6593 vpand %ymm1,%ymm2,%ymm6
6594 vpxor 32-128(%rax),%ymm12,%ymm12
6596 vpaddd %ymm6,%ymm3,%ymm3
6597 vpsrld $27,%ymm4,%ymm8
6598 vpxor %ymm1,%ymm2,%ymm5
6599 vpxor %ymm14,%ymm12,%ymm12
6601 vmovdqu %ymm11,256-256-128(%rbx)
6602 vpaddd %ymm11,%ymm3,%ymm3
6603 vpor %ymm8,%ymm7,%ymm7
6604 vpsrld $31,%ymm12,%ymm9
6605 vpand %ymm0,%ymm5,%ymm5
6606 vpaddd %ymm12,%ymm12,%ymm12
6608 vpslld $30,%ymm0,%ymm6
6609 vpaddd %ymm5,%ymm3,%ymm3
6611 vpsrld $2,%ymm0,%ymm0
6612 vpaddd %ymm7,%ymm3,%ymm3
6613 vpor %ymm9,%ymm12,%ymm12
6614 vpor %ymm6,%ymm0,%ymm0
6615 vpxor %ymm10,%ymm13,%ymm13
6616 vmovdqa 384-256-128(%rbx),%ymm10
6618 vpaddd %ymm15,%ymm2,%ymm2
6619 vpslld $5,%ymm3,%ymm7
6620 vpand %ymm0,%ymm1,%ymm6
6621 vpxor 64-128(%rax),%ymm13,%ymm13
6623 vpaddd %ymm6,%ymm2,%ymm2
6624 vpsrld $27,%ymm3,%ymm8
6625 vpxor %ymm0,%ymm1,%ymm5
6626 vpxor %ymm10,%ymm13,%ymm13
6628 vmovdqu %ymm12,288-256-128(%rbx)
6629 vpaddd %ymm12,%ymm2,%ymm2
6630 vpor %ymm8,%ymm7,%ymm7
6631 vpsrld $31,%ymm13,%ymm9
6632 vpand %ymm4,%ymm5,%ymm5
6633 vpaddd %ymm13,%ymm13,%ymm13
6635 vpslld $30,%ymm4,%ymm6
6636 vpaddd %ymm5,%ymm2,%ymm2
6638 vpsrld $2,%ymm4,%ymm4
6639 vpaddd %ymm7,%ymm2,%ymm2
6640 vpor %ymm9,%ymm13,%ymm13
6641 vpor %ymm6,%ymm4,%ymm4
6642 vpxor %ymm11,%ymm14,%ymm14
6643 vmovdqa 416-256-128(%rbx),%ymm11
6645 vpaddd %ymm15,%ymm1,%ymm1
6646 vpslld $5,%ymm2,%ymm7
6647 vpand %ymm4,%ymm0,%ymm6
6648 vpxor 96-128(%rax),%ymm14,%ymm14
6650 vpaddd %ymm6,%ymm1,%ymm1
6651 vpsrld $27,%ymm2,%ymm8
6652 vpxor %ymm4,%ymm0,%ymm5
6653 vpxor %ymm11,%ymm14,%ymm14
6655 vmovdqu %ymm13,320-256-128(%rbx)
6656 vpaddd %ymm13,%ymm1,%ymm1
6657 vpor %ymm8,%ymm7,%ymm7
6658 vpsrld $31,%ymm14,%ymm9
6659 vpand %ymm3,%ymm5,%ymm5
6660 vpaddd %ymm14,%ymm14,%ymm14
6662 vpslld $30,%ymm3,%ymm6
6663 vpaddd %ymm5,%ymm1,%ymm1
6665 vpsrld $2,%ymm3,%ymm3
6666 vpaddd %ymm7,%ymm1,%ymm1
6667 vpor %ymm9,%ymm14,%ymm14
6668 vpor %ymm6,%ymm3,%ymm3
6669 vpxor %ymm12,%ymm10,%ymm10
6670 vmovdqa 448-256-128(%rbx),%ymm12
6672 vpaddd %ymm15,%ymm0,%ymm0
6673 vpslld $5,%ymm1,%ymm7
6674 vpand %ymm3,%ymm4,%ymm6
6675 vpxor 128-128(%rax),%ymm10,%ymm10
6677 vpaddd %ymm6,%ymm0,%ymm0
6678 vpsrld $27,%ymm1,%ymm8
6679 vpxor %ymm3,%ymm4,%ymm5
6680 vpxor %ymm12,%ymm10,%ymm10
6682 vmovdqu %ymm14,352-256-128(%rbx)
6683 vpaddd %ymm14,%ymm0,%ymm0
6684 vpor %ymm8,%ymm7,%ymm7
6685 vpsrld $31,%ymm10,%ymm9
6686 vpand %ymm2,%ymm5,%ymm5
6687 vpaddd %ymm10,%ymm10,%ymm10
6689 vpslld $30,%ymm2,%ymm6
6690 vpaddd %ymm5,%ymm0,%ymm0
6692 vpsrld $2,%ymm2,%ymm2
6693 vpaddd %ymm7,%ymm0,%ymm0
6694 vpor %ymm9,%ymm10,%ymm10
6695 vpor %ymm6,%ymm2,%ymm2
6696 vmovdqa 64(%rbp),%ymm15
6697 vpxor %ymm13,%ymm11,%ymm11
6698 vmovdqa 480-256-128(%rbx),%ymm13
6700 vpslld $5,%ymm0,%ymm7
6701 vpaddd %ymm15,%ymm4,%ymm4
6702 vpxor %ymm1,%ymm3,%ymm5
6703 vmovdqa %ymm10,384-256-128(%rbx)
6704 vpaddd %ymm10,%ymm4,%ymm4
6705 vpxor 160-128(%rax),%ymm11,%ymm11
6706 vpsrld $27,%ymm0,%ymm8
6707 vpxor %ymm2,%ymm5,%ymm5
6708 vpxor %ymm13,%ymm11,%ymm11
6710 vpslld $30,%ymm1,%ymm6
6711 vpor %ymm8,%ymm7,%ymm7
6712 vpaddd %ymm5,%ymm4,%ymm4
6713 vpsrld $31,%ymm11,%ymm9
6714 vpaddd %ymm11,%ymm11,%ymm11
6716 vpsrld $2,%ymm1,%ymm1
6717 vpaddd %ymm7,%ymm4,%ymm4
6718 vpor %ymm9,%ymm11,%ymm11
6719 vpor %ymm6,%ymm1,%ymm1
6720 vpxor %ymm14,%ymm12,%ymm12
6721 vmovdqa 0-128(%rax),%ymm14
6723 vpslld $5,%ymm4,%ymm7
6724 vpaddd %ymm15,%ymm3,%ymm3
6725 vpxor %ymm0,%ymm2,%ymm5
6726 vmovdqa %ymm11,416-256-128(%rbx)
6727 vpaddd %ymm11,%ymm3,%ymm3
6728 vpxor 192-128(%rax),%ymm12,%ymm12
6729 vpsrld $27,%ymm4,%ymm8
6730 vpxor %ymm1,%ymm5,%ymm5
6731 vpxor %ymm14,%ymm12,%ymm12
6733 vpslld $30,%ymm0,%ymm6
6734 vpor %ymm8,%ymm7,%ymm7
6735 vpaddd %ymm5,%ymm3,%ymm3
6736 vpsrld $31,%ymm12,%ymm9
6737 vpaddd %ymm12,%ymm12,%ymm12
6739 vpsrld $2,%ymm0,%ymm0
6740 vpaddd %ymm7,%ymm3,%ymm3
6741 vpor %ymm9,%ymm12,%ymm12
6742 vpor %ymm6,%ymm0,%ymm0
6743 vpxor %ymm10,%ymm13,%ymm13
6744 vmovdqa 32-128(%rax),%ymm10
6746 vpslld $5,%ymm3,%ymm7
6747 vpaddd %ymm15,%ymm2,%ymm2
6748 vpxor %ymm4,%ymm1,%ymm5
6749 vmovdqa %ymm12,448-256-128(%rbx)
6750 vpaddd %ymm12,%ymm2,%ymm2
6751 vpxor 224-128(%rax),%ymm13,%ymm13
6752 vpsrld $27,%ymm3,%ymm8
6753 vpxor %ymm0,%ymm5,%ymm5
6754 vpxor %ymm10,%ymm13,%ymm13
6756 vpslld $30,%ymm4,%ymm6
6757 vpor %ymm8,%ymm7,%ymm7
6758 vpaddd %ymm5,%ymm2,%ymm2
6759 vpsrld $31,%ymm13,%ymm9
6760 vpaddd %ymm13,%ymm13,%ymm13
6762 vpsrld $2,%ymm4,%ymm4
6763 vpaddd %ymm7,%ymm2,%ymm2
6764 vpor %ymm9,%ymm13,%ymm13
6765 vpor %ymm6,%ymm4,%ymm4
6766 vpxor %ymm11,%ymm14,%ymm14
6767 vmovdqa 64-128(%rax),%ymm11
6769 vpslld $5,%ymm2,%ymm7
6770 vpaddd %ymm15,%ymm1,%ymm1
6771 vpxor %ymm3,%ymm0,%ymm5
6772 vmovdqa %ymm13,480-256-128(%rbx)
6773 vpaddd %ymm13,%ymm1,%ymm1
6774 vpxor 256-256-128(%rbx),%ymm14,%ymm14
6775 vpsrld $27,%ymm2,%ymm8
6776 vpxor %ymm4,%ymm5,%ymm5
6777 vpxor %ymm11,%ymm14,%ymm14
6779 vpslld $30,%ymm3,%ymm6
6780 vpor %ymm8,%ymm7,%ymm7
6781 vpaddd %ymm5,%ymm1,%ymm1
6782 vpsrld $31,%ymm14,%ymm9
6783 vpaddd %ymm14,%ymm14,%ymm14
6785 vpsrld $2,%ymm3,%ymm3
6786 vpaddd %ymm7,%ymm1,%ymm1
6787 vpor %ymm9,%ymm14,%ymm14
6788 vpor %ymm6,%ymm3,%ymm3
6789 vpxor %ymm12,%ymm10,%ymm10
6790 vmovdqa 96-128(%rax),%ymm12
6792 vpslld $5,%ymm1,%ymm7
6793 vpaddd %ymm15,%ymm0,%ymm0
6794 vpxor %ymm2,%ymm4,%ymm5
6795 vmovdqa %ymm14,0-128(%rax)
6796 vpaddd %ymm14,%ymm0,%ymm0
6797 vpxor 288-256-128(%rbx),%ymm10,%ymm10
6798 vpsrld $27,%ymm1,%ymm8
6799 vpxor %ymm3,%ymm5,%ymm5
6800 vpxor %ymm12,%ymm10,%ymm10
6802 vpslld $30,%ymm2,%ymm6
6803 vpor %ymm8,%ymm7,%ymm7
6804 vpaddd %ymm5,%ymm0,%ymm0
6805 vpsrld $31,%ymm10,%ymm9
6806 vpaddd %ymm10,%ymm10,%ymm10
6808 vpsrld $2,%ymm2,%ymm2
6809 vpaddd %ymm7,%ymm0,%ymm0
6810 vpor %ymm9,%ymm10,%ymm10
6811 vpor %ymm6,%ymm2,%ymm2
6812 vpxor %ymm13,%ymm11,%ymm11
6813 vmovdqa 128-128(%rax),%ymm13
6815 vpslld $5,%ymm0,%ymm7
6816 vpaddd %ymm15,%ymm4,%ymm4
6817 vpxor %ymm1,%ymm3,%ymm5
6818 vmovdqa %ymm10,32-128(%rax)
6819 vpaddd %ymm10,%ymm4,%ymm4
6820 vpxor 320-256-128(%rbx),%ymm11,%ymm11
6821 vpsrld $27,%ymm0,%ymm8
6822 vpxor %ymm2,%ymm5,%ymm5
6823 vpxor %ymm13,%ymm11,%ymm11
6825 vpslld $30,%ymm1,%ymm6
6826 vpor %ymm8,%ymm7,%ymm7
6827 vpaddd %ymm5,%ymm4,%ymm4
6828 vpsrld $31,%ymm11,%ymm9
6829 vpaddd %ymm11,%ymm11,%ymm11
6831 vpsrld $2,%ymm1,%ymm1
6832 vpaddd %ymm7,%ymm4,%ymm4
6833 vpor %ymm9,%ymm11,%ymm11
6834 vpor %ymm6,%ymm1,%ymm1
6835 vpxor %ymm14,%ymm12,%ymm12
6836 vmovdqa 160-128(%rax),%ymm14
6838 vpslld $5,%ymm4,%ymm7
6839 vpaddd %ymm15,%ymm3,%ymm3
6840 vpxor %ymm0,%ymm2,%ymm5
6841 vmovdqa %ymm11,64-128(%rax)
6842 vpaddd %ymm11,%ymm3,%ymm3
6843 vpxor 352-256-128(%rbx),%ymm12,%ymm12
6844 vpsrld $27,%ymm4,%ymm8
6845 vpxor %ymm1,%ymm5,%ymm5
6846 vpxor %ymm14,%ymm12,%ymm12
6848 vpslld $30,%ymm0,%ymm6
6849 vpor %ymm8,%ymm7,%ymm7
6850 vpaddd %ymm5,%ymm3,%ymm3
6851 vpsrld $31,%ymm12,%ymm9
6852 vpaddd %ymm12,%ymm12,%ymm12
6854 vpsrld $2,%ymm0,%ymm0
6855 vpaddd %ymm7,%ymm3,%ymm3
6856 vpor %ymm9,%ymm12,%ymm12
6857 vpor %ymm6,%ymm0,%ymm0
6858 vpxor %ymm10,%ymm13,%ymm13
6859 vmovdqa 192-128(%rax),%ymm10
6861 vpslld $5,%ymm3,%ymm7
6862 vpaddd %ymm15,%ymm2,%ymm2
6863 vpxor %ymm4,%ymm1,%ymm5
6864 vmovdqa %ymm12,96-128(%rax)
6865 vpaddd %ymm12,%ymm2,%ymm2
6866 vpxor 384-256-128(%rbx),%ymm13,%ymm13
6867 vpsrld $27,%ymm3,%ymm8
6868 vpxor %ymm0,%ymm5,%ymm5
6869 vpxor %ymm10,%ymm13,%ymm13
6871 vpslld $30,%ymm4,%ymm6
6872 vpor %ymm8,%ymm7,%ymm7
6873 vpaddd %ymm5,%ymm2,%ymm2
6874 vpsrld $31,%ymm13,%ymm9
6875 vpaddd %ymm13,%ymm13,%ymm13
6877 vpsrld $2,%ymm4,%ymm4
6878 vpaddd %ymm7,%ymm2,%ymm2
6879 vpor %ymm9,%ymm13,%ymm13
6880 vpor %ymm6,%ymm4,%ymm4
6881 vpxor %ymm11,%ymm14,%ymm14
6882 vmovdqa 224-128(%rax),%ymm11
6884 vpslld $5,%ymm2,%ymm7
6885 vpaddd %ymm15,%ymm1,%ymm1
6886 vpxor %ymm3,%ymm0,%ymm5
6887 vmovdqa %ymm13,128-128(%rax)
6888 vpaddd %ymm13,%ymm1,%ymm1
6889 vpxor 416-256-128(%rbx),%ymm14,%ymm14
6890 vpsrld $27,%ymm2,%ymm8
6891 vpxor %ymm4,%ymm5,%ymm5
6892 vpxor %ymm11,%ymm14,%ymm14
6894 vpslld $30,%ymm3,%ymm6
6895 vpor %ymm8,%ymm7,%ymm7
6896 vpaddd %ymm5,%ymm1,%ymm1
6897 vpsrld $31,%ymm14,%ymm9
6898 vpaddd %ymm14,%ymm14,%ymm14
6900 vpsrld $2,%ymm3,%ymm3
6901 vpaddd %ymm7,%ymm1,%ymm1
6902 vpor %ymm9,%ymm14,%ymm14
6903 vpor %ymm6,%ymm3,%ymm3
6904 vpxor %ymm12,%ymm10,%ymm10
6905 vmovdqa 256-256-128(%rbx),%ymm12
6907 vpslld $5,%ymm1,%ymm7
6908 vpaddd %ymm15,%ymm0,%ymm0
6909 vpxor %ymm2,%ymm4,%ymm5
6910 vmovdqa %ymm14,160-128(%rax)
6911 vpaddd %ymm14,%ymm0,%ymm0
6912 vpxor 448-256-128(%rbx),%ymm10,%ymm10
6913 vpsrld $27,%ymm1,%ymm8
6914 vpxor %ymm3,%ymm5,%ymm5
6915 vpxor %ymm12,%ymm10,%ymm10
6917 vpslld $30,%ymm2,%ymm6
6918 vpor %ymm8,%ymm7,%ymm7
6919 vpaddd %ymm5,%ymm0,%ymm0
6920 vpsrld $31,%ymm10,%ymm9
6921 vpaddd %ymm10,%ymm10,%ymm10
6923 vpsrld $2,%ymm2,%ymm2
6924 vpaddd %ymm7,%ymm0,%ymm0
6925 vpor %ymm9,%ymm10,%ymm10
6926 vpor %ymm6,%ymm2,%ymm2
6927 vpxor %ymm13,%ymm11,%ymm11
6928 vmovdqa 288-256-128(%rbx),%ymm13
6930 vpslld $5,%ymm0,%ymm7
6931 vpaddd %ymm15,%ymm4,%ymm4
6932 vpxor %ymm1,%ymm3,%ymm5
6933 vmovdqa %ymm10,192-128(%rax)
6934 vpaddd %ymm10,%ymm4,%ymm4
6935 vpxor 480-256-128(%rbx),%ymm11,%ymm11
6936 vpsrld $27,%ymm0,%ymm8
6937 vpxor %ymm2,%ymm5,%ymm5
6938 vpxor %ymm13,%ymm11,%ymm11
6940 vpslld $30,%ymm1,%ymm6
6941 vpor %ymm8,%ymm7,%ymm7
6942 vpaddd %ymm5,%ymm4,%ymm4
6943 vpsrld $31,%ymm11,%ymm9
6944 vpaddd %ymm11,%ymm11,%ymm11
6946 vpsrld $2,%ymm1,%ymm1
6947 vpaddd %ymm7,%ymm4,%ymm4
6948 vpor %ymm9,%ymm11,%ymm11
6949 vpor %ymm6,%ymm1,%ymm1
6950 vpxor %ymm14,%ymm12,%ymm12
6951 vmovdqa 320-256-128(%rbx),%ymm14
6953 vpslld $5,%ymm4,%ymm7
6954 vpaddd %ymm15,%ymm3,%ymm3
6955 vpxor %ymm0,%ymm2,%ymm5
6956 vmovdqa %ymm11,224-128(%rax)
6957 vpaddd %ymm11,%ymm3,%ymm3
6958 vpxor 0-128(%rax),%ymm12,%ymm12
6959 vpsrld $27,%ymm4,%ymm8
6960 vpxor %ymm1,%ymm5,%ymm5
6961 vpxor %ymm14,%ymm12,%ymm12
6963 vpslld $30,%ymm0,%ymm6
6964 vpor %ymm8,%ymm7,%ymm7
6965 vpaddd %ymm5,%ymm3,%ymm3
6966 vpsrld $31,%ymm12,%ymm9
6967 vpaddd %ymm12,%ymm12,%ymm12
6969 vpsrld $2,%ymm0,%ymm0
6970 vpaddd %ymm7,%ymm3,%ymm3
6971 vpor %ymm9,%ymm12,%ymm12
6972 vpor %ymm6,%ymm0,%ymm0
6973 vpxor %ymm10,%ymm13,%ymm13
6974 vmovdqa 352-256-128(%rbx),%ymm10
6976 vpslld $5,%ymm3,%ymm7
6977 vpaddd %ymm15,%ymm2,%ymm2
6978 vpxor %ymm4,%ymm1,%ymm5
6979 vpaddd %ymm12,%ymm2,%ymm2
6980 vpxor 32-128(%rax),%ymm13,%ymm13
6981 vpsrld $27,%ymm3,%ymm8
6982 vpxor %ymm0,%ymm5,%ymm5
6983 vpxor %ymm10,%ymm13,%ymm13
6985 vpslld $30,%ymm4,%ymm6
6986 vpor %ymm8,%ymm7,%ymm7
6987 vpaddd %ymm5,%ymm2,%ymm2
6988 vpsrld $31,%ymm13,%ymm9
6989 vpaddd %ymm13,%ymm13,%ymm13
6991 vpsrld $2,%ymm4,%ymm4
6992 vpaddd %ymm7,%ymm2,%ymm2
6993 vpor %ymm9,%ymm13,%ymm13
6994 vpor %ymm6,%ymm4,%ymm4
6995 vpxor %ymm11,%ymm14,%ymm14
6996 vmovdqa 384-256-128(%rbx),%ymm11
6998 vpslld $5,%ymm2,%ymm7
6999 vpaddd %ymm15,%ymm1,%ymm1
7000 vpxor %ymm3,%ymm0,%ymm5
7001 vpaddd %ymm13,%ymm1,%ymm1
7002 vpxor 64-128(%rax),%ymm14,%ymm14
7003 vpsrld $27,%ymm2,%ymm8
7004 vpxor %ymm4,%ymm5,%ymm5
7005 vpxor %ymm11,%ymm14,%ymm14
7007 vpslld $30,%ymm3,%ymm6
7008 vpor %ymm8,%ymm7,%ymm7
7009 vpaddd %ymm5,%ymm1,%ymm1
7010 vpsrld $31,%ymm14,%ymm9
7011 vpaddd %ymm14,%ymm14,%ymm14
7013 vpsrld $2,%ymm3,%ymm3
7014 vpaddd %ymm7,%ymm1,%ymm1
7015 vpor %ymm9,%ymm14,%ymm14
7016 vpor %ymm6,%ymm3,%ymm3
7017 vpxor %ymm12,%ymm10,%ymm10
7018 vmovdqa 416-256-128(%rbx),%ymm12
7020 vpslld $5,%ymm1,%ymm7
7021 vpaddd %ymm15,%ymm0,%ymm0
7022 vpxor %ymm2,%ymm4,%ymm5
7023 vpaddd %ymm14,%ymm0,%ymm0
7024 vpxor 96-128(%rax),%ymm10,%ymm10
7025 vpsrld $27,%ymm1,%ymm8
7026 vpxor %ymm3,%ymm5,%ymm5
7027 vpxor %ymm12,%ymm10,%ymm10
7029 vpslld $30,%ymm2,%ymm6
7030 vpor %ymm8,%ymm7,%ymm7
7031 vpaddd %ymm5,%ymm0,%ymm0
7032 vpsrld $31,%ymm10,%ymm9
7033 vpaddd %ymm10,%ymm10,%ymm10
7035 vpsrld $2,%ymm2,%ymm2
7036 vpaddd %ymm7,%ymm0,%ymm0
7037 vpor %ymm9,%ymm10,%ymm10
7038 vpor %ymm6,%ymm2,%ymm2
7039 vpxor %ymm13,%ymm11,%ymm11
7040 vmovdqa 448-256-128(%rbx),%ymm13
7042 vpslld $5,%ymm0,%ymm7
7043 vpaddd %ymm15,%ymm4,%ymm4
7044 vpxor %ymm1,%ymm3,%ymm5
7045 vpaddd %ymm10,%ymm4,%ymm4
7046 vpxor 128-128(%rax),%ymm11,%ymm11
7047 vpsrld $27,%ymm0,%ymm8
7048 vpxor %ymm2,%ymm5,%ymm5
7049 vpxor %ymm13,%ymm11,%ymm11
7051 vpslld $30,%ymm1,%ymm6
7052 vpor %ymm8,%ymm7,%ymm7
7053 vpaddd %ymm5,%ymm4,%ymm4
7054 vpsrld $31,%ymm11,%ymm9
7055 vpaddd %ymm11,%ymm11,%ymm11
7057 vpsrld $2,%ymm1,%ymm1
7058 vpaddd %ymm7,%ymm4,%ymm4
7059 vpor %ymm9,%ymm11,%ymm11
7060 vpor %ymm6,%ymm1,%ymm1
7061 vpxor %ymm14,%ymm12,%ymm12
7062 vmovdqa 480-256-128(%rbx),%ymm14
7064 vpslld $5,%ymm4,%ymm7
7065 vpaddd %ymm15,%ymm3,%ymm3
7066 vpxor %ymm0,%ymm2,%ymm5
7067 vpaddd %ymm11,%ymm3,%ymm3
7068 vpxor 160-128(%rax),%ymm12,%ymm12
7069 vpsrld $27,%ymm4,%ymm8
7070 vpxor %ymm1,%ymm5,%ymm5
7071 vpxor %ymm14,%ymm12,%ymm12
7073 vpslld $30,%ymm0,%ymm6
7074 vpor %ymm8,%ymm7,%ymm7
7075 vpaddd %ymm5,%ymm3,%ymm3
7076 vpsrld $31,%ymm12,%ymm9
7077 vpaddd %ymm12,%ymm12,%ymm12
7079 vpsrld $2,%ymm0,%ymm0
7080 vpaddd %ymm7,%ymm3,%ymm3
7081 vpor %ymm9,%ymm12,%ymm12
7082 vpor %ymm6,%ymm0,%ymm0
7083 vpxor %ymm10,%ymm13,%ymm13
7084 vmovdqa 0-128(%rax),%ymm10
7086 vpslld $5,%ymm3,%ymm7
7087 vpaddd %ymm15,%ymm2,%ymm2
7088 vpxor %ymm4,%ymm1,%ymm5
7089 vpaddd %ymm12,%ymm2,%ymm2
7090 vpxor 192-128(%rax),%ymm13,%ymm13
7091 vpsrld $27,%ymm3,%ymm8
7092 vpxor %ymm0,%ymm5,%ymm5
7093 vpxor %ymm10,%ymm13,%ymm13
7095 vpslld $30,%ymm4,%ymm6
7096 vpor %ymm8,%ymm7,%ymm7
7097 vpaddd %ymm5,%ymm2,%ymm2
7098 vpsrld $31,%ymm13,%ymm9
7099 vpaddd %ymm13,%ymm13,%ymm13
7101 vpsrld $2,%ymm4,%ymm4
7102 vpaddd %ymm7,%ymm2,%ymm2
7103 vpor %ymm9,%ymm13,%ymm13
7104 vpor %ymm6,%ymm4,%ymm4
7105 vpxor %ymm11,%ymm14,%ymm14
7106 vmovdqa 32-128(%rax),%ymm11
7108 vpslld $5,%ymm2,%ymm7
7109 vpaddd %ymm15,%ymm1,%ymm1
7110 vpxor %ymm3,%ymm0,%ymm5
7111 vpaddd %ymm13,%ymm1,%ymm1
7112 vpxor 224-128(%rax),%ymm14,%ymm14
7113 vpsrld $27,%ymm2,%ymm8
7114 vpxor %ymm4,%ymm5,%ymm5
7115 vpxor %ymm11,%ymm14,%ymm14
7117 vpslld $30,%ymm3,%ymm6
7118 vpor %ymm8,%ymm7,%ymm7
7119 vpaddd %ymm5,%ymm1,%ymm1
7120 vpsrld $31,%ymm14,%ymm9
7121 vpaddd %ymm14,%ymm14,%ymm14
7123 vpsrld $2,%ymm3,%ymm3
7124 vpaddd %ymm7,%ymm1,%ymm1
7125 vpor %ymm9,%ymm14,%ymm14
7126 vpor %ymm6,%ymm3,%ymm3
7127 vpslld $5,%ymm1,%ymm7
7128 vpaddd %ymm15,%ymm0,%ymm0
7129 vpxor %ymm2,%ymm4,%ymm5
7131 vpsrld $27,%ymm1,%ymm8
7132 vpaddd %ymm14,%ymm0,%ymm0
7133 vpxor %ymm3,%ymm5,%ymm5
7135 vpslld $30,%ymm2,%ymm6
7136 vpor %ymm8,%ymm7,%ymm7
7137 vpaddd %ymm5,%ymm0,%ymm0
7139 vpsrld $2,%ymm2,%ymm2
7140 vpaddd %ymm7,%ymm0,%ymm0
7141 vpor %ymm6,%ymm2,%ymm2
7142 movl $1,%ecx
7143 leaq 512(%rsp),%rbx
7144 cmpl 0(%rbx),%ecx
7145 cmovgeq %rbp,%r12
7146 cmpl 4(%rbx),%ecx
7147 cmovgeq %rbp,%r13
7148 cmpl 8(%rbx),%ecx
7149 cmovgeq %rbp,%r14
7150 cmpl 12(%rbx),%ecx
7151 cmovgeq %rbp,%r15
7152 cmpl 16(%rbx),%ecx
7153 cmovgeq %rbp,%r8
7154 cmpl 20(%rbx),%ecx
7155 cmovgeq %rbp,%r9
7156 cmpl 24(%rbx),%ecx
7157 cmovgeq %rbp,%r10
7158 cmpl 28(%rbx),%ecx
7159 cmovgeq %rbp,%r11
7160 vmovdqu (%rbx),%ymm5
7161 vpxor %ymm7,%ymm7,%ymm7
7162 vmovdqa %ymm5,%ymm6
7163 vpcmpgtd %ymm7,%ymm6,%ymm6
7164 vpaddd %ymm6,%ymm5,%ymm5
7166 vpand %ymm6,%ymm0,%ymm0
7167 vpand %ymm6,%ymm1,%ymm1
7168 vpaddd 0(%rdi),%ymm0,%ymm0
7169 vpand %ymm6,%ymm2,%ymm2
7170 vpaddd 32(%rdi),%ymm1,%ymm1
7171 vpand %ymm6,%ymm3,%ymm3
7172 vpaddd 64(%rdi),%ymm2,%ymm2
7173 vpand %ymm6,%ymm4,%ymm4
7174 vpaddd 96(%rdi),%ymm3,%ymm3
7175 vpaddd 128(%rdi),%ymm4,%ymm4
7176 vmovdqu %ymm0,0(%rdi)
7177 vmovdqu %ymm1,32(%rdi)
7178 vmovdqu %ymm2,64(%rdi)
7179 vmovdqu %ymm3,96(%rdi)
7180 vmovdqu %ymm4,128(%rdi)
7182 vmovdqu %ymm5,(%rbx)
7183 leaq 256+128(%rsp),%rbx
7184 vmovdqu 96(%rbp),%ymm9
7185 decl %edx
7186 jnz .Loop_avx2
7194 .Ldone_avx2:
7195 movq 544(%rsp),%rax
7196 vzeroupper
7197 movq -48(%rax),%r15
7198 movq -40(%rax),%r14
7199 movq -32(%rax),%r13
7200 movq -24(%rax),%r12
7201 movq -16(%rax),%rbp
7202 movq -8(%rax),%rbx
7203 leaq (%rax),%rsp
7204 .Lepilogue_avx2:
7205 .byte 0xf3,0xc3
7206 .size sha1_multi_block_avx2,.-sha1_multi_block_avx2
7208 .align 256
7209 .long 0x5a827999,0x5a827999,0x5a827999,0x5a827999
7210 .long 0x5a827999,0x5a827999,0x5a827999,0x5a827999
7211 K_XX_XX:
7212 .long 0x6ed9eba1,0x6ed9eba1,0x6ed9eba1,0x6ed9eba1
7213 .long 0x6ed9eba1,0x6ed9eba1,0x6ed9eba1,0x6ed9eba1
7214 .long 0x8f1bbcdc,0x8f1bbcdc,0x8f1bbcdc,0x8f1bbcdc
7215 .long 0x8f1bbcdc,0x8f1bbcdc,0x8f1bbcdc,0x8f1bbcdc
7216 .long 0xca62c1d6,0xca62c1d6,0xca62c1d6,0xca62c1d6
7217 .long 0xca62c1d6,0xca62c1d6,0xca62c1d6,0xca62c1d6
7218 .long 0x00010203,0x04050607,0x08090a0b,0x0c0d0e0f
7219 .long 0x00010203,0x04050607,0x08090a0b,0x0c0d0e0f
7220 .byte 0xf,0xe,0xd,0xc,0xb,0xa,0x9,0x8,0x7,0x6,0x5,0x4,0x3,0x2,0x1,0x0
7221 .byte 83,72,65,49,32,109,117,108,116,105,45,98,108,111,99,107,32,116,114,97,110,115,102,111,114,109,32,102,111,114,32,120,56,54,95,54,52,44,32,67,82,89,80,84,79,71,65,77,83,32,98,121,32,60,97,112,112,114,111,64,111,112,101,110,115,115,108,46,111,114,103,62,0
7222 .section .note.GNU-stack,"",%progbits