[Polly] [DependenceInfo] change WAR generation, Read will not block Read
[polly-mirror.git] / test / DependenceInfo / do_pluto_matmult.ll
blob66a05f9e825e3df637e9f63ffb81bd0dc0781edd
1 ; RUN: opt %loadPolly -basicaa -polly-dependences -analyze -polly-dependences-analysis-type=value-based < %s | FileCheck %s -check-prefix=VALUE
2 ; RUN: opt %loadPolly -basicaa -polly-dependences -analyze -polly-dependences-analysis-type=memory-based < %s | FileCheck %s -check-prefix=MEMORY
3 ; RUN: opt %loadPolly -basicaa -polly-function-dependences -analyze -polly-dependences-analysis-type=value-based < %s | FileCheck %s -check-prefix=FUNC-VALUE
4 ; RUN: opt %loadPolly -basicaa -polly-function-dependences -analyze -polly-dependences-analysis-type=memory-based < %s | FileCheck %s -check-prefix=FUNC-MEMORY
6 target datalayout = "e-p:64:64:64-i1:8:8-i8:8:8-i16:16:16-i32:32:32-i64:64:64-f32:32:32-f64:64:64-v64:64:64-v128:128:128-a0:0:64-s0:64:64-f80:128:128-n8:16:32:64"
8 %struct._IO_FILE = type { i32, i8*, i8*, i8*, i8*, i8*, i8*, i8*, i8*, i8*, i8*, i8*, %struct._IO_marker*, %struct._IO_FILE*, i32, i32, i64, i16, i8, [1 x i8], i8*, i64, i8*, i8*, i8*, i8*, i64, i32, [20 x i8] }
9 %struct._IO_marker = type { %struct._IO_marker*, %struct._IO_FILE*, i32 }
11 @A = common global [36 x [49 x double]] zeroinitializer, align 8 ; <[36 x [49 x double]]*> [#uses=3]
12 @B = common global [36 x [49 x double]] zeroinitializer, align 8 ; <[36 x [49 x double]]*> [#uses=3]
13 @C = common global [36 x [49 x double]] zeroinitializer, align 8 ; <[36 x [49 x double]]*> [#uses=4]
15 define void @do_pluto_matmult() nounwind {
16 entry:
17   fence seq_cst
18   br label %do.body
20 do.body:                                          ; preds = %do.cond42, %entry
21   %indvar3 = phi i64 [ %indvar.next4, %do.cond42 ], [ 0, %entry ] ; <i64> [#uses=3]
22   br label %do.body1
24 do.body1:                                         ; preds = %do.cond36, %do.body
25   %indvar1 = phi i64 [ %indvar.next2, %do.cond36 ], [ 0, %do.body ] ; <i64> [#uses=3]
26   %arrayidx5 = getelementptr [36 x [49 x double]], [36 x [49 x double]]* @C, i64 0, i64 %indvar3, i64 %indvar1 ; <double*> [#uses=2]
27   br label %do.body2
29 do.body2:                                         ; preds = %do.cond, %do.body1
30   %indvar = phi i64 [ %indvar.next, %do.cond ], [ 0, %do.body1 ] ; <i64> [#uses=3]
31   %arrayidx13 = getelementptr [36 x [49 x double]], [36 x [49 x double]]* @A, i64 0, i64 %indvar3, i64 %indvar ; <double*> [#uses=1]
32   %arrayidx22 = getelementptr [36 x [49 x double]], [36 x [49 x double]]* @B, i64 0, i64 %indvar, i64 %indvar1 ; <double*> [#uses=1]
33   %tmp6 = load double, double* %arrayidx5                 ; <double> [#uses=1]
34   %mul = fmul double 1.000000e+00, %tmp6          ; <double> [#uses=1]
35   %tmp14 = load double, double* %arrayidx13               ; <double> [#uses=1]
36   %mul15 = fmul double 1.000000e+00, %tmp14       ; <double> [#uses=1]
37   %tmp23 = load double, double* %arrayidx22               ; <double> [#uses=1]
38   %mul24 = fmul double %mul15, %tmp23             ; <double> [#uses=1]
39   %add = fadd double %mul, %mul24                 ; <double> [#uses=1]
40   store double %add, double* %arrayidx5
41   br label %do.cond
43 do.cond:                                          ; preds = %do.body2
44   %indvar.next = add i64 %indvar, 1               ; <i64> [#uses=2]
45   %exitcond = icmp ne i64 %indvar.next, 36        ; <i1> [#uses=1]
46   br i1 %exitcond, label %do.body2, label %do.end
48 do.end:                                           ; preds = %do.cond
49   br label %do.cond36
51 do.cond36:                                        ; preds = %do.end
52   %indvar.next2 = add i64 %indvar1, 1             ; <i64> [#uses=2]
53   %exitcond5 = icmp ne i64 %indvar.next2, 36      ; <i1> [#uses=1]
54   br i1 %exitcond5, label %do.body1, label %do.end39
56 do.end39:                                         ; preds = %do.cond36
57   br label %do.cond42
59 do.cond42:                                        ; preds = %do.end39
60   %indvar.next4 = add i64 %indvar3, 1             ; <i64> [#uses=2]
61   %exitcond6 = icmp ne i64 %indvar.next4, 36      ; <i1> [#uses=1]
62   br i1 %exitcond6, label %do.body, label %do.end45
64 do.end45:                                         ; preds = %do.cond42
65   fence seq_cst
66   ret void
69 ; VALUE:      RAW dependences:
70 ; VALUE-NEXT:     { Stmt_do_body2[i0, i1, i2] -> Stmt_do_body2[i0, i1, 1 + i2] : 0 <= i0 <= 35 and 0 <= i1 <= 35 and 0 <= i2 <= 34 }
71 ; VALUE-NEXT: WAR dependences:
72 ; VALUE-NEXT: { Stmt_do_body2[i0, i1, i2] -> Stmt_do_body2[i0, i1, 1 + i2] : 0 <= i0 <= 35 and 0 <= i1 <= 35 and 0 <= i2 <= 34 }
73 ; VALUE-NEXT: WAW dependences:
74 ; VALUE-NEXT:     { Stmt_do_body2[i0, i1, i2] -> Stmt_do_body2[i0, i1, 1 + i2] : 0 <= i0 <= 35 and 0 <= i1 <= 35 and 0 <= i2 <= 34 }
76 ; MEMORY:      RAW dependences:
77 ; MEMORY-NEXT:     { Stmt_do_body2[i0, i1, i2] -> Stmt_do_body2[i0, i1, o2] : 0 <= i0 <= 35 and 0 <= i1 <= 35 and i2 >= 0 and i2 < o2 <= 35 }
78 ; MEMORY-NEXT: WAR dependences:
79 ; MEMORY-NEXT:     { Stmt_do_body2[i0, i1, i2] -> Stmt_do_body2[i0, i1, o2] : 0 <= i0 <= 35 and 0 <= i1 <= 35 and i2 >= 0 and i2 < o2 <= 35 }
80 ; MEMORY-NEXT: WAW dependences:
81 ; MEMORY-NEXT:     { Stmt_do_body2[i0, i1, i2] -> Stmt_do_body2[i0, i1, o2] : 0 <= i0 <= 35 and 0 <= i1 <= 35 and i2 >= 0 and i2 < o2 <= 35 }
83 ; FUNC-VALUE:      RAW dependences:
84 ; FUNC-VALUE-NEXT:     { [Stmt_do_body2[i0, i1, i2] -> Stmt_do_body2_Write3_MemRef_C[]] -> [Stmt_do_body2[i0, i1, 1 + i2] -> Stmt_do_body2_Read0_MemRef_C[]] : 0 <= i0 <= 35 and 0 <= i1 <= 35 and 0 <= i2 <= 34; Stmt_do_body2[i0, i1, i2] -> Stmt_do_body2[i0, i1, 1 + i2] : 0 <= i0 <= 35 and 0 <= i1 <= 35 and 0 <= i2 <= 34 }
85 ; FUNC-VALUE-NEXT: WAR dependences:
86 ; FUNC-VALUE-NEXT:     { }
87 ; FUNC-VALUE-NEXT: WAW dependences:
88 ; FUNC-VALUE-NEXT:     { [Stmt_do_body2[i0, i1, i2] -> Stmt_do_body2_Write3_MemRef_C[]] -> [Stmt_do_body2[i0, i1, 1 + i2] -> Stmt_do_body2_Write3_MemRef_C[]] : 0 <= i0 <= 35 and 0 <= i1 <= 35 and 0 <= i2 <= 34; Stmt_do_body2[i0, i1, i2] -> Stmt_do_body2[i0, i1, 1 + i2] : 0 <= i0 <= 35 and 0 <= i1 <= 35 and 0 <= i2 <= 34 }
90 ; FUNC-MEMORY:      RAW dependences:
91 ; FUNC-MEMORY-NEXT:     { [Stmt_do_body2[i0, i1, i2] -> Stmt_do_body2_Write3_MemRef_C[]] -> [Stmt_do_body2[i0, i1, o2] -> Stmt_do_body2_Read0_MemRef_C[]] : 0 <= i0 <= 35 and 0 <= i1 <= 35 and i2 >= 0 and i2 < o2 <= 35; Stmt_do_body2[i0, i1, i2] -> Stmt_do_body2[i0, i1, o2] : 0 <= i0 <= 35 and 0 <= i1 <= 35 and i2 >= 0 and i2 < o2 <= 35 }
92 ; FUNC-MEMORY-NEXT: WAR dependences:
93 ; FUNC-MEMORY-NEXT:     { [Stmt_do_body2[i0, i1, i2] -> Stmt_do_body2_Read0_MemRef_C[]] -> [Stmt_do_body2[i0, i1, o2] -> Stmt_do_body2_Write3_MemRef_C[]] : 0 <= i0 <= 35 and 0 <= i1 <= 35 and i2 >= 0 and i2 < o2 <= 35; Stmt_do_body2[i0, i1, i2] -> Stmt_do_body2[i0, i1, o2] : 0 <= i0 <= 35 and 0 <= i1 <= 35 and i2 >= 0 and i2 < o2 <= 35 }
94 ; FUNC-MEMORY-NEXT: WAW dependences:
95 ; FUNC-MEMORY-NEXT:     { [Stmt_do_body2[i0, i1, i2] -> Stmt_do_body2_Write3_MemRef_C[]] -> [Stmt_do_body2[i0, i1, o2] -> Stmt_do_body2_Write3_MemRef_C[]] : 0 <= i0 <= 35 and 0 <= i1 <= 35 and i2 >= 0 and i2 < o2 <= 35; Stmt_do_body2[i0, i1, i2] -> Stmt_do_body2[i0, i1, o2] : 0 <= i0 <= 35 and 0 <= i1 <= 35 and i2 >= 0 and i2 < o2 <= 35 }