[doc] Fix HowToManuallyUseTheIndividualPiecesOfPolly
[polly-mirror.git] / docs / experiments / matmul / matmul.preopt.ll
blob6fe4352b2201d90f85ef7b31ee2d50646301cfa0
1 ; ModuleID = 'matmul.ll'
2 source_filename = "matmul.c"
3 target datalayout = "e-m:e-i64:64-f80:128-n8:16:32:64-S128"
4 target triple = "x86_64-unknown-linux-gnu"
6 %struct._IO_FILE = type { i32, i8*, i8*, i8*, i8*, i8*, i8*, i8*, i8*, i8*, i8*, i8*, %struct._IO_marker*, %struct._IO_FILE*, i32, i32, i64, i16, i8, [1 x i8], i8*, i64, i8*, i8*, i8*, i8*, i64, i32, [20 x i8] }
7 %struct._IO_marker = type { %struct._IO_marker*, %struct._IO_FILE*, i32 }
9 @A = common dso_local global [1536 x [1536 x float]] zeroinitializer, align 16
10 @B = common dso_local global [1536 x [1536 x float]] zeroinitializer, align 16
11 @stdout = external dso_local global %struct._IO_FILE*, align 8
12 @.str = private unnamed_addr constant [5 x i8] c"%lf \00", align 1
13 @C = common dso_local global [1536 x [1536 x float]] zeroinitializer, align 16
14 @.str.1 = private unnamed_addr constant [2 x i8] c"\0A\00", align 1
16 ; Function Attrs: noinline nounwind uwtable
17 define dso_local void @init_array() #0 {
18 entry:
19   br label %entry.split
21 entry.split:                                      ; preds = %entry
22   br label %for.cond1.preheader
24 for.cond1.preheader:                              ; preds = %entry.split, %for.inc17
25   %indvars.iv4 = phi i64 [ 0, %entry.split ], [ %indvars.iv.next5, %for.inc17 ]
26   br label %for.body3
28 for.body3:                                        ; preds = %for.cond1.preheader, %for.body3
29   %indvars.iv = phi i64 [ 0, %for.cond1.preheader ], [ %indvars.iv.next, %for.body3 ]
30   %0 = mul nuw nsw i64 %indvars.iv, %indvars.iv4
31   %1 = trunc i64 %0 to i32
32   %rem = and i32 %1, 1023
33   %add = add nuw nsw i32 %rem, 1
34   %conv = sitofp i32 %add to double
35   %div = fmul double %conv, 5.000000e-01
36   %conv4 = fptrunc double %div to float
37   %arrayidx6 = getelementptr inbounds [1536 x [1536 x float]], [1536 x [1536 x float]]* @A, i64 0, i64 %indvars.iv4, i64 %indvars.iv
38   store float %conv4, float* %arrayidx6, align 4
39   %arrayidx16 = getelementptr inbounds [1536 x [1536 x float]], [1536 x [1536 x float]]* @B, i64 0, i64 %indvars.iv4, i64 %indvars.iv
40   store float %conv4, float* %arrayidx16, align 4
41   %indvars.iv.next = add nuw nsw i64 %indvars.iv, 1
42   %exitcond = icmp ne i64 %indvars.iv.next, 1536
43   br i1 %exitcond, label %for.body3, label %for.inc17
45 for.inc17:                                        ; preds = %for.body3
46   %indvars.iv.next5 = add nuw nsw i64 %indvars.iv4, 1
47   %exitcond6 = icmp ne i64 %indvars.iv.next5, 1536
48   br i1 %exitcond6, label %for.cond1.preheader, label %for.end19
50 for.end19:                                        ; preds = %for.inc17
51   ret void
54 ; Function Attrs: noinline nounwind uwtable
55 define dso_local void @print_array() #0 {
56 entry:
57   br label %entry.split
59 entry.split:                                      ; preds = %entry
60   br label %for.cond1.preheader
62 for.cond1.preheader:                              ; preds = %entry.split, %for.end
63   %indvars.iv6 = phi i64 [ 0, %entry.split ], [ %indvars.iv.next7, %for.end ]
64   %0 = load %struct._IO_FILE*, %struct._IO_FILE** @stdout, align 8
65   br label %for.body3
67 for.body3:                                        ; preds = %for.cond1.preheader, %for.inc
68   %indvars.iv = phi i64 [ 0, %for.cond1.preheader ], [ %indvars.iv.next, %for.inc ]
69   %1 = phi %struct._IO_FILE* [ %0, %for.cond1.preheader ], [ %5, %for.inc ]
70   %arrayidx5 = getelementptr inbounds [1536 x [1536 x float]], [1536 x [1536 x float]]* @C, i64 0, i64 %indvars.iv6, i64 %indvars.iv
71   %2 = load float, float* %arrayidx5, align 4
72   %conv = fpext float %2 to double
73   %call = tail call i32 (%struct._IO_FILE*, i8*, ...) @fprintf(%struct._IO_FILE* %1, i8* getelementptr inbounds ([5 x i8], [5 x i8]* @.str, i64 0, i64 0), double %conv) #2
74   %3 = trunc i64 %indvars.iv to i32
75   %rem = urem i32 %3, 80
76   %cmp6 = icmp eq i32 %rem, 79
77   br i1 %cmp6, label %if.then, label %for.inc
79 if.then:                                          ; preds = %for.body3
80   %4 = load %struct._IO_FILE*, %struct._IO_FILE** @stdout, align 8
81   %fputc3 = tail call i32 @fputc(i32 10, %struct._IO_FILE* %4)
82   br label %for.inc
84 for.inc:                                          ; preds = %for.body3, %if.then
85   %indvars.iv.next = add nuw nsw i64 %indvars.iv, 1
86   %5 = load %struct._IO_FILE*, %struct._IO_FILE** @stdout, align 8
87   %exitcond = icmp ne i64 %indvars.iv.next, 1536
88   br i1 %exitcond, label %for.body3, label %for.end
90 for.end:                                          ; preds = %for.inc
91   %.lcssa = phi %struct._IO_FILE* [ %5, %for.inc ]
92   %fputc = tail call i32 @fputc(i32 10, %struct._IO_FILE* %.lcssa)
93   %indvars.iv.next7 = add nuw nsw i64 %indvars.iv6, 1
94   %exitcond8 = icmp ne i64 %indvars.iv.next7, 1536
95   br i1 %exitcond8, label %for.cond1.preheader, label %for.end12
97 for.end12:                                        ; preds = %for.end
98   ret void
101 declare dso_local i32 @fprintf(%struct._IO_FILE*, i8*, ...) #1
103 ; Function Attrs: noinline nounwind uwtable
104 define dso_local i32 @main() #0 {
105 entry:
106   br label %entry.split
108 entry.split:                                      ; preds = %entry
109   tail call void @init_array()
110   br label %for.cond1.preheader
112 for.cond1.preheader:                              ; preds = %entry.split, %for.inc28
113   %indvars.iv7 = phi i64 [ 0, %entry.split ], [ %indvars.iv.next8, %for.inc28 ]
114   br label %for.body3
116 for.body3:                                        ; preds = %for.cond1.preheader, %for.inc25
117   %indvars.iv4 = phi i64 [ 0, %for.cond1.preheader ], [ %indvars.iv.next5, %for.inc25 ]
118   %arrayidx5 = getelementptr inbounds [1536 x [1536 x float]], [1536 x [1536 x float]]* @C, i64 0, i64 %indvars.iv7, i64 %indvars.iv4
119   store float 0.000000e+00, float* %arrayidx5, align 4
120   br label %for.body8
122 for.body8:                                        ; preds = %for.body3, %for.body8
123   %indvars.iv = phi i64 [ 0, %for.body3 ], [ %indvars.iv.next, %for.body8 ]
124   %0 = load float, float* %arrayidx5, align 4
125   %arrayidx16 = getelementptr inbounds [1536 x [1536 x float]], [1536 x [1536 x float]]* @A, i64 0, i64 %indvars.iv7, i64 %indvars.iv
126   %1 = load float, float* %arrayidx16, align 4
127   %arrayidx20 = getelementptr inbounds [1536 x [1536 x float]], [1536 x [1536 x float]]* @B, i64 0, i64 %indvars.iv, i64 %indvars.iv4
128   %2 = load float, float* %arrayidx20, align 4
129   %mul = fmul float %1, %2
130   %add = fadd float %0, %mul
131   store float %add, float* %arrayidx5, align 4
132   %indvars.iv.next = add nuw nsw i64 %indvars.iv, 1
133   %exitcond = icmp ne i64 %indvars.iv.next, 1536
134   br i1 %exitcond, label %for.body8, label %for.inc25
136 for.inc25:                                        ; preds = %for.body8
137   %indvars.iv.next5 = add nuw nsw i64 %indvars.iv4, 1
138   %exitcond6 = icmp ne i64 %indvars.iv.next5, 1536
139   br i1 %exitcond6, label %for.body3, label %for.inc28
141 for.inc28:                                        ; preds = %for.inc25
142   %indvars.iv.next8 = add nuw nsw i64 %indvars.iv7, 1
143   %exitcond9 = icmp ne i64 %indvars.iv.next8, 1536
144   br i1 %exitcond9, label %for.cond1.preheader, label %for.end30
146 for.end30:                                        ; preds = %for.inc28
147   ret i32 0
150 ; Function Attrs: nounwind
151 declare i64 @fwrite(i8* nocapture, i64, i64, %struct._IO_FILE* nocapture) #2
153 ; Function Attrs: nounwind
154 declare i32 @fputc(i32, %struct._IO_FILE* nocapture) #2
156 attributes #0 = { noinline nounwind uwtable "correctly-rounded-divide-sqrt-fp-math"="false" "disable-tail-calls"="false" "less-precise-fpmad"="false" "no-frame-pointer-elim"="true" "no-frame-pointer-elim-non-leaf" "no-infs-fp-math"="false" "no-jump-tables"="false" "no-nans-fp-math"="false" "no-signed-zeros-fp-math"="false" "no-trapping-math"="false" "stack-protector-buffer-size"="8" "target-cpu"="x86-64" "target-features"="+fxsr,+mmx,+sse,+sse2,+x87" "unsafe-fp-math"="false" "use-soft-float"="false" }
157 attributes #1 = { "correctly-rounded-divide-sqrt-fp-math"="false" "disable-tail-calls"="false" "less-precise-fpmad"="false" "no-frame-pointer-elim"="true" "no-frame-pointer-elim-non-leaf" "no-infs-fp-math"="false" "no-nans-fp-math"="false" "no-signed-zeros-fp-math"="false" "no-trapping-math"="false" "stack-protector-buffer-size"="8" "target-cpu"="x86-64" "target-features"="+fxsr,+mmx,+sse,+sse2,+x87" "unsafe-fp-math"="false" "use-soft-float"="false" }
158 attributes #2 = { nounwind }
160 !llvm.module.flags = !{!0}
161 !llvm.ident = !{!1}
163 !0 = !{i32 1, !"wchar_size", i32 4}
164 !1 = !{!"clang version 8.0.0 (trunk 342834) (llvm/trunk 342856)"}