Moggy: can_be_captured() -> can_play_on_lib()
[pachi.git] / TESTS
blob87878d36b72f6f416d1f131edd8ccf36a67455aa
1 Default settings, 5000 playouts.
2 Opponent: gnugo --mode gtp --chinese-rules --capture-all-dead --level 10
3 GNUGo 3.7.12
5 gnugo 19x19 l1 vs l10 k 7.5:    29% (+-2.3%)
6 gnugo 19x19 l1 vs l10 k 0.5:    42.2% (+-2.5%)
7 gnugo 19x19 l1 vs l10 k -7.5:   52.5% (+-2.5%)
8 gnugo 19x19 l1 vs l10 k -14.5:  62.2% (+-2.4%)
9 gnugo 19x19 l1 vs l10 handi 2:  56.7% (+-2.5%)
12 Unfortunately, some early measurements use 95% confidence interval; all newer
13 ones use the standard error (/1.96) instead, since that's what gogui-twogtp
14 provides.
17 Template:
18 ../../gogui-1.1.10/bin/gogui-twogtp -black  'gnugo --mode gtp --chinese-rules --capture-all-dead --level 10' -white './zzgo-77d2d games=5000,policy=ucb1amaf,playout=moggy' -alternate -auto -verbose -size 9 -komi 7.5 -games 100 -sgffile f1-77d2d
19 for i in *.dat; do ../../gogui-1.1.10/bin/gogui-twogtp -force -analyze $i; done
20 ./test_in_context.sh <directory with results> 9
22 ead8e   ucb1amaf        16.5% (+-4.5%)
24 b2185   ucb1amaf        50% (+-6%)
26 75fff   ucb1amaf        49% (+-4%)
28 c5bea   ucb1amaf        42.5% (+-2.5%)
30 95bf3   ucb1amaf        25.2% (+-4%)
32 c7249   ucb1amaf        34.2% (+-4.8%)
34 9367d   ucb1amaf        37% (+-8%)
36 ce540   ucb1amaf*       42% (+-2%)      selfatarirate=0
37 ce540   ucb1amaf        43% (+-2%)
39 62592   ucb1amaf*       47% (+-2.5%)    selfatarirate=0
40 62592   ucb1amaf        44% (+-2.5%)
41 62592   ucb1amaf*#      45.2% (+-2.5%)  selfatarirate=0,rave_prior
42 62592   ucb1amaf#       47.5% (+-2.5%)  rave_prior
44 1a1eb   ucb1            15% (+-2%)      selfatarirate=0:capturerate=0:lcapturerate=0
46 6e22f   ucb1amaf        49.5% (+-2.5%)
47 6e22f   ucb1amaf*0      48% (+-2.5%)    rave_equiv=6000
48 6e22f   ucb1amaf*1      49% (+-2.5%)    rave_equiv=500
49 6e22f   ucb1amaf#       43.2% (+-2.5%)  explore_p=0
50 6e22f   ucb1amaf#*0     45.8% (+-2.5%)  explore_p=0,rave_equiv=6000
51 6e22f   ucb1amaf#*1     48.8% (+-2.5%)  explore_p=0,rave_equiv=500
52 6e22f   ucb1amaf#0      49.5% (+-2.5%)  explore_p=0.01
53 6e22f   ucb1amaf#1      24.8% (+-2.5%)  explore_p=0.5
54 6e22f   19x19 ucb1amaf  0%
55 6e22f   19x19 ucb1amaf* 0%      explore_p=0.01,rave_equiv=100
57 88fe2   ucb1amaf        50.8% (+-2.5%)
58 88fe2   ucb1amaf*       49.5% (+-2.5%)  selfatarirate=0
60 04b7b   ucb1amaf        60.5% (+-2.4%)
61 04b7b   ucb1amaf*       60.2% (+-2.4%)  selfatarirate=0
62 04b7b   ucb1amaf%1      58.5% (+-2.5%)  rate=75
63 04b7b   ucb1amaf%2      60.8% (+-2.4%)  rate=100
64 04b7b   ucb1amaf#       54.5% (+-2.5%)  explore_p=0
65 04b7b   ucb1amaf^       63.5% (+-2.4%)  threads=2
66 04b7b   ucb1amaf+       71.2% (+-2.3%)  games=10000
67 04b7b   ucb1amaf!       79.5% (+-2%)    playout_amaf
68 04b7b   ucb1amaf!&      46% (+-2.5%)    playout_amaf,patternrate=0
70 82790   ucb1amaf        54.1% (+-2.9%)
71 82790   ucb1amaf!       79% (+-2.9%)    playout_amaf
73 129bb   ucb1amaf        64.5% (+-2.4%)
74 129bb   ucb1amaf!       77.2% (+-2.1%)  playout_amaf
76 <playout_amaf_nakade on by default>
78 605dd   ucb1amaf        56.2% (+-2.5%)
79 605dd   ucb1amaf!       63.5% (+-2.4%)  playout_amaf
81 <unknown playout_amaf regression>
83 c031a   ucb1amaf        52.5% (+-4.2%)
84 c031a   ucb1amaf!       63.4% (+-4.2%)  playout_amaf
86 87b9e   ucb1amaf        53.7% (+-2.1%)
87 87b9e   ucb1amaf#1      59.5% (+-1.7%)  explore_p_rave=0
88 87b9e   ucb1amaf#2      59.1% (+-1.7%)  explore_p=0.01,explore_p_rave=0.01
89 87b9e   ucb1amaf%       56.6% (+-2%)    local_assess
90 87b9e   ucb1amaf*       19% (+-1.3%)    patternrate=0
91 87b9e   ucb1amaf!$      62.8% (+-2.4%)  playout_amaf,rave_equiv=500
92 87b9e   ucb1amaf!#1     62.8% (+-1.7%)  playout_amaf,explore_p=0.01,explore_p_rave=0.01
93 87b9e   ucb1amaf!#2     61.6% (+-1.7%)  playout_amaf,explore_p_rave=0.01
94 87b9e   ucb1amaf!&      61.8% (+-2.4%)  playout_amaf,eqex=25
95 87b9e   ucb1amaf!       61.4% (+-2.1%)  playout_amaf
97 <playout_amaf is now default>
99 093e7   ucb1amaf        60.5% (+-2.4%)
100 093e7   ucb1amaf!       58.8% (+-2.5%)  plaout_amaf=0
101 093e7   ucb1amaf%       60.8% (+-2.4%)  ladders=0
103 <playout_amaf_nakade partially off>
105 635a3   ucb1amaf        65% (+-2.4%)
106 635a3   ucb1amaf        63% (+-2.4%)    explore_p_rave=0.01
108 <playout_amaf_nakade off by default>
110 eac23   ucb1amaf        77.4% (+-1.5%)
111 eac23   ucb1amaf#       76.6% (+-1.5%)  explore_p_rave=0.01
112 eac23   ucb1amaf!       74.3% (+-1.5%)  check_nakade=0
113 eac23   ucb1amaf!#      75.5% (+-1.6%)  check_nakade=0,explore_p_rave=0.01
114 eac23   ucb1amaf!#*     75% (+-1.5%)    check_nakade=0,explore_p_rave=0.01,explore_p=0.01
116 <explore_p_rave=0.01>
118 229b9   ucb1amaf 2k     65.5% (+-2.4%)
119 229b9   ucb1amaf 5k     77.5% (+-2.1%)
120 229b9   ucb1amaf 20k    83.8% (+-1.7%)
121 229b9   ucb1amaf 50k    90% (+-1.5%)
122 229b9   ucb1amaf! 2k    37.8% (+-2.4%)  playout_amaf=0
123 229b9   ucb1amaf! 5k    59% (+-2.5%)    playout_amaf=0
124 229b9   ucb1amaf! 20k   79% (+-2%)      playout_amaf=0
125 229b9   ucb1amaf! 50k   83.5% (+-1.9%)  playout_amaf=0
126 229b9   ucb1amaf% 5k    77.2% (+-2.1%)  ladders=0
127 229b9   ucb1amaf*# 5k   74.9% (+-2.2%)  explore_p=0.005,explore_p_rave=0.005
129 self-play:
130 229b9   ucb1amaf km5.5  B+57.5% (+-2.5%)
131 229b9   ucb1amaf km7.5  B+48.8% (+-2.5%)
133 2d54a   ucb1amaf        72.2% (+-2.2%)
135 8ac8a   ucb1amaf        77% (+-2.1%)
136 8ac8a   ucb1amaf@       77% (+-2.1%)    ladder catcher atari check disabled
137 8ac8a   ucb1amaf 50k    93.5% (+-1.2%)
140 fccfe   ucb1amaf        78% (+-2.1%)
141 fccfe   ucb1amaf#       78.5% (+-2.1%)  rave_prior=0
142 fccfe   ucb1amaf*0      76% (+-2.1%)    playout_amaf_cutoff=50
143 fccfe   ucb1amaf*0!     78.5% (+-2.1%)  playout_amaf_cutoff=50,playout_amaf_nakade=1
144 fccfe   ucb1amaf*1      79.8% (+-2%)    playout_amaf_cutoff=75
145 fccfe   ucb1amaf*1!     74% (+-2.2%)    playout_amaf_cutoff=75,playout_amaf_nakade=1
146 fccfe   ucb1amaf*2      76.7% (+-2.1%)  playout_amaf_cutoff=85
147 fccfe   ucb1amaf*2!     77% (+-2.1%)    playout_amaf_cutoff=85,playout_amaf_nakade=1
148 fccfe   ucb1amaf*3      72% (+-2.2%)    playout_amaf_cutoff=90
149 fccfe   ucb1amaf*3!     73% (+-2.2%)    playout_amaf_cutoff=90,playout_amaf_nakade=1
150 fccfe   ucb1amaf*3      72% (+-2.2%)    playout_amaf_cutoff=90
151 fccfe   ucb1amaf*3!     73% (+-2.2%)    playout_amaf_cutoff=90,playout_amaf_nakade=1
153 Threading test:
154 fccfe   ucb1amaf        78% (+-2.1%)
155 fccfe   ucb1amaf 10k    79.8% (+-2%)
156 fccfe   ucb1amaf t=2    75.5% (+-2.2%)
157 569d7   ucb1amaf t=2    82.9% (+-1.9%)
160 <Multiple board sizes from now on>
162 Fillboard investigations (only 4-lib fillboard yet):
164 569d7   9ucb1amaf!      81.2% (+-2%)    fillboardtries=10
165 569d7   9ucb1amaf 50k   90% (+-1.5%)
166 569d7   9ucb1amaf! 50k  90.8% (+-1.4%)  fillboardtries=10
168 ce382   13ucb1amaf      51.8% (+-2.5%)
169 ce382   13ucb1amaf 50k  79.6% (+-2.6%)
170 569d7   13ucb1amaf!     47% (+-2.5%)    fillboardtries=10
171 569d7   13ucb1amaf! 50k 82.8% (+-2.4%)  fillboardtries=10
174 <many optimizations>
176 4181b   9ucb1amaf       76% (+-2.4%)
177 4181b   13ucb1amaf      47.8% (+-2.5%)
178 4181b   19ucb1amaf      1.6% (+-0.9%)
179 4181b   19ucb1amaf!     1% (+-0.7%)     fillboardtries=10
182 0965e   9ucb1amaf       77.5% (+-2.1%)
183 0965e   9ucb1amaf#      9.5% (+-1.5%)   sylvain_rave=0
184 0965e   9ucb1amaf&      79% (+-2.1%)    self-atari protection turned off for single-stone groups
186 0965e   13ucb1amaf      45.2% (+-2.5%)
187 0965e   13ucb1amaf&     52.2% (+-2.5%)  self-atari protection turned off for single-stone groups
189 <permit snapbacks>
191 234b3   9ucb1amaf       77.2% (+-2.1%)
192 234b3   13ucb1amaf      47% (+-2.5%)
195 <add pattern2>
197 035fc   9ucb1amaf       70.5% (+-2.3%)
198 035fc   9ucb1amaf#      79.8% (+-2%)    pattern2=0
200 <add 2-liberty>
202 74b71   9ucb1amaf       74.2% (+-2.2%)
203 74b71   9ucb1amaf#      77% (+-2.1%)    pattern2=0
204 74b71   13ucb1amaf      46.8% (+-2.5%)
205 74b71   13ucb1amaf#     50.2% (+-2.5%)  pattern2=0
207 e34f9   9ucb1amaf       74.2% (+-2.2%)
208 e34f9   9ucb1amaf#      74% (+-2.2%)    pattern2=0
209 e34f9   9ucb1amaf*      76% (+-2.1%)    atarirate=0
210 e34f9   9ucb1amaf#*     79% (+-2%)      pattern2=0,atarirate=0
211 e34f9   13ucb1amaf      47.2% (+-2.5%)
212 e34f9   13ucb1amaf#     49.7% (+-2.8%)  pattern2=0
213 e34f9   13ucb1amaf#*    52.2% (+-2.5%)  pattern2=0,atarirate=0
215 ba2e1   9ucb1amaf       78.2% (+-2.1%)
216 ba2e1   9ucb1amaf#      81.8% (+-1.9%)  pattern2=0
217 ba2e1   9ucb1amaf*      74.5% (+-2.2%)  atarirate=0
218 ba2e1   9ucb1amaf#*     75.5% (+-2.2%)  pattern2=0,atarirate=0
219 ba2e1   9ucb1amaf#*+    78.5% (+-2.1%)  pattern2=0,atarirate=0,prior_cfgd=6
220 ba2e1   9ucb1amaf+%     81.2% (+-2%)    prior_cfgd=6,prior_b19=6
221 ba2e1   9ucb1amaf#+%    83% (+-1.9%)    pattern2=0,prior_cfgd=6,prior_b19=6
223 ba2e1   13ucb1amaf+     57% (+-2.5%)    prior_cfgd=6
224 ba2e1   13ucb1amaf+%    51.2% (+-2.5%)  prior_cfgd=6,prior_b19=6
225 ba2e1   13ucb1amaf#*+   54.8% (+-2.5%)  pattern2=0,atarirate=0,prior_cfgd=6
227 ba2e1   19ucb1amaf+!    13.8% (+-1.7%)  prior_cfgd=6,fillboard
228 ba2e1   19ucb1amaf+%2   21.2% (+-2%)    prior_cfgd=prior_b19=prior=20
229 ba2e1   19ucb1amaf+%2!  20.5% (+-2%)    prior_cfgd=prior_b19=prior=20,fillboard
230 ba2e1   19ucb1amaf+%3   20.8% (+-2%)    prior_cfgd=prior_b19=prior=30
231 ba2e1   19ucb1amaf+%4   25.8% (+-2.2%)  prior_cfgd=prior_b19=prior=40
232 ba2e1   19ucb1amaf+%5   23.2% (+-2.1%)  prior_cfgd=prior_b19=prior=50
233 ba2e1   19ucb1amaf+%4   24.5% (+-2.2%)  prior_cfgd=prior_b19=prior=40,amaf_prior=0
234 ba2e1   19ucb1amaf#*+%! 9.8% (+-1.5%)   pattern2=0,atarirate=0,prior_cfgd=prior_b19=6,fillboard
235 ba2e1   19ucb1amaf#*+%2 25% (+-2.2%)    pattern2=0,atarirate=0,prior_cfgd=prior_b19=prior=20
236 ba2e1   19ucb1amaf#+%2  26.5% (+-2.2%)  pattern2=0,prior_cfgd=prior_b19=prior=20
237 ba2e1   19ucb1amaf#+%3  24% (+-2.2%)    pattern2=0,prior_cfgd=prior_b19=prior=30
238 ba2e1   19ucb1amaf#+%4  27% (+-2.2%)    pattern2=0,prior_cfgd=prior_b19=prior=40
239 ba2e1   19ucb1amaf#+%2! 22.5% (+-2.1%)  pattern2=0,prior_cfgd=prior_b19=prior=20,fillboard
240 ba2e1   19ucb1amaf#+%2_ 23.5% (+-2.1%)  pattern2=0,prior_cfgd=prior_b19=prior=20,prior_policy=10
241 ba2e1   19ucb1amaf#+%2a 1% (+-0.7%)     pattern2=0,prior_cfgd=prior_b19=prior=20,playouts=1000
242 ba2e1   19ucb1amaf#+%2b 7.2% (+-1.4%)   pattern2=0,prior_cfgd=prior_b19=prior=20,playouts=2000
243 ba2e1   19ucb1amaf#+%2  28.2% (+-2.3%)  pattern2=0,prior_cfgd=prior_b19=prior=20,amaf_prior=0
245 <pattern2=0, prior_cfgd=prior_b19=-1, etc.>
246 <From now on, 19x19 always has % = prior=20>
248 49208   9ucb1amaf       80% (+-2%)
249 49208   9ucb1amaf&      76.8% (+-2.1%)  selfatarirate=0
250 49208   9ucb1amaf_      76.8% (+-2.1%)  can_capture_group() always true (really same rate)
251 49208   19ucb1amaf%     25.4% (+-2.3%)
252 49208   19ucb1amaf%&    18.8% (+-2%)    selfatarirate=0
253 49208   19ucb1amaf%_    19.5% (+-2%)    can_capture_group() always true (really same rate)
255 d11b1   9ucb1amaf       81.8% (+-1.9%)  
256 d11b1   9ucb1amaf_      81.5% (+-1.9%)  investigate all nakade neis only in case of snapback (945e5)
257 d11b1   9ucb1amaf*      81.2% (+-2%)    atarirate=0
258 d11b1   9ucb1amaf&      78.8% (+-2.1%)  explore_p_rave=0
260 <d11b1_&, explore coefficient outside of RAVE>
262 a0f85   9ucb1amaf       80.2% (+-2%)
263 a0f85   9ucb1amaf*1     80.8% (+-2%)    explore_p=0
264 a0f85   9ucb1amaf*2     81.2% (+-2%)    explore_p=0.01
265 a0f85   9ucb1amaf*3     40.2% (+-2.5%)  explore_p=0.6
267 <UCT value tracking>
269 5524c   9ucb1amaf       84.2% (+-1.8%)
270 5524c   9ucb1amaf^1     70.2% (+-3%)    fuego cfgd
271 5524c   9ucb1amaf^2     77% (+-2.1%)    fuego cfgd, 0.1 for pass
272 5524c   9ucb1amaf^2*    76.5% (+-2.1%)  fuego cfgd, 0.1 for pass, prior_cfgd=4
273 5524c   9ucb1amaf!      81.2% (+-2%)    prior_even is 0.1 for pass
275 5524c   19ucb1amaf%     19.8% (+-2%)
276 5524c   19ucb1amaf%^1   13.2% (+-1.7%)  fuego cfgd
277 5524c   19ucb1amaf%^2   12.5% (+-1.7%)  fuego cfgd, 0.1 for pass
278 5524c   19ucb1amaf%^2*  16.2% (+-1.8%)  fuego cfgd, 0.1 for pass, prior_cfgd=5
279 5524c   19ucb1amaf!     19.6% (+-2%)    prior_even is 0.3 for pass
281 2151a   9ucb1amaf       81.5% (+-1.9%)
282 443e1   9ucb1amaf_1     72.5% (+-2.2%)  Priors just like in Fuego
283 6c6cb   9ucb1amaf_2     70.5% (+-2.3%)  Priors just like in Fuego, including equivalent-best-move
285 2151a   19ucb1amaf      16.8% (+-1.9%)
286 443e1   19ucb1amaf_1    12.2% (+-1.6%)  Priors just like in Fuego
287 6c6cb   19ucb1amaf_2    19.5% (+-2%)    Priors just like in Fuego, including equivalent-best-move
289 03c36   19ucb1amaf%$    17.2% (+-1.9%)  ko=-1, without ko aging yet
291 09368   9ucb1amaf       80.2% (+-2%)
292 09368   9ucb1amaf$      80% (+-2%)      ko=-1
293 09368   9ucb1amaf^      79% (+-2%)      eye=0
294 09368   9ucb1amaf$^     77.2% (+-2.1%)  ko=-1,eye=0
296 a1353   19u1a%*         61.8% (+-3.2%)  10k
297 a1353   19u1a%^1 k-14.5 29.2% (+-2.3%)  dynkomi=150
298 a1353   19u1a% k-14.5   29% (+-2.3%)
299 a1353   19u1a%^1 k-7.5  30% (+-2.3%)    dynkomi=150
300 a1353   19u1a% k-7.5    26.5% (+-2.2%)
301 a1353   19u1a%*^1 k0.5  41.6% (+-3%)    10k, dynkomi=150
302 a1353   19u1a%* k0.5    45.1% (+-3%)    10k
303 a1353   19u1a% k0.5     24% (+-2.1%)
304 a1353   19u1a%^0 k0.5   25.8% (+-2.2%)  dynkomi=100
305 a1353   19u1a%^1 k0.5   24.2% (+-2.1%)  dynkomi=150
306 a1353   19u1a%^2 k0.5   25% (+-2.2%)    dynkomi=200
308 a1267   9ucb1amaf       80.1% (+-2%)
309 a1267   9ucb1amaf~20    20.3% (+-2%)    val_scale=0.15,val_points=10
310 a1267   9ucb1amaf~21    6% (+-1.2%)     val_scale=0.15,val_points=20
311 a1267   9ucb1amaf~22    2.5% (+-0.8%)   val_scale=0.15,val_points=30
312 a1267   9ucb1amaf~00    20.2% (+-1.2%)  val_scale=0.05,val_points=10
313 a1267   9ucb1amaf~11    5.8% (+-1.2%)   val_scale=0.10,val_points=20
314 a1267   9ucb1amaf~31    6.5% (+-2%)     val_scale=0.20,val_points=20
315 a1267   9ucb1amaf~a0    18% (+-1.9%)    val_scale=0.01,val_points=10
316 a1267   9ucb1amaf~a1    3.5% (+-0.9%)   val_scale=0.01,val_points=20
317 a1267   9ucb1amaf~b1    6.8% (+-1.3%)   val_scale=0.02,val_points=20
318 a1267   9ucb1amaf~bx    2.3% (+-0.7$)   val_scale=0.02,val_points=80
320 2b830   9ucb1amaf       73% (+-2.2%)
321 2b830   9ucb1amaf_      79% (+-2%)      global atari check picks moves across all atari groups
322 2b830   9ucb1amaf~b1    3.8% (+-1%)     val_scale=0.02,val_points=20
325 TODO: playout_amaf with weight 1/2, sibling_amaf with weight 1, 1/2