UCT: bestr_ratio 0.02 by default, best2_ratio 2.5 by default
[pachi/t.git] / t-play / TESTS
blobb9da85c049bbaaf435564868ce883f97c2c22e59
1 Default settings, 5000 playouts.
2 Opponent: gnugo --mode gtp --chinese-rules --capture-all-dead --level 10
3 GNUGo 3.7.12
5 gnugo 19x19 l1 vs l10 k 7.5:    29% (+-2.3%)
6 gnugo 19x19 l1 vs l10 k 0.5:    42.2% (+-2.5%)
7 gnugo 19x19 l1 vs l10 k -7.5:   52.5% (+-2.5%)
8 gnugo 19x19 l1 vs l10 k -14.5:  62.2% (+-2.4%)
9 gnugo 19x19 l1 vs l10 k -21.5:  71.5% (+-2.3%)
10 gnugo 19x19 l1 vs l10 k -28.5:  78.2% (+-2.1%)
11 gnugo 19x19 l1 vs l10 handi 2:  54.7% (+-2.1%)
12 gnugo 19x19 l1 vs l10 handi 3:  71.9% (+-2.2%)
13 gnugo 19x19 l1 vs l10 handi 4:  82.6% (+-1.9%)
14 gnugo 19x19 l1 vs l10 handi 5:  88.9% (+-1.6%)
17 Unfortunately, some early measurements use 95% confidence interval; all newer
18 ones use the standard error (/1.96) instead, since that's what gogui-twogtp
19 provides.
22 Template:
23 ../../gogui-1.1.10/bin/gogui-twogtp -black  'gnugo --mode gtp --chinese-rules --capture-all-dead --level 10' -white './zzgo-77d2d games=5000,policy=ucb1amaf,playout=moggy' -alternate -auto -verbose -size 9 -komi 7.5 -games 100 -sgffile f1-77d2d
24 for i in *.dat; do ../../gogui-1.1.10/bin/gogui-twogtp -force -analyze $i; done
25 ./test_in_context.sh <directory with results> 9
27 ead8e   ucb1amaf        16.5% (+-4.5%)
29 b2185   ucb1amaf        50% (+-6%)
31 75fff   ucb1amaf        49% (+-4%)
33 c5bea   ucb1amaf        42.5% (+-2.5%)
35 95bf3   ucb1amaf        25.2% (+-4%)
37 c7249   ucb1amaf        34.2% (+-4.8%)
39 9367d   ucb1amaf        37% (+-8%)
41 ce540   ucb1amaf*       42% (+-2%)      selfatarirate=0
42 ce540   ucb1amaf        43% (+-2%)
44 62592   ucb1amaf*       47% (+-2.5%)    selfatarirate=0
45 62592   ucb1amaf        44% (+-2.5%)
46 62592   ucb1amaf*#      45.2% (+-2.5%)  selfatarirate=0,rave_prior
47 62592   ucb1amaf#       47.5% (+-2.5%)  rave_prior
49 1a1eb   ucb1            15% (+-2%)      selfatarirate=0:capturerate=0:lcapturerate=0
51 6e22f   ucb1amaf        49.5% (+-2.5%)
52 6e22f   ucb1amaf*0      48% (+-2.5%)    rave_equiv=6000
53 6e22f   ucb1amaf*1      49% (+-2.5%)    rave_equiv=500
54 6e22f   ucb1amaf#       43.2% (+-2.5%)  explore_p=0
55 6e22f   ucb1amaf#*0     45.8% (+-2.5%)  explore_p=0,rave_equiv=6000
56 6e22f   ucb1amaf#*1     48.8% (+-2.5%)  explore_p=0,rave_equiv=500
57 6e22f   ucb1amaf#0      49.5% (+-2.5%)  explore_p=0.01
58 6e22f   ucb1amaf#1      24.8% (+-2.5%)  explore_p=0.5
59 6e22f   19x19 ucb1amaf  0%
60 6e22f   19x19 ucb1amaf* 0%      explore_p=0.01,rave_equiv=100
62 88fe2   ucb1amaf        50.8% (+-2.5%)
63 88fe2   ucb1amaf*       49.5% (+-2.5%)  selfatarirate=0
65 04b7b   ucb1amaf        60.5% (+-2.4%)
66 04b7b   ucb1amaf*       60.2% (+-2.4%)  selfatarirate=0
67 04b7b   ucb1amaf%1      58.5% (+-2.5%)  rate=75
68 04b7b   ucb1amaf%2      60.8% (+-2.4%)  rate=100
69 04b7b   ucb1amaf#       54.5% (+-2.5%)  explore_p=0
70 04b7b   ucb1amaf^       63.5% (+-2.4%)  threads=2
71 04b7b   ucb1amaf+       71.2% (+-2.3%)  games=10000
72 04b7b   ucb1amaf!       79.5% (+-2%)    playout_amaf
73 04b7b   ucb1amaf!&      46% (+-2.5%)    playout_amaf,patternrate=0
75 82790   ucb1amaf        54.1% (+-2.9%)
76 82790   ucb1amaf!       79% (+-2.9%)    playout_amaf
78 129bb   ucb1amaf        64.5% (+-2.4%)
79 129bb   ucb1amaf!       77.2% (+-2.1%)  playout_amaf
81 <playout_amaf_nakade on by default>
83 605dd   ucb1amaf        56.2% (+-2.5%)
84 605dd   ucb1amaf!       63.5% (+-2.4%)  playout_amaf
86 <unknown playout_amaf regression>
88 c031a   ucb1amaf        52.5% (+-4.2%)
89 c031a   ucb1amaf!       63.4% (+-4.2%)  playout_amaf
91 87b9e   ucb1amaf        53.7% (+-2.1%)
92 87b9e   ucb1amaf#1      59.5% (+-1.7%)  explore_p_rave=0
93 87b9e   ucb1amaf#2      59.1% (+-1.7%)  explore_p=0.01,explore_p_rave=0.01
94 87b9e   ucb1amaf%       56.6% (+-2%)    local_assess
95 87b9e   ucb1amaf*       19% (+-1.3%)    patternrate=0
96 87b9e   ucb1amaf!$      62.8% (+-2.4%)  playout_amaf,rave_equiv=500
97 87b9e   ucb1amaf!#1     62.8% (+-1.7%)  playout_amaf,explore_p=0.01,explore_p_rave=0.01
98 87b9e   ucb1amaf!#2     61.6% (+-1.7%)  playout_amaf,explore_p_rave=0.01
99 87b9e   ucb1amaf!&      61.8% (+-2.4%)  playout_amaf,eqex=25
100 87b9e   ucb1amaf!       61.4% (+-2.1%)  playout_amaf
102 <playout_amaf is now default>
104 093e7   ucb1amaf        60.5% (+-2.4%)
105 093e7   ucb1amaf!       58.8% (+-2.5%)  plaout_amaf=0
106 093e7   ucb1amaf%       60.8% (+-2.4%)  ladders=0
108 <playout_amaf_nakade partially off>
110 635a3   ucb1amaf        65% (+-2.4%)
111 635a3   ucb1amaf        63% (+-2.4%)    explore_p_rave=0.01
113 <playout_amaf_nakade off by default>
115 eac23   ucb1amaf        77.4% (+-1.5%)
116 eac23   ucb1amaf#       76.6% (+-1.5%)  explore_p_rave=0.01
117 eac23   ucb1amaf!       74.3% (+-1.5%)  check_nakade=0
118 eac23   ucb1amaf!#      75.5% (+-1.6%)  check_nakade=0,explore_p_rave=0.01
119 eac23   ucb1amaf!#*     75% (+-1.5%)    check_nakade=0,explore_p_rave=0.01,explore_p=0.01
121 <explore_p_rave=0.01>
123 229b9   ucb1amaf 2k     65.5% (+-2.4%)
124 229b9   ucb1amaf 5k     77.5% (+-2.1%)
125 229b9   ucb1amaf 20k    83.8% (+-1.7%)
126 229b9   ucb1amaf 50k    90% (+-1.5%)
127 229b9   ucb1amaf! 2k    37.8% (+-2.4%)  playout_amaf=0
128 229b9   ucb1amaf! 5k    59% (+-2.5%)    playout_amaf=0
129 229b9   ucb1amaf! 20k   79% (+-2%)      playout_amaf=0
130 229b9   ucb1amaf! 50k   83.5% (+-1.9%)  playout_amaf=0
131 229b9   ucb1amaf% 5k    77.2% (+-2.1%)  ladders=0
132 229b9   ucb1amaf*# 5k   74.9% (+-2.2%)  explore_p=0.005,explore_p_rave=0.005
134 self-play:
135 229b9   ucb1amaf km5.5  B+57.5% (+-2.5%)
136 229b9   ucb1amaf km7.5  B+48.8% (+-2.5%)
138 2d54a   ucb1amaf        72.2% (+-2.2%)
140 8ac8a   ucb1amaf        77% (+-2.1%)
141 8ac8a   ucb1amaf@       77% (+-2.1%)    ladder catcher atari check disabled
142 8ac8a   ucb1amaf 50k    93.5% (+-1.2%)
145 fccfe   ucb1amaf        78% (+-2.1%)
146 fccfe   ucb1amaf#       78.5% (+-2.1%)  rave_prior=0
147 fccfe   ucb1amaf*0      76% (+-2.1%)    playout_amaf_cutoff=50
148 fccfe   ucb1amaf*0!     78.5% (+-2.1%)  playout_amaf_cutoff=50,playout_amaf_nakade=1
149 fccfe   ucb1amaf*1      79.8% (+-2%)    playout_amaf_cutoff=75
150 fccfe   ucb1amaf*1!     74% (+-2.2%)    playout_amaf_cutoff=75,playout_amaf_nakade=1
151 fccfe   ucb1amaf*2      76.7% (+-2.1%)  playout_amaf_cutoff=85
152 fccfe   ucb1amaf*2!     77% (+-2.1%)    playout_amaf_cutoff=85,playout_amaf_nakade=1
153 fccfe   ucb1amaf*3      72% (+-2.2%)    playout_amaf_cutoff=90
154 fccfe   ucb1amaf*3!     73% (+-2.2%)    playout_amaf_cutoff=90,playout_amaf_nakade=1
155 fccfe   ucb1amaf*3      72% (+-2.2%)    playout_amaf_cutoff=90
156 fccfe   ucb1amaf*3!     73% (+-2.2%)    playout_amaf_cutoff=90,playout_amaf_nakade=1
158 Threading test:
159 fccfe   ucb1amaf        78% (+-2.1%)
160 fccfe   ucb1amaf 10k    79.8% (+-2%)
161 fccfe   ucb1amaf t=2    75.5% (+-2.2%)
162 569d7   ucb1amaf t=2    82.9% (+-1.9%)
165 <Multiple board sizes from now on>
167 Fillboard investigations (only 4-lib fillboard yet):
169 569d7   9ucb1amaf!      81.2% (+-2%)    fillboardtries=10
170 569d7   9ucb1amaf 50k   90% (+-1.5%)
171 569d7   9ucb1amaf! 50k  90.8% (+-1.4%)  fillboardtries=10
173 ce382   13ucb1amaf      51.8% (+-2.5%)
174 ce382   13ucb1amaf 50k  79.6% (+-2.6%)
175 569d7   13ucb1amaf!     47% (+-2.5%)    fillboardtries=10
176 569d7   13ucb1amaf! 50k 82.8% (+-2.4%)  fillboardtries=10
179 <many optimizations>
181 4181b   9ucb1amaf       76% (+-2.4%)
182 4181b   13ucb1amaf      47.8% (+-2.5%)
183 4181b   19ucb1amaf      1.6% (+-0.9%)
184 4181b   19ucb1amaf!     1% (+-0.7%)     fillboardtries=10
187 0965e   9ucb1amaf       77.5% (+-2.1%)
188 0965e   9ucb1amaf#      9.5% (+-1.5%)   sylvain_rave=0
189 0965e   9ucb1amaf&      79% (+-2.1%)    self-atari protection turned off for single-stone groups
191 0965e   13ucb1amaf      45.2% (+-2.5%)
192 0965e   13ucb1amaf&     52.2% (+-2.5%)  self-atari protection turned off for single-stone groups
194 <permit snapbacks>
196 234b3   9ucb1amaf       77.2% (+-2.1%)
197 234b3   13ucb1amaf      47% (+-2.5%)
200 <add pattern2>
202 035fc   9ucb1amaf       70.5% (+-2.3%)
203 035fc   9ucb1amaf#      79.8% (+-2%)    pattern2=0
205 <add 2-liberty>
207 74b71   9ucb1amaf       74.2% (+-2.2%)
208 74b71   9ucb1amaf#      77% (+-2.1%)    pattern2=0
209 74b71   13ucb1amaf      46.8% (+-2.5%)
210 74b71   13ucb1amaf#     50.2% (+-2.5%)  pattern2=0
212 e34f9   9ucb1amaf       74.2% (+-2.2%)
213 e34f9   9ucb1amaf#      74% (+-2.2%)    pattern2=0
214 e34f9   9ucb1amaf*      76% (+-2.1%)    atarirate=0
215 e34f9   9ucb1amaf#*     79% (+-2%)      pattern2=0,atarirate=0
216 e34f9   13ucb1amaf      47.2% (+-2.5%)
217 e34f9   13ucb1amaf#     49.7% (+-2.8%)  pattern2=0
218 e34f9   13ucb1amaf#*    52.2% (+-2.5%)  pattern2=0,atarirate=0
220 ba2e1   9ucb1amaf       78.2% (+-2.1%)
221 ba2e1   9ucb1amaf#      81.8% (+-1.9%)  pattern2=0
222 ba2e1   9ucb1amaf*      74.5% (+-2.2%)  atarirate=0
223 ba2e1   9ucb1amaf#*     75.5% (+-2.2%)  pattern2=0,atarirate=0
224 ba2e1   9ucb1amaf#*+    78.5% (+-2.1%)  pattern2=0,atarirate=0,prior_cfgd=6
225 ba2e1   9ucb1amaf+%     81.2% (+-2%)    prior_cfgd=6,prior_b19=6
226 ba2e1   9ucb1amaf#+%    83% (+-1.9%)    pattern2=0,prior_cfgd=6,prior_b19=6
228 ba2e1   13ucb1amaf+     57% (+-2.5%)    prior_cfgd=6
229 ba2e1   13ucb1amaf+%    51.2% (+-2.5%)  prior_cfgd=6,prior_b19=6
230 ba2e1   13ucb1amaf#*+   54.8% (+-2.5%)  pattern2=0,atarirate=0,prior_cfgd=6
232 ba2e1   19ucb1amaf+!    13.8% (+-1.7%)  prior_cfgd=6,fillboard
233 ba2e1   19ucb1amaf+%2   21.2% (+-2%)    prior_cfgd=prior_b19=prior=20
234 ba2e1   19ucb1amaf+%2!  20.5% (+-2%)    prior_cfgd=prior_b19=prior=20,fillboard
235 ba2e1   19ucb1amaf+%3   20.8% (+-2%)    prior_cfgd=prior_b19=prior=30
236 ba2e1   19ucb1amaf+%4   25.8% (+-2.2%)  prior_cfgd=prior_b19=prior=40
237 ba2e1   19ucb1amaf+%5   23.2% (+-2.1%)  prior_cfgd=prior_b19=prior=50
238 ba2e1   19ucb1amaf+%4   24.5% (+-2.2%)  prior_cfgd=prior_b19=prior=40,amaf_prior=0
239 ba2e1   19ucb1amaf#*+%! 9.8% (+-1.5%)   pattern2=0,atarirate=0,prior_cfgd=prior_b19=6,fillboard
240 ba2e1   19ucb1amaf#*+%2 25% (+-2.2%)    pattern2=0,atarirate=0,prior_cfgd=prior_b19=prior=20
241 ba2e1   19ucb1amaf#+%2  26.5% (+-2.2%)  pattern2=0,prior_cfgd=prior_b19=prior=20
242 ba2e1   19ucb1amaf#+%3  24% (+-2.2%)    pattern2=0,prior_cfgd=prior_b19=prior=30
243 ba2e1   19ucb1amaf#+%4  27% (+-2.2%)    pattern2=0,prior_cfgd=prior_b19=prior=40
244 ba2e1   19ucb1amaf#+%2! 22.5% (+-2.1%)  pattern2=0,prior_cfgd=prior_b19=prior=20,fillboard
245 ba2e1   19ucb1amaf#+%2_ 23.5% (+-2.1%)  pattern2=0,prior_cfgd=prior_b19=prior=20,prior_policy=10
246 ba2e1   19ucb1amaf#+%2a 1% (+-0.7%)     pattern2=0,prior_cfgd=prior_b19=prior=20,playouts=1000
247 ba2e1   19ucb1amaf#+%2b 7.2% (+-1.4%)   pattern2=0,prior_cfgd=prior_b19=prior=20,playouts=2000
248 ba2e1   19ucb1amaf#+%2  28.2% (+-2.3%)  pattern2=0,prior_cfgd=prior_b19=prior=20,amaf_prior=0
250 <pattern2=0, prior_cfgd=prior_b19=-1, etc.>
251 <From now on, 19x19 always has % = prior=20>
253 49208   9ucb1amaf       80% (+-2%)
254 49208   9ucb1amaf&      76.8% (+-2.1%)  selfatarirate=0
255 49208   9ucb1amaf_      76.8% (+-2.1%)  can_capture_group() always true (really same rate)
256 49208   19ucb1amaf%     25.4% (+-2.3%)
257 49208   19ucb1amaf%&    18.8% (+-2%)    selfatarirate=0
258 49208   19ucb1amaf%_    19.5% (+-2%)    can_capture_group() always true (really same rate)
260 aef5c   19ucb1amaf%     24.5% (+-2.4%)
262 67561   19ucb1amaf%     29% (+-2.3%)
263 67561   19ucb1amaf%*2   26.7% (+-2.7%)  explore_p=0.02
265 d11b1   9ucb1amaf       81.8% (+-1.9%)  
266 d11b1   9ucb1amaf_      81.5% (+-1.9%)  investigate all nakade neis only in case of snapback (945e5)
267 d11b1   9ucb1amaf*      81.2% (+-2%)    atarirate=0
268 d11b1   9ucb1amaf&      78.8% (+-2.1%)  explore_p_rave=0
269 d11b1   19ucb1amaf%     24% (+-2%)
271 f1c52   19ucb1amaf%     26.2% (+-2.4%)
272 08c0a   19ucb1amaf%     25.5% (+-2.4%)  <d11b1_&>
274 <explore coefficient outside of RAVE>
275 a0f85   9ucb1amaf       80.2% (+-2%)
276 a0f85   9ucb1amaf*1     80.8% (+-2%)    explore_p=0
277 a0f85   9ucb1amaf*2     81.2% (+-2%)    explore_p=0.01
278 a0f85   9ucb1amaf*3     40.2% (+-2.5%)  explore_p=0.6
279 a0f85   19ucb1amaf%     18.8% (+-2%)
281 <UCT value tracking>
283 5524c   9ucb1amaf       84.2% (+-1.8%)
284 5524c   9ucb1amaf^1     70.2% (+-3%)    fuego cfgd
285 5524c   9ucb1amaf^2     77% (+-2.1%)    fuego cfgd, 0.1 for pass
286 5524c   9ucb1amaf^2*    76.5% (+-2.1%)  fuego cfgd, 0.1 for pass, prior_cfgd=4
287 5524c   9ucb1amaf!      81.2% (+-2%)    prior_even is 0.1 for pass
289 5524c   19ucb1amaf%     19.8% (+-2%)
290 5524c   19ucb1amaf%^1   13.2% (+-1.7%)  fuego cfgd
291 5524c   19ucb1amaf%^2   12.5% (+-1.7%)  fuego cfgd, 0.1 for pass
292 5524c   19ucb1amaf%^2*  16.2% (+-1.8%)  fuego cfgd, 0.1 for pass, prior_cfgd=5
293 5524c   19ucb1amaf!     19.6% (+-2%)    prior_even is 0.3 for pass
295 2151a   9ucb1amaf       81.5% (+-1.9%)
296 443e1   9ucb1amaf_1     72.5% (+-2.2%)  Priors just like in Fuego
297 6c6cb   9ucb1amaf_2     70.5% (+-2.3%)  Priors just like in Fuego, including equivalent-best-move
299 2151a   19ucb1amaf      17.8% (+-1.9%)
300 443e1   19ucb1amaf_1    12.2% (+-1.6%)  Priors just like in Fuego
301 6c6cb   19ucb1amaf_2    19.5% (+-2%)    Priors just like in Fuego, including equivalent-best-move
303 03c36   19ucb1amaf%$    17.2% (+-1.9%)  ko=-1, without ko aging yet
305 09368   9ucb1amaf       80.2% (+-2%)
306 09368   9ucb1amaf$      80% (+-2%)      ko=-1
307 09368   9ucb1amaf^      79% (+-2%)      eye=0
308 09368   9ucb1amaf$^     77.2% (+-2.1%)  ko=-1,eye=0
310 a1353   19u1a%*         61.8% (+-3.2%)  10k
311 a1353   19u1a%^1 k-14.5 29.2% (+-2.3%)  dynkomi=150
312 a1353   19u1a% k-14.5   29% (+-2.3%)
313 a1353   19u1a%^1 k-7.5  30% (+-2.3%)    dynkomi=150
314 a1353   19u1a% k-7.5    26.5% (+-2.2%)
315 a1353   19u1a%*^1 k0.5  41.6% (+-3%)    10k, dynkomi=150
316 a1353   19u1a%* k0.5    45.1% (+-3%)    10k
317 a1353   19u1a% k0.5     24% (+-2.1%)
318 a1353   19u1a%^0 k0.5   25.8% (+-2.2%)  dynkomi=100
319 a1353   19u1a%^1 k0.5   24.2% (+-2.1%)  dynkomi=150
320 a1353   19u1a%^2 k0.5   25% (+-2.2%)    dynkomi=200
322 a1267   9ucb1amaf       80.1% (+-2%)
323 a1267   9ucb1amaf~20    20.3% (+-2%)    val_scale=0.15,val_points=10
324 a1267   9ucb1amaf~21    6% (+-1.2%)     val_scale=0.15,val_points=20
325 a1267   9ucb1amaf~22    2.5% (+-0.8%)   val_scale=0.15,val_points=30
326 a1267   9ucb1amaf~00    20.2% (+-1.2%)  val_scale=0.05,val_points=10
327 a1267   9ucb1amaf~11    5.8% (+-1.2%)   val_scale=0.10,val_points=20
328 a1267   9ucb1amaf~31    6.5% (+-2%)     val_scale=0.20,val_points=20
329 a1267   9ucb1amaf~a0    18% (+-1.9%)    val_scale=0.01,val_points=10
330 a1267   9ucb1amaf~a1    3.5% (+-0.9%)   val_scale=0.01,val_points=20
331 a1267   9ucb1amaf~b1    6.8% (+-1.3%)   val_scale=0.02,val_points=20
332 a1267   9ucb1amaf~bx    2.3% (+-0.7$)   val_scale=0.02,val_points=80
333 a1267   19ucb1amaf%     21.8% (+-2.1%)
335 2b830   9ucb1amaf       73% (+-2.2%)
336 2b830   9ucb1amaf_      79% (+-2%)      global atari check picks moves across all atari groups
337 2b830   9ucb1amaf~b1    3.8% (+-1%)     val_scale=0.02,val_points=20
338 2b830   19ucb1amaf%     20.7% (+-3%)
339 2b830   19ucb1amaf%_    20.1% (+-2.4%)  global group atari check picks move across all groups
341 <Bugfixing ensues>
343 cc80e   9ucb1amaf       76.8% (+-2.1%)
344 cc80e   19ucb1amaf%_    18.8% (+-2.7%)  8 neighbors are examined instead of 4 in local atari/2lib check
346 e2a49   9ucb1amaf       81.2% (+-2%)
347 e2a49   9ucb1amaf_      75.8% (+-2.1%)  liberal 2-liberty check (take even liberty where opponent can't play)
348 e2a49   9ucb1amaf 2k    71.2% (+-2.3%)
349 e2a49   9ucb1amaf 3k    65.5% (+-2.4%)
350 e2a49   19ucb1amaf%     25.3% (+-2.1%)  ??? suspicious bump in percentage
351 e2a49   19ucb1amaf%*3   25.4% (+-3.7%)  explore_p=0
353 f3603   9ucb1amaf       75.8% (+-2.1%)
354 f3603   9ucb1amaf~b1    7% (+-1.3%)     val_scale=0.02,val_points=20
355 f3603   19ucb1amaf%     19.4% (+-2.1%)
357 <fixed non-integer results in AMAF>
359 fba31   9ucb1amaf 40k   94.2% (+-1.2%)
360 fba31   9ucb1amaf~b1    78% (+-2.1%)    val_scale=0.02,val_points=20
361 fba31   9ucb1amaf~ax    80.8% (+-2%)    val_scale=0.01,val_points=80
362 fba31   19ucb1amaf%     20.7% (+-2.2%)
363 fba31   19ucb1amaf%~a0  20.9% (+-2.2%)  val_scale=0.01,val_points=10
364 fba31   19ucb1amaf%~ax  23.2% (+-2.1%)  val_scale=0.01,val_points=80
365 fba31   19ucb1amaf%~b1  22.3% (+-2.2%)  val_scale=0.02,val_points=20
367 3d0d9   19k-14.5 a%     29.5% (+-2.3%)
368 3d0d9   19k-14.5 a%^0   29.9% (+-2.5%)  dynkomi=100
369 3d0d9   19k-14.5 a%^1   37% (+-2.4%)    dynkomi=150
370 3d0d9   19k-14.5 a%^2   38.6% (+-2.6%)  dynkomi=200
371 3d0d9   19k-14.5 a%^3   34.7% (+-2.5%)  dynkomi=250
373 c40e2   19h2 u1a%       36.2% (+-2.4%)
374 c40e2   19h3 u1a%       43% (+-2.5%)
375 c40e2   19h4 u1a%       50.7% (+-2.9%)
377 c035e   9ucb1amaf       77.5% (+-2.1%)
378 1d4f8   9ucb1amaf       77% (+-2.1%)
379 1d4f8   9ucb1amaf*1     84% (+-1.8%)    explore_p=0.02
380 1d4f8   9ucb1amaf*3     84.5% (+-1.8%)  explore_p=0.002
381 1d4f8   9ucb1amaf%*1    81.8% (+-1.9%)  prior=eqex=20,explore_p=0.02
382 1d4f8   9ucb1amaf%*2    81.8% (+-1.9%)  prior=eqex=20,explore_p=0.002
383 1d4f8   9ucb1amaf%*3    85.2% (+-1.9%)  prior=eqex=20,explore_p=0
384 1d4f8   9km0 u1a        60.2% (+-2.5%)
385 1d4f8   9km0 u1a*1      61.2% (+-2.4%)  explore_p=0.02
386 1d4f8   9km0 u1a*3      61% (+-2.4%)    explore_p=0
387 1d4f8   9km0 u1a%*1     65% (+-2.4%)    prior=eqex=20,explore_p=0.02
388 1d4f8   9km0 u1a%*3     65.2% (+-2.4%)  prior=eqex=20,explore_p=0
390 1d4f8   19u1a%          17.4% (+-2.3%)
391 1d4f8   19u1a%2         21.4% (+-3.7%)  prior=eqex=40
392 1d4f8   19u1a%*x        0% (+-0%)       explore_p=0.6
393 1d4f8   19u1a%*0        13% (+-1.7%)    explore_p=0.2
394 1d4f8   19u1a%*1        23.4% (+-2.4%)  explore_p=0.02
395 1d4f8   19u1a%*2        25% (+-2.4%)    explore_p=0.002
396 1d4f8   19u1a%*3        22.4% (+-2.9%)  explore_p=0
397 1d4f8   19u1a%2*3       29.4% (+-3.2%)  explore_p=0,prior=eqex=40
398 1d4f8-67561 19u1a%      10.6% (+-2.3%)  1d4f8 perspective - something deeply rotten, eh? ;)
399 c035e-67561 19u1a%*1    44.1% (+-2.6%)  explore_p=0.02, c035e perspective
400 1d4f8-67561 19u1a%*1    41.7% (+-2.9%)  explore_p=0.02, 1d4f8 perspective - better than old exp., but still regression
402 7b125   19u1a%          15.7% (+-2.4%)  <exploration bias moves back into the beta-term>
403 16ac5   19u1a%          15.3% (+-4.7%)  <restored explore_p_rave bias term on top of 7b125>
405 More dynkomi experiments:
406 1d4f8   19h2ua%*1~ax    31.8% (+-2.5%)  explore_p=0.02,val_scale=0.01,val_points=80
407 1d4f8   19h2ua%*1~ax^2  38.4% (+-2.6%)  explore_p=0.02,val_scale=0.01,val_points=80,dynkomi=200
408 1d4f8   19h4ua%*1       49.2% (+-2.5%)  explore_p=0.02
409 1d4f8   19h4ua%*1^1     59.5% (+-2.5%)  explore_p=0.02,dynkomi=150
410 1d4f8   19h4ua%*1^2     63.8% (+-2.4%)  explore_p=0.02,dynkomi=200
411 1d4f8   19h4ua%*1~a1    52.2% (+-2.5%)  explore_p=0.02,val_scale=0.01,val_points=20
412 1d4f8   19h4ua%*1~a1^1  58.5% (+-2.5%)  explore_p=0.02,val_scale=0.01,val_points=20,dynkomi=150
413 1d4f8   19h4ua%*1~ax    51.5% (+-2.5%)  explore_p=0.02,val_scale=0.01,val_points=80
414 1d4f8   19h4ua%*1~ax^1  58.7% (+-2.6%)  explore_p=0.02,val_scale=0.01,val_points=80,dynkomi=150
415 1d4f8   19h4ua%*1~ax^2  63.5% (+-2.4%)  explore_p=0.02,val_scale=0.01,val_points=80,dynkomi=200
416 1d4f8   19h4ua%2*3~ax^2 66.8% (+-2.4%)  explore_p=0,prior=eqex=40,val_scale=0.01,val_points=80,dynkomi=200
418 2e4fa   19u1a%*1        30.1% (+-2.3%)  explore_p=0.02
420 <New defaults - explore_p=0,prior=eqex=40>
422 d032a   9u1a            82.2% (+-1.9%)
423 d032a   9u1a%1          85.2% (+-1.8%)  prior=eqex=20
424 d032a   9k0u1a          66% (+-2.4%)
425 d032a   9k0u1a@         62.2% (+-2.4%)  prior=ko=-1
426 d032a   9k0u1a%1        64.8% (+-2.4%)  prior=eqex=20
427 d032a   9k0u1a~a1       59.5% (+-2.5%)  val_scale=0.01,val_points=20
428 d032a   9k0u1a~ax       67.8% (+-2.3%)  val_scale=0.01,val_points=80
429 d032a   9k0u1a~b1       65.8% (+-2.4%)  val_scale=0.02,val_points=20
430 d032a   9k0u1a~bx       65.5% (+-2.4%)  val_scale=0.02,val_points=80
431 d032a   9k0u1a*1        64.2% (+-2.4%)  explore_p=0.02
432 d032a   9k0u1a*1%1      67% (+-2.4%)    explore_p=0.02,prior=eqex=20
433 d032a   9k0u1a^10       62.8% (+-2.4%)  dynkomi=10
434 d032a   9k0u1a^20       64% (+-2.4%)    dynkomi=20
435 d032a   9k0u1a^40       50.5% (+-2.5%)  dynkomi=40
436 d032a   9k0u1a^60       25.3% (+-2.5%)  dynkomi=60
437 d032a   19u1a           33% (+-3.2%)
438 d032a   19u1a@          33.5% (+-3.3%)  prior=ko=-1
439 d032a   19u1a*1%1       30% (+-3.1%)    explore_p=0.02,prior=eqex=20
440 d032a   19u1a~a20       33% (+-2.8%)    val_scale=0.01,val_points=20
441 d032a   19u1a~a80       31.2% (+-3.2%)  val_scale=0.01,val_points=80
442 d032a   19u1a~a150      34.5% (+-2.8%)  val_scale=0.01,val_points=150
443 d032a   19u1a~a360      33.2% (+-2.8%)  val_scale=0.01,val_points=360
445 <Fix the counter-atari check to actuall work at all>
447 8ce82   9u1a            85.2% (+-1.8%)
448 8ce82   9k0u1a          69.8% (+-2.3%)
449 8ce82   9u1a$           89% (+-1.6%)    games=6666
450 8ce82   9k0u1a$         72.8% (+-2.2%)  games=6666
451 8ce82   19u1a           36.8% (+-2.4%)
452 8ce82   19u1a@          34.5% (+-2.4%)  prior=ko=-1
453 8ce82   19u1a~a361      36.8% (+-2.4%)  val_scale=0.01,val_points=361
454 8ce82   19u1a~b361      36.5% (+-2.4%)  val_scale=0.02,val_points=361
456 <#define NO_DOOMED_GROUPS; this also pertains a speedup,
457  so we test with original 5k and 6.6k playouts (appropriate
458  for measured speedup on 19x19)>
460 f4cb0   9u1a            83.2% (+-1.9%)
461 f4cb0   9u1a$           87.5% (+-1.7%)  games=6666
462 f4cb0   9k0u1a          64% (+-2.4%)
463 f4cb0   9k0u1a$         66.2% (+-2.4%)  games=6666
464 f4cb0   19u1a           32.5% (+-2.3%)
465 f4cb0   19u1a~b361      31.8% (+-2.3%)  val_scale=0.02,val_points=361
466 f4cb0   19u1a$          42% (+-2.5%)    games=6666
467 f4cb0   19u1a$~b361     42.5% (+-2.5%)  games=6666,val_scale=0.02,val_points=361
469 <Set default to val_scale=0.02,val_points=-1>
471 7d1c7   9k0u1a          63.5% (+-2.4%)
472 7d1c7   9k0u1a$         68.2% (+-2.3%)  games=6666
473 7d1c7   9k0u1a~x        61.8% (+-2.4%)  val_extra
474 7d1c7   9k0u1a~10       68.2% (+-2.3%)  val_points=10
475 7d1c7   9k0u1a~20       71.5% (+-2.3%)  val_points=20
476 7d1c7   9k0u1a^         63.8% (+-1.7%)  ladders=0
477 7d1c7   9k0u1a+         61.6% (+-1.7%)  pattern2=1
479 7d1c7   19u1a           30.5% (+-2.3%)
480 7d1c7   19u1a$          40.2% (+-2.2%)  games=6666
481 7d1c7   19u1a~x         31.2% (+-2.3%)  val_extra
482 7d1c7   19u1a~10        30.2% (+-2.3%)  val_points=10
483 7d1c7   19u1a~20        30.8% (+-2.3%)  val_points=20
484 7d1c7   19u1a@          31.2% (+-2.3%)  prior=ko=-1
486 Playout randomization experiments:
487 7d1c7   9k0u1a%95       64% (+-1.8%)    rate=95
488 7d1c7   9k0u1a%80       65.8% (+-1.8%)  rate=80
489 7d1c7   9k0u1a%70       67.1% (+-1.7%)  rate=70
490 7d1c7   9k0u1a%65       68.5% (+-1.4%)  rate=65
491 7d1c7   9k0u1a%60       66.4% (+-1.7%)  rate=60
492 7d1c7   9k0u1a%55       65.8% (+-1.7%)  rate=55
493 7d1c7   9k0u1a%50       63% (+-1.7%)    rate=50
494 7d1c7   9k0u1a%45       57.6% (+-1.7%)  rate=45
495 7d1c7   9k0u1a%65#80    64.7% (+-1.7%)  rate=65,patternrate=80
496 7d1c7   9k0u1a%65&80    68.1% (+-1.6%)  rate=65,selfatarirate=80
497 7d1c7   9k0u1a%65&95    64% (+-1.7%)    rate=65,selfatarirate=95
498 7d1c7   9k0u1a%90!50    66.4% (+-1.7%)  rate=90,atarirate=50
499 7d1c7   9k0u1a%90=50    64.2% (+-1.7%)  rate=90,capturerate=50
500 7d1c7   19u1a%99        32.2% (+-2.4%)  rate=99
501 7d1c7   19u1a%95        32.5% (+-2.3%)  rate=95
502 7d1c7   19u1a%85        33% (+-2.4%)    rate=85
503 7d1c7   19u1a%80        25.8% (+-2.1%)  rate=80
504 7d1c7   19u1a%65        22.2% (+-2.2%)  rate=65
506 Even game heuristics experiments:
507 </ == even prior is added to both normal and AMAF values>
508 7d1c7   9k0u1a!         68.2% (+-1.6%)  amaf_prior=0
509 7d1c7   9k0u1a!~10      65.8% (+-1.7%)  amaf_prior=0,prior=even=10
510 7d1c7   9k0u1a/         55.7% (+-1.8%)
511 7d1c7   9k0u1a/!        57% (+-1.8%)    amaf_prior=0
512 7d1c7   9k0u1a/!~0      8.2% (+-1.4%)   amaf_prior=0,prior=even=0
513 7d1c7   9k0u1a/!~2      66% (+-1.7%)    amaf_prior=0,prior=even=2
514 7d1c7   9k0u1a/!~4      63.6% (+-1.7%)  amaf_prior=0,prior=even=4
515 7d1c7   9k0u1a/!~6      61.8% (+-1.7%)  amaf_prior=0,prior=even=6
516 7d1c7   9k0u1a/!~10     65.4% (+-1.7%)  amaf_prior=0,prior=even=10
518 7d1c7   19u1a!~10       28.8% (+-2.3%)  amaf_prior=0,prior=even=10
519 7d1c7   19u1a/          13.5% (+-1.7%)
520 7d1c7   19u1a/!         17.2% (+-1.9%)  amaf_prior=0
521 7d1c7   19u1a/!~0       0%              amaf_prior=0,prior=even=0
522 7d1c7   19u1a/!~2       31% (+-2.3%)    amaf_prior=0,prior=even=2
523 7d1c7   19u1a/!~4       32.8% (+-2.3%)  amaf_prior=0,prior=even=4
524 7d1c7   19u1a/!~6       32.8% (+-2.3%)  amaf_prior=0,prior=even=6
525 7d1c7   19u1a/!~10      33.8% (+-2.4%)  amaf_prior=0,prior=even=10
526 7d1c7   19u1a/!~16      23.5% (+-2.1%)  amaf_prior=0,prior=even=16
528 More dynkomi experiments:
529 7d1c7   19k0u1a         36.2% (+-2.4%)
530 7d1c7   19k0u1a^        40.8% (+-2.5%)  dynkomi=200     extra komi is 7.5
531 7d1c7   19k0u1a^_1      40.2% (+-2.5%)  dynkomi=200     extra komi is 5.5
532 7d1c7   19k0u1a^_2      40% (+-2.4%)    dynkomi=200     extra komi is 8
534 7d1c7   19h2u1a         46.2% (+-2.5%)
535 7d1c7   19h2u1a^        50.8% (+-2.5%)  dynkomi=200     extra komi is 15
536 7d1c7   19h2u1a^_1      47.5% (+-2.5%)  dynkomi=200     extra komi is 11.5
537 7d1c7   19h2u1a^_2      50.5% (+-2.5%)  dynkomi=200     extra komi is 16
539 7d1c7   19h3u1a         54% (+-2.5%)
540 7d1c7   19h3u1a^        59.2% (+-2.5%)  dynkomi=200     extra komi is 22.5
541 7d1c7   19h3u1a^_1      61.5% (+-2.4%)  dynkomi=200     extra komi is 18.5
542 7d1c7   19h3u1a^_2      58.2% (+-2.5%)  dynkomi=200     extra komi is 22
544 7d1c7   19h4u1a         63% (+-2.4%)
545 7d1c7   19h4u1a^_20     62.5% (+-2.4%)  dynkomi=200     extra komi is 80
546 7d1c7   19h4u1a^_16     67.5% (+-2.3%)  dynkomi=200     extra komi is 64
547 7d1c7   19h4u1a^_12     74.5% (+-2.2%)  dynkomi=200     extra komi is 48
548 7d1c7   19h4u1a^        71.8% (+-2.4%)  dynkomi=200     extra komi is 30
549 7d1c7   19h4u1a^_1      67.5% (+-2.3%)  dynkomi=200     extra komi is 27.5
550 7d1c7   19h4u1a^_2      71.5% (+-2.3%)  dynkomi=200     extra komi is 28
552 7d1c7   19h5u1a         69.3% (+-2.4%)
553 7d1c7   19h5u1a^_20     48.3% (+-2.5%)  dynkomi=200     extra komi is 100
554 7d1c7   19h5u1a^_16     77.5% (+-2.1%)  dynkomi=200     extra komi is 80
555 7d1c7   19h5u1a^_12     76.5% (+-2.1%)  dynkomi=200     extra komi is 60
556 7d1c7   19h5u1a^        80.4% (+-2.1%)  dynkomi=200     extra komi is 37.5
557 7d1c7   19h5u1a^_1      81.5% (+-1.9%)  dynkomi=200     extra komi is 35.5
558 7d1c7   19h5u1a^_2      79.5% (+-2%)    dynkomi=200     extra komi is 34
560 a9249   9k0u1a          65.5% (+-2.4%)  [prior=cfgd=3%40%20%20]
561 a9249   9k0u1a*1        64.5% (+-2.4%)  prior=cfgd=1%40
562 a9249   9k0u1a*2        64.2% (+-2.4%)  prior=cfgd=2%40%20
563 a9249   9k0u1a*3        63.5% (+-2.4%)  prior=cfgd=4%40%30%20%10
564 a9249   19u1a           30.5% (+-2.3%)  [prior=cfgd=3%40%20%20]
565 a9249   19u1a*1         23.5% (+-2.1%)  prior=cfgd=1%40
566 a9249   19u1a*2         25.8% (+-2.2%)  prior=cfgd=2%40%20
567 a9249   19u1a*3         26.5% (+-2.2%)  prior=cfgd=3%40%10%10
568 a9249   19u1a*4         23.2% (+-2.1%)  prior=cfgd=4%40%30%20%10
569 a9249   19u1a*5         23% (+-2.1%)    prior=cfgd=4%40%30%30%5
570 a9249   19u1a*6         25% (+-2.2%)    prior=cfgd=4%40%30%30%20
572 44216   19u1a           30% (+-2.3%)
573 44216   19u1a+          24% (+-2.1%)    pattern2=1
574 44216   19u1a%60        26% (+-2.2%)    prior=eqex=60
575 44216   19u1a!%10       29.8% (+-2.3%)  amaf_prior=0,prior=eqex=10
576 44216   19u1a!%20       25% (+-2.4%)    amaf_prior=0,prior=eqex=20
577 44216   19u1a!%30       32.5% (+-2.3%)  amaf_prior=0,prior=eqex=30
578 44216   19u1a!          36.8% (+-2.4%)  amaf_prior=0,[prior=eqex=40]
579 44216   19u1a!%50       27.8% (+-2.2%)  amaf_prior=0,prior=eqex=50
580 44216   19u1a!%60       25.2% (+-2.2%)  amaf_prior=0,prior=eqex=60
582 938a4   9k0u1a          65.5% (+-1.7%)
583 938a4   9k0u1a~0        68.8% (+-2.3%)  val_points=0
584 938a4   9k0u1a!%30      71.2% (+-2.3%)  amaf_prior=0,prior=eqex=30
585 938a4   9k0u1a!         71% (+-2.3%)    amaf_prior=0,[prior=eqex=40]
586 938a4   9k0u1a!%50      65% (+-2.4%)    amaf_prior=0,prior=eqex=50
587 938a4   9k0u1a!%65      64% (+-2.4%)    amaf_prior=0,prior=eqex=65
588 938a4   9k0u1a#1        20.5% (+-2%)    root_heuristic,root_rave=1
589 938a4   9k0u1a#0.6      57.2% (+-2.5%)  root_heuristic,root_rave=0.6
590 938a4   9k0u1a#0.2      63.2% (+-2.4%)  root_heuristic,root_rave=0.2
591 938a4   9k0u1a#0.02     65.6% (+-2.4%)  root_heuristic,root_rave=0.02
592 a3010   19u1a           30.2% (+-2.3%)
593 938a4   19u1a           31.2% (+-2.3%)
594 938a4   19u1a~10        31.2% (+-2.3%)  prior=even=10
595 a3010   19u1a#1.6       23.5% (+-2.1%)  root_heuristic,root_rave=1.6
596 a3010   19u1a#1         26% (+-2.2%)    root_heuristic,root_rave=1
597 a3010   19u1a#0.6       28% (+-2.2%)    root_heuristic,root_rave=0.6
598 a3010   19u1a#0.2       29% (+-2.3%)    root_heuristic,root_rave=0.2
599 938a4   19u1a#0.05      29.2% (+-2.3%)  root_heuristic,root_rave=0.05
600 938a4   19u1a#0.02      27.2% (+-2.2%)  root_heuristic,root_rave=0.02
601 938a4   19u1a#0.005     33.8% (+-2.4%)  root_heuristic,root_rave=0.005
603 4e89f   19u1            0%
604 4e89f   19u1a           30.5% (+-2.3%)
605 4e89f   19u1a#95        28.5% (+-2.3%)  rate=95
606 4e89f   19u1a#100/95    32.5% (+-2.3%)  rate=100,selfatarirate=95
607 4e89f   19u1a%02        1% (+-0.5%)     explore_p=0.2
608 4e89f   19u1a%002       30.5% (+-2.3%)  explore_p=0.02
610 4e89f   19u1a*10        22% (+-2.1%)    prior=cfgd=3%20%10%5
611 4e89f   19u1a*11        25.5% (+-2.1%)  prior=cfgd=3%30%10%10
612 4e89f   19u1a*12        26.5% (+-2.2%)  prior=cfgd=3%30%20%10
613 4e89f   19u1a*13        25.5% (+-2.1%)  prior=cfgd=3%30%20%20
614 4e89f   19u1a           28% (+-2.2%)    [prior=cfgd=3%40%20%20]
615 4e89f   19u1a*15        19.8% (+-2%)    prior=cfgd=3%50%20%20
616 4e89f   19u1a*16        21.5% (+-2.1%)  prior=cfgd=3%50%30%20
617 4e89f   19u1a*17        25.5% (+-2.2%)  prior=cfgd=3%50%30%30
618 4e89f   19u1a*18        25.2% (+-2.2%)  prior=cfgd=3%50%40%30
619 4e89f   19u1a*19        24.5% (+-2.2%)  prior=cfgd=3%50%40%40
620 4e89f   19u1a*1a        23% (+-2.1%)    prior=cfgd=3%60%30%10
621 4e89f   19u1a*1b        25.8% (+-2.2%)  prior=cfgd=3%60%40%30
622 4e89f   19u1a*1c        26.8% (+-2.2%)  prior=cfgd=3%60%50%40