(really) Bug 477630 - Include ucontext.h rather than sys/ucontext.h in Solaris sources
[valgrind.git] / README_DEVELOPERS
blob6cefd0faa96652215bb3ff33b9e212280b1f73f3
1 Building and installing it
2 ~~~~~~~~~~~~~~~~~~~~~~~~~~
3 To build/install from the GIT repository or from a distribution
4 tarball, refer to the section with the same name in README.
7 Building and not installing it
8 ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
9 To run Valgrind without having to install it, run coregrind/valgrind
10 with the VALGRIND_LIB environment variable set, where <dir> is the root
11 of the source tree (and must be an absolute path).  Eg:
13   VALGRIND_LIB=~/grind/head4/.in_place ~/grind/head4/coregrind/valgrind 
15 This allows you to compile and run with "make" instead of "make install",
16 saving you time.
18 Or, you can use the 'vg-in-place' script which does that for you.
20 I recommend compiling with "make --quiet" to further reduce the amount of
21 output spewed out during compilation, letting you actually see any errors,
22 warnings, etc.
25 Building a distribution tarball
26 ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
27 To build a distribution tarball from the valgrind sources:
29   make dist
31 In addition to compiling, linking and packaging everything up, the command
32 will also attempt to build the documentation.
34 If you only want to test whether the generated tarball is complete and runs
35 regression tests successfully, building documentation is not needed.
37   make dist BUILD_ALL_DOCS=no
39 If you insist on building documentation some embarrassing instructions
40 can be found in docs/README.
43 Running the regression tests
44 ~~~~~~~~~~~~~~~~~~~~~~~~~~~~
45 To build and run all the regression tests, run "make [--quiet] regtest".
47 To run a subset of the regression tests, execute:
49   perl tests/vg_regtest <name>
51 where <name> is a directory (all tests within will be run) or a single
52 .vgtest test file, or the name of a program which has a like-named .vgtest
53 file.  Eg:
55   perl tests/vg_regtest memcheck
56   perl tests/vg_regtest memcheck/tests/badfree.vgtest
57   perl tests/vg_regtest memcheck/tests/badfree
60 Running the performance tests
61 ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
62 To build and run all the performance tests, run "make [--quiet] perf".
64 To run a subset of the performance suite, execute:
66   perl perf/vg_perf <name>
68 where <name> is a directory (all tests within will be run) or a single
69 .vgperf test file, or the name of a program which has a like-named .vgperf
70 file.  Eg:
72   perl perf/vg_perf perf/
73   perl perf/vg_perf perf/bz2.vgperf
74   perl perf/vg_perf perf/bz2
76 To compare multiple versions of Valgrind, use the --vg= option multiple
77 times.  For example, if you have two Valgrinds next to each other, one in
78 trunk1/ and one in trunk2/, from within either trunk1/ or trunk2/ do this to
79 compare them on all the performance tests:
81   perl perf/vg_perf --vg=../trunk1 --vg=../trunk2 perf/
84 Commit access and try branches
85 ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
86 To get commit access to the valgrind git repository on sourceware
87 you will have to ask an existing developer and fill in the following
88 form: https://sourceware.org/cgi-bin/pdw/ps_form.cgi
90 Every developer with commit access can use try branches. If you want to try a
91 branch before pushing you can push to a special named try branch as follows: 
93   git push origin $BRANCH:users/$USERNAME/try-$BRANCH
95 Where $BRANCH is the branch name and $USERNAME is your user name.
97 You can see the status of the builders here:
98 https://builder.sourceware.org/buildbot/#/builders?tags=valgrind-try
100 The buildbot will also sent the patch author multiple success/failure emails.
102 Afterwards you can delete the branch again:
104     git push origin :users/$USERNAME/try-$BRANCH
107 Debugging Valgrind with GDB
108 ~~~~~~~~~~~~~~~~~~~~~~~~~~~
109 To debug the valgrind launcher program (<prefix>/bin/valgrind) just
110 run it under gdb in the normal way.
112 Debugging the main body of the valgrind code (and/or the code for
113 a particular tool) requires a bit more trickery but can be achieved
114 without too much problem by following these steps:
116 (1) Set VALGRIND_LAUNCHER to point to the valgrind executable.  Eg:
118       export VALGRIND_LAUNCHER=/usr/local/bin/valgrind
120     or for an uninstalled version in a source directory $DIR:
122       export VALGRIND_LAUNCHER=$DIR/coregrind/valgrind
123       export VALGRIND_LIB=$DIR/.in_place
125     VALGRIND_LIB is where the default.supp and vgpreload_ libraries
126     are found (which is under /usr/libexec/valgrind for an installed
127     version).
129 (2) Run gdb on the tool executable.  Eg:
131       gdb /usr/local/lib/valgrind/lackey-ppc32-linux
133     or
135       gdb $DIR/.in_place/memcheck-x86-linux
137 (3) Do "handle SIGSEGV SIGILL nostop noprint" in GDB to prevent GDB from
138     stopping on a SIGSEGV or SIGILL:
140     (gdb) handle SIGILL SIGSEGV nostop noprint
142     If you are using lldb, then the equivalent command is
144     (lldb) pro hand -p true -s false -n false SIGILL SIGSEGV
146 (4) Set any breakpoints you want and proceed as normal for gdb. The
147     macro VG_(FUNC) is expanded to vgPlain_FUNC, so If you want to set
148     a breakpoint VG_(do_exec), you could do like this in GDB:
150     (gdb) b vgPlain_do_exec
152 (5) Run the tool with required options (the --tool option is required
153     for correct setup), e.g.
155     (gdb) run --tool=lackey pwd
157 Steps (1)--(3) can be put in a .gdbinit file, but any directory names must
158 be fully expanded (ie. not an environment variable).
160 A different and possibly easier way is as follows:
162 (1) Run Valgrind as normal, but add the flag --wait-for-gdb=yes.  This
163     puts the tool executable into a wait loop soon after it gains
164     control.  This delays startup for a few seconds.
166 (2) In a different shell, do "gdb /proc/<pid>/exe <pid>", where
167     <pid> you read from the output printed by (1).  This attaches
168     GDB to the tool executable, which should be in the above mentioned
169     wait loop.
171 (3) Do "cont" to continue.  After the loop finishes spinning, startup
172     will continue as normal.  Note that comment (3) above re passing
173     signals applies here too.
175 The default build of Valgrind uses "-g -O2". This is OK most of the
176 time, but with sophisticated optimization it can be difficult to
177 see the contents of variables. A quick way to get to see function
178 variables is to temporarily add "__attribute__((optnone))" before
179 the function definition and rebuild. Alternatively modify
180 Makefile.all.am and remove -O2 from AM_CFLAGS_BASE. That will
181 require you to reconfigure and rebuild Valgrind.
183 Self-hosting
184 ~~~~~~~~~~~~
185 This section explains:
186   (A) How to configure Valgrind to run under Valgrind.
187       Such a setup is called self hosting, or outer/inner setup.
188   (B) How to run Valgrind regression tests in a 'self-hosting' mode,
189       e.g. to verify Valgrind has no bugs such as memory leaks.
190   (C) How to run Valgrind performance tests in a 'self-hosting' mode,
191       to analyse and optimise the performance of Valgrind and its tools.
193 (A) How to configure Valgrind to run under Valgrind:
195 (1) Check out 2 trees, "Inner" and "Outer".  Inner runs the app
196     directly.  Outer runs Inner.
198 (2) Configure Inner with --enable-inner and build as usual.
200 (3) Configure Outer normally and build+install as usual.
201     Note: You must use a "make install"-ed valgrind.
202     Do *not* use vg-in-place for the Outer valgrind.
204 (4) Choose a very simple program (date) and try
206     outer/.../bin/valgrind --sim-hints=enable-outer --trace-children=yes  \
207        --smc-check=all-non-file \
208        --run-libc-freeres=no --tool=cachegrind -v \
209        inner/.../vg-in-place --vgdb-prefix=./inner --tool=none -v prog
211 If you omit the --trace-children=yes, you'll only monitor Inner's launcher
212 program, not its stage2. Outer needs --run-libc-freeres=no, as otherwise
213 it will try to find and run __libc_freeres in the inner, while libc is not
214 used by the inner. Inner needs --vgdb-prefix=./inner to avoid inner
215 gdbserver colliding with outer gdbserver.
216 Currently, inner does *not* use the client request 
217 VALGRIND_DISCARD_TRANSLATIONS for the JITted code or the code patched for
218 translation chaining. So the outer needs --smc-check=all-non-file to
219 detect the modified code.
221 Debugging the whole thing might imply to use up to 3 GDB:
222   * a GDB attached to the Outer valgrind, allowing
223     to examine the state of Outer.
224   * a GDB using Outer gdbserver, allowing to
225     examine the state of Inner.
226   * a GDB using Inner gdbserver, allowing to
227     examine the state of prog.
229 The whole thing is fragile, confusing and slow, but it does work well enough
230 for you to get some useful performance data.  Inner has most of
231 its output (ie. those lines beginning with "==<pid>==") prefixed with a '>',
232 which helps a lot. However, when running regression tests in an Outer/Inner
233 setup, this prefix causes the reg test diff to fail. Give 
234 --sim-hints=no-inner-prefix to the Inner to disable the production
235 of the prefix in the stdout/stderr output of Inner.
237 The allocators in coregrind/m_mallocfree.c and VEX/priv/main_util.h are
238 annotated with client requests so Memcheck can be used to find leaks
239 and use after free in an Inner Valgrind.
241 The Valgrind "big lock" is annotated with helgrind client requests
242 so Helgrind and DRD can be used to find race conditions in an Inner
243 Valgrind.
245 All this has not been tested much, so don't be surprised if you hit problems.
247 When using self-hosting with an outer Callgrind tool, use '--pop-on-jump'
248 (on the outer). Otherwise, Callgrind has much higher memory requirements. 
250 (B) Regression tests in an outer/inner setup:
252  To run all the regression tests with an outer memcheck, do :
253    perl tests/vg_regtest --outer-valgrind=../outer/.../bin/valgrind \
254                          --all
256  To run a specific regression tests with an outer memcheck, do:
257    perl tests/vg_regtest --outer-valgrind=../outer/.../bin/valgrind \
258                          none/tests/args.vgtest
260  To run regression tests with another outer tool:
261    perl tests/vg_regtest --outer-valgrind=../outer/.../bin/valgrind \
262                          --outer-tool=helgrind --all
264  --outer-args allows to give specific arguments to the outer tool,
265  replacing the default one provided by vg_regtest.
267 Note: --outer-valgrind must be a "make install"-ed valgrind.
268 Do *not* use vg-in-place.
270 When an outer valgrind runs an inner valgrind, a regression test
271 produces one additional file <testname>.outer.log which contains the
272 errors detected by the outer valgrind.  E.g. for an outer memcheck, it
273 contains the leaks found in the inner, for an outer helgrind or drd,
274 it contains the detected race conditions.
276 The file tests/outer_inner.supp contains suppressions for 
277 the irrelevant or benign errors found in the inner.
279 A regression test running in the inner (e.g. memcheck/tests/badrw) will
280 cause the inner to report an error, which is expected and checked
281 as usual when running the regtests in an outer/inner setup.
282 However, the outer will often also observe an error, e.g. a jump
283 using uninitialised data, or a read/write outside the bounds of a heap
284 block. When the outer reports such an error, it will output the
285 inner host stacktrace. To this stacktrace, it will append the
286 stacktrace of the inner guest program. For example, this is an error
287 reported by the outer when the inner runs the badrw regtest:
288   ==8119== Invalid read of size 2
289   ==8119==    at 0x7F2EFD7AF: ???
290   ==8119==    by 0x7F2C82EAF: ???
291   ==8119==    by 0x7F180867F: ???
292   ==8119==    by 0x40051D: main (badrw.c:5)
293   ==8119==    by 0x7F180867F: ???
294   ==8119==    by 0x1BFF: ???
295   ==8119==    by 0x3803B7F0: _______VVVVVVVV_appended_inner_guest_stack_VVVVVVVV_______ (m_execontext.c:332)
296   ==8119==    by 0x40055C: main (badrw.c:22)
297   ==8119==  Address 0x55cd03c is 4 bytes before a block of size 16 alloc'd
298   ==8119==    at 0x2804E26D: vgPlain_arena_malloc (m_mallocfree.c:1914)
299   ==8119==    by 0x2800BAB4: vgMemCheck_new_block (mc_malloc_wrappers.c:368)
300   ==8119==    by 0x2800BC87: vgMemCheck_malloc (mc_malloc_wrappers.c:403)
301   ==8119==    by 0x28097EAE: do_client_request (scheduler.c:1861)
302   ==8119==    by 0x28097EAE: vgPlain_scheduler (scheduler.c:1425)
303   ==8119==    by 0x280A7237: thread_wrapper (syswrap-linux.c:103)
304   ==8119==    by 0x280A7237: run_a_thread_NORETURN (syswrap-linux.c:156)
305   ==8119==    by 0x3803B7F0: _______VVVVVVVV_appended_inner_guest_stack_VVVVVVVV_______ (m_execontext.c:332)
306   ==8119==    by 0x4C294C4: malloc (vg_replace_malloc.c:298)
307   ==8119==    by 0x40051D: main (badrw.c:5)
308 In the above, the first stacktrace starts with the inner host stacktrace,
309 which in this case is some JITted code. Such code sometimes contains IPs
310 that points in the inner guest code (0x40051D: main (badrw.c:5)).
311 After the separator, we have the inner guest stacktrace.
312 The second stacktrace gives the stacktrace where the heap block that was
313 overrun was allocated. We see it was allocated by the inner valgrind
314 in the client arena (first part of the stacktrace). The second part is
315 the guest stacktrace that did the allocation.
318 (C) Performance tests in an outer/inner setup:
320  To run all the performance tests with an outer cachegrind, do :
321     perl perf/vg_perf --outer-valgrind=../outer/.../bin/valgrind perf
323  To run a specific perf test (e.g. bz2) in this setup, do :
324     perl perf/vg_perf --outer-valgrind=../outer/.../bin/valgrind perf/bz2
326  To run all the performance tests with an outer callgrind, do :
327     perl perf/vg_perf --outer-valgrind=../outer/.../bin/valgrind \
328                       --outer-tool=callgrind perf
330 Note: --outer-valgrind must be a "make install"-ed valgrind.
331 Do *not* use vg-in-place.
333  To compare the performance of multiple Valgrind versions, do :
334     perl perf/vg_perf --outer-valgrind=../outer/.../bin/valgrind \
335       --outer-tool=callgrind \
336       --vg=../inner_xxxx --vg=../inner_yyyy perf
337   (where inner_xxxx and inner_yyyy are the toplevel directories of
338   the versions to compare).
339   Cachegrind and cg_diff are particularly handy to obtain a delta
340   between the two versions.
342 When the outer tool is callgrind or cachegrind, the following
343 output files will be created for each test:
344    <outertoolname>.out.<inner_valgrind_dir>.<tt>.<perftestname>.<pid>
345    <outertoolname>.outer.log.<inner_valgrind_dir>.<tt>.<perftestname>.<pid>
346  (where tt is the two letters abbreviation for the inner tool(s) run).
348 For example, the command
349     perl perf/vg_perf \
350       --outer-valgrind=../outer_trunk/install/bin/valgrind \
351       --outer-tool=callgrind \
352       --vg=../inner_tchain --vg=../inner_trunk perf/many-loss-records
354 produces the files
355     callgrind.out.inner_tchain.no.many-loss-records.18465
356     callgrind.outer.log.inner_tchain.no.many-loss-records.18465
357     callgrind.out.inner_tchain.me.many-loss-records.21899
358     callgrind.outer.log.inner_tchain.me.many-loss-records.21899
359     callgrind.out.inner_trunk.no.many-loss-records.21224
360     callgrind.outer.log.inner_trunk.no.many-loss-records.21224
361     callgrind.out.inner_trunk.me.many-loss-records.22916
362     callgrind.outer.log.inner_trunk.me.many-loss-records.22916
365 Printing out problematic blocks
366 ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
367 If you want to print out a disassembly of a particular block that
368 causes a crash, do the following.
370 Try running with "--vex-guest-chase=no --trace-flags=10000000
371 --trace-notbelow=999999".  This should print one line for each block
372 translated, and that includes the address.
374 Then re-run with 999999 changed to the highest bb number shown.
375 This will print the one line per block, and also will print a
376 disassembly of the block in which the fault occurred.
379 Formatting the code with clang-format
380 ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
381 clang-format is a tool to format C/C++/... code.  The root directory of the
382 Valgrind tree contains file .clang-format which is a configuration for this tool
383 and specifies a style for Valgrind.  This gives you an option to use
384 clang-format to easily format Valgrind code which you are modifying.
386 The Valgrind codebase is not globally formatted with clang-format.  It means
387 that you should not use the tool to format a complete file after making changes
388 in it because that would lead to creating unrelated modifications.
390 The right approach is to format only updated or new code.  By using an
391 integration with a text editor, it is possible to reformat arbitrary blocks
392 of code with a single keystroke.  Refer to the upstream documentation which
393 describes integration with various editors and IDEs:
394 https://clang.llvm.org/docs/ClangFormat.html.