Changes.old: Add missing piece to 5.00 changelog
[man-pages.git] / man2 / ptrace.2
blob7f3d1cab720dd49b78de0125b7aad67844e31880
1 .\" Copyright (c) 1993 Michael Haardt <michael@moria.de>
2 .\" Fri Apr  2 11:32:09 MET DST 1993
3 .\"
4 .\" and changes Copyright (C) 1999 Mike Coleman (mkc@acm.org)
5 .\" -- major revision to fully document ptrace semantics per recent Linux
6 .\"    kernel (2.2.10) and glibc (2.1.2)
7 .\" Sun Nov  7 03:18:35 CST 1999
8 .\"
9 .\" and Copyright (c) 2011, Denys Vlasenko <vda.linux@googlemail.com>
10 .\" and Copyright (c) 2015, 2016, Michael Kerrisk <mtk.manpages@gmail.com>
11 .\"
12 .\" %%%LICENSE_START(GPLv2+_DOC_FULL)
13 .\" This is free documentation; you can redistribute it and/or
14 .\" modify it under the terms of the GNU General Public License as
15 .\" published by the Free Software Foundation; either version 2 of
16 .\" the License, or (at your option) any later version.
17 .\"
18 .\" The GNU General Public License's references to "object code"
19 .\" and "executables" are to be interpreted as the output of any
20 .\" document formatting or typesetting system, including
21 .\" intermediate and printed output.
22 .\"
23 .\" This manual is distributed in the hope that it will be useful,
24 .\" but WITHOUT ANY WARRANTY; without even the implied warranty of
25 .\" MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the
26 .\" GNU General Public License for more details.
27 .\"
28 .\" You should have received a copy of the GNU General Public
29 .\" License along with this manual; if not, see
30 .\" <http://www.gnu.org/licenses/>.
31 .\" %%%LICENSE_END
32 .\"
33 .\" Modified Fri Jul 23 23:47:18 1993 by Rik Faith <faith@cs.unc.edu>
34 .\" Modified Fri Jan 31 16:46:30 1997 by Eric S. Raymond <esr@thyrsus.com>
35 .\" Modified Thu Oct  7 17:28:49 1999 by Andries Brouwer <aeb@cwi.nl>
36 .\" Modified, 27 May 2004, Michael Kerrisk <mtk.manpages@gmail.com>
37 .\"     Added notes on capability requirements
38 .\"
39 .\" 2006-03-24, Chuck Ebbert <76306.1226@compuserve.com>
40 .\"    Added    PTRACE_SETOPTIONS, PTRACE_GETEVENTMSG, PTRACE_GETSIGINFO,
41 .\"        PTRACE_SETSIGINFO, PTRACE_SYSEMU, PTRACE_SYSEMU_SINGLESTEP
42 .\"    (Thanks to Blaisorblade, Daniel Jacobowitz and others who helped.)
43 .\" 2011-09, major update by Denys Vlasenko <vda.linux@googlemail.com>
44 .\" 2015-01, Kees Cook <keescook@chromium.org>
45 .\"    Added PTRACE_O_TRACESECCOMP, PTRACE_EVENT_SECCOMP
46 .\"
47 .\" FIXME The following are undocumented:
48 .\"
49 .\" PTRACE_GETWMMXREGS
50 .\" PTRACE_SETWMMXREGS
51 .\"     ARM
52 .\"     Linux 2.6.12
53 .\"
54 .\" PTRACE_SET_SYSCALL
55 .\"     ARM and ARM64
56 .\"     Linux 2.6.16
57 .\"     commit 3f471126ee53feb5e9b210ea2f525ed3bb9b7a7f
58 .\"     Author: Nicolas Pitre <nico@cam.org>
59 .\"     Date:   Sat Jan 14 19:30:04 2006 +0000
60 .\"
61 .\" PTRACE_GETCRUNCHREGS
62 .\" PTRACE_SETCRUNCHREGS
63 .\"     ARM
64 .\"     Linux 2.6.18
65 .\"     commit 3bec6ded282b331552587267d67a06ed7fd95ddd
66 .\"     Author: Lennert Buytenhek <buytenh@wantstofly.org>
67 .\"     Date:   Tue Jun 27 22:56:18 2006 +0100
68 .\"
69 .\" PTRACE_GETVFPREGS
70 .\" PTRACE_SETVFPREGS
71 .\"     ARM and ARM64
72 .\"     Linux 2.6.30
73 .\"     commit 3d1228ead618b88e8606015cbabc49019981805d
74 .\"     Author: Catalin Marinas <catalin.marinas@arm.com>
75 .\"     Date:   Wed Feb 11 13:12:56 2009 +0100
76 .\"
77 .\" PTRACE_GETHBPREGS
78 .\" PTRACE_SETHBPREGS
79 .\"     ARM and ARM64
80 .\"     Linux 2.6.37
81 .\"     commit 864232fa1a2f8dfe003438ef0851a56722740f3e
82 .\"     Author: Will Deacon <will.deacon@arm.com>
83 .\"     Date:   Fri Sep 3 10:42:55 2010 +0100
84 .\"
85 .\" PTRACE_SINGLEBLOCK
86 .\"     Since at least Linux 2.4.0 on various architectures
87 .\"     Since Linux 2.6.25 on x86 (and others?)
88 .\"     commit 5b88abbf770a0e1975c668743100f42934f385e8
89 .\"     Author: Roland McGrath <roland@redhat.com>
90 .\"     Date:   Wed Jan 30 13:30:53 2008 +0100
91 .\"         ptrace: generic PTRACE_SINGLEBLOCK
92 .\"
93 .\" PTRACE_GETFPXREGS
94 .\" PTRACE_SETFPXREGS
95 .\"     Since at least Linux 2.4.0 on various architectures
96 .\"
97 .\" PTRACE_GETFDPIC
98 .\" PTRACE_GETFDPIC_EXEC
99 .\" PTRACE_GETFDPIC_INTERP
100 .\"     blackfin, c6x, frv, sh
101 .\"     First appearance in Linux 2.6.11 on frv
103 .\" and others that can be found in the arch/*/include/uapi/asm/ptrace files
105 .TH PTRACE 2 2018-04-30 "Linux" "Linux Programmer's Manual"
106 .SH NAME
107 ptrace \- process trace
108 .SH SYNOPSIS
110 .B #include <sys/ptrace.h>
112 .BI "long ptrace(enum __ptrace_request " request ", pid_t " pid ", "
113 .BI "            void *" addr ", void *" data );
115 .SH DESCRIPTION
117 .BR ptrace ()
118 system call provides a means by which one process (the "tracer")
119 may observe and control the execution of another process (the "tracee"),
120 and examine and change the tracee's memory and registers.
121 It is primarily used to implement breakpoint debugging and system
122 call tracing.
124 A tracee first needs to be attached to the tracer.
125 Attachment and subsequent commands are per thread:
126 in a multithreaded process,
127 every thread can be individually attached to a
128 (potentially different) tracer,
129 or left not attached and thus not debugged.
130 Therefore, "tracee" always means "(one) thread",
131 never "a (possibly multithreaded) process".
132 Ptrace commands are always sent to
133 a specific tracee using a call of the form
135     ptrace(PTRACE_foo, pid, ...)
137 where
138 .I pid
139 is the thread ID of the corresponding Linux thread.
141 (Note that in this page, a "multithreaded process"
142 means a thread group consisting of threads created using the
143 .BR clone (2)
144 .B CLONE_THREAD
145 flag.)
147 A process can initiate a trace by calling
148 .BR fork (2)
149 and having the resulting child do a
150 .BR PTRACE_TRACEME ,
151 followed (typically) by an
152 .BR execve (2).
153 Alternatively, one process may commence tracing another process using
154 .B PTRACE_ATTACH
156 .BR PTRACE_SEIZE .
158 While being traced, the tracee will stop each time a signal is delivered,
159 even if the signal is being ignored.
160 (An exception is
161 .BR SIGKILL ,
162 which has its usual effect.)
163 The tracer will be notified at its next call to
164 .BR waitpid (2)
165 (or one of the related "wait" system calls); that call will return a
166 .I status
167 value containing information that indicates
168 the cause of the stop in the tracee.
169 While the tracee is stopped,
170 the tracer can use various ptrace requests to inspect and modify the tracee.
171 The tracer then causes the tracee to continue,
172 optionally ignoring the delivered signal
173 (or even delivering a different signal instead).
175 If the
176 .B PTRACE_O_TRACEEXEC
177 option is not in effect, all successful calls to
178 .BR execve (2)
179 by the traced process will cause it to be sent a
180 .B SIGTRAP
181 signal,
182 giving the parent a chance to gain control before the new program
183 begins execution.
185 When the tracer is finished tracing, it can cause the tracee to continue
186 executing in a normal, untraced mode via
187 .BR PTRACE_DETACH .
189 The value of
190 .I request
191 determines the action to be performed:
193 .B PTRACE_TRACEME
194 Indicate that this process is to be traced by its parent.
195 A process probably shouldn't make this request if its parent
196 isn't expecting to trace it.
197 .RI ( pid ,
198 .IR addr ,
200 .IR data
201 are ignored.)
204 .B PTRACE_TRACEME
205 request is used only by the tracee;
206 the remaining requests are used only by the tracer.
207 In the following requests,
208 .I pid
209 specifies the thread ID of the tracee to be acted on.
210 For requests other than
211 .BR PTRACE_ATTACH ,
212 .BR PTRACE_SEIZE ,
213 .BR PTRACE_INTERRUPT ,
215 .BR PTRACE_KILL ,
216 the tracee must be stopped.
218 .BR PTRACE_PEEKTEXT ", " PTRACE_PEEKDATA
219 Read a word at the address
220 .I addr
221 in the tracee's memory, returning the word as the result of the
222 .BR ptrace ()
223 call.
224 Linux does not have separate text and data address spaces,
225 so these two requests are currently equivalent.
226 .RI ( data
227 is ignored; but see NOTES.)
229 .B PTRACE_PEEKUSER
230 .\" PTRACE_PEEKUSR in kernel source, but glibc uses PTRACE_PEEKUSER,
231 .\" and that is the name that seems common on other systems.
232 Read a word at offset
233 .I addr
234 in the tracee's USER area,
235 which holds the registers and other information about the process
236 (see
237 .IR <sys/user.h> ).
238 The word is returned as the result of the
239 .BR ptrace ()
240 call.
241 Typically, the offset must be word-aligned, though this might vary by
242 architecture.
243 See NOTES.
244 .RI ( data
245 is ignored; but see NOTES.)
247 .BR PTRACE_POKETEXT ", " PTRACE_POKEDATA
248 Copy the word
249 .I data
250 to the address
251 .I addr
252 in the tracee's memory.
253 As for
254 .BR PTRACE_PEEKTEXT
256 .BR PTRACE_PEEKDATA ,
257 these two requests are currently equivalent.
259 .B PTRACE_POKEUSER
260 .\" PTRACE_POKEUSR in kernel source, but glibc uses PTRACE_POKEUSER,
261 .\" and that is the name that seems common on other systems.
262 Copy the word
263 .I data
264 to offset
265 .I addr
266 in the tracee's USER area.
267 As for
268 .BR PTRACE_PEEKUSER ,
269 the offset must typically be word-aligned.
270 In order to maintain the integrity of the kernel,
271 some modifications to the USER area are disallowed.
272 .\" FIXME In the preceding sentence, which modifications are disallowed,
273 .\" and when they are disallowed, how does user space discover that fact?
275 .BR PTRACE_GETREGS ", " PTRACE_GETFPREGS
276 Copy the tracee's general-purpose or floating-point registers,
277 respectively, to the address
278 .I data
279 in the tracer.
281 .I <sys/user.h>
282 for information on the format of this data.
283 .RI ( addr
284 is ignored.)
285 Note that SPARC systems have the meaning of
286 .I data
288 .I addr
289 reversed; that is,
290 .I data
291 is ignored and the registers are copied to the address
292 .IR addr .
293 .B PTRACE_GETREGS
295 .B PTRACE_GETFPREGS
296 are not present on all architectures.
298 .BR PTRACE_GETREGSET " (since Linux 2.6.34)"
299 Read the tracee's registers.
300 .I addr
301 specifies, in an architecture-dependent way, the type of registers to be read.
302 .B NT_PRSTATUS
303 (with numerical value 1)
304 usually results in reading of general-purpose registers.
305 If the CPU has, for example,
306 floating-point and/or vector registers, they can be retrieved by setting
307 .I addr
308 to the corresponding
309 .B NT_foo
310 constant.
311 .I data
312 points to a
313 .BR "struct iovec" ,
314 which describes the destination buffer's location and length.
315 On return, the kernel modifies
316 .B iov.len
317 to indicate the actual number of bytes returned.
319 .BR PTRACE_SETREGS ", " PTRACE_SETFPREGS
320 Modify the tracee's general-purpose or floating-point registers,
321 respectively, from the address
322 .I data
323 in the tracer.
324 As for
325 .BR PTRACE_POKEUSER ,
326 some general-purpose register modifications may be disallowed.
327 .\" FIXME . In the preceding sentence, which modifications are disallowed,
328 .\" and when they are disallowed, how does user space discover that fact?
329 .RI ( addr
330 is ignored.)
331 Note that SPARC systems have the meaning of
332 .I data
334 .I addr
335 reversed; that is,
336 .I data
337 is ignored and the registers are copied from the address
338 .IR addr .
339 .B PTRACE_SETREGS
341 .B PTRACE_SETFPREGS
342 are not present on all architectures.
344 .BR PTRACE_SETREGSET " (since Linux 2.6.34)"
345 Modify the tracee's registers.
346 The meaning of
347 .I addr
349 .I data
350 is analogous to
351 .BR PTRACE_GETREGSET .
353 .BR PTRACE_GETSIGINFO " (since Linux 2.3.99-pre6)"
354 Retrieve information about the signal that caused the stop.
355 Copy a
356 .I siginfo_t
357 structure (see
358 .BR sigaction (2))
359 from the tracee to the address
360 .I data
361 in the tracer.
362 .RI ( addr
363 is ignored.)
365 .BR PTRACE_SETSIGINFO " (since Linux 2.3.99-pre6)"
366 Set signal information:
367 copy a
368 .I siginfo_t
369 structure from the address
370 .I data
371 in the tracer to the tracee.
372 This will affect only signals that would normally be delivered to
373 the tracee and were caught by the tracer.
374 It may be difficult to tell
375 these normal signals from synthetic signals generated by
376 .BR ptrace ()
377 itself.
378 .RI ( addr
379 is ignored.)
381 .BR PTRACE_PEEKSIGINFO " (since Linux 3.10)"
382 .\" commit 84c751bd4aebbaae995fe32279d3dba48327bad4
383 Retrieve
384 .I siginfo_t
385 structures without removing signals from a queue.
386 .I addr
387 points to a
388 .I ptrace_peeksiginfo_args
389 structure that specifies the ordinal position from which
390 copying of signals should start,
391 and the number of signals to copy.
392 .I siginfo_t
393 structures are copied into the buffer pointed to by
394 .IR data .
395 The return value contains the number of copied signals (zero indicates
396 that there is no signal corresponding to the specified ordinal position).
397 Within the returned
398 .I siginfo
399 structures,
401 .IR si_code
402 field includes information
403 .RB ( __SI_CHLD ,
404 .BR __SI_FAULT ,
405 etc.) that are not otherwise exposed to user space.
407 .in +4n
409 struct ptrace_peeksiginfo_args {
410     u64 off;    /* Ordinal position in queue at which
411                    to start copying signals */
412     u32 flags;  /* PTRACE_PEEKSIGINFO_SHARED or 0 */
413     s32 nr;     /* Number of signals to copy */
418 Currently, there is only one flag,
419 .BR PTRACE_PEEKSIGINFO_SHARED ,
420 for dumping signals from the process-wide signal queue.
421 If this flag is not set,
422 signals are read from the per-thread queue of the specified thread.
426 .BR PTRACE_GETSIGMASK " (since Linux 3.11)"
427 .\" commit 29000caecbe87b6b66f144f72111f0d02fbbf0c1
428 Place a copy of the mask of blocked signals (see
429 .BR sigprocmask (2))
430 in the buffer pointed to by
431 .IR data ,
432 which should be a pointer to a buffer of type
433 .IR sigset_t .
435 .I addr
436 argument contains the size of the buffer pointed to by
437 .IR data
438 (i.e.,
439 .IR sizeof(sigset_t) ).
441 .BR PTRACE_SETSIGMASK " (since Linux 3.11)"
442 Change the mask of blocked signals (see
443 .BR sigprocmask (2))
444 to the value specified in the buffer pointed to by
445 .IR data ,
446 which should be a pointer to a buffer of type
447 .IR sigset_t .
449 .I addr
450 argument contains the size of the buffer pointed to by
451 .IR data
452 (i.e.,
453 .IR sizeof(sigset_t) ).
455 .BR PTRACE_SETOPTIONS " (since Linux 2.4.6; see BUGS for caveats)"
456 Set ptrace options from
457 .IR data .
458 .RI ( addr
459 is ignored.)
460 .IR data
461 is interpreted as a bit mask of options,
462 which are specified by the following flags:
465 .BR PTRACE_O_EXITKILL " (since Linux 3.8)"
466 .\" commit 992fb6e170639b0849bace8e49bf31bd37c4123
467 Send a
468 .B SIGKILL
469 signal to the tracee if the tracer exits.
470 This option is useful for ptrace jailers that
471 want to ensure that tracees can never escape the tracer's control.
473 .BR PTRACE_O_TRACECLONE " (since Linux 2.5.46)"
474 Stop the tracee at the next
475 .BR clone (2)
476 and automatically start tracing the newly cloned process,
477 which will start with a
478 .BR SIGSTOP ,
480 .B PTRACE_EVENT_STOP
482 .B PTRACE_SEIZE
483 was used.
485 .BR waitpid (2)
486 by the tracer will return a
487 .I status
488 value such that
491   status>>8 == (SIGTRAP | (PTRACE_EVENT_CLONE<<8))
494 The PID of the new process can be retrieved with
495 .BR PTRACE_GETEVENTMSG .
497 This option may not catch
498 .BR clone (2)
499 calls in all cases.
500 If the tracee calls
501 .BR clone (2)
502 with the
503 .B CLONE_VFORK
504 flag,
505 .B PTRACE_EVENT_VFORK
506 will be delivered instead
508 .B PTRACE_O_TRACEVFORK
509 is set; otherwise if the tracee calls
510 .BR clone (2)
511 with the exit signal set to
512 .BR SIGCHLD ,
513 .B PTRACE_EVENT_FORK
514 will be delivered if
515 .B PTRACE_O_TRACEFORK
516 is set.
518 .BR PTRACE_O_TRACEEXEC " (since Linux 2.5.46)"
519 Stop the tracee at the next
520 .BR execve (2).
522 .BR waitpid (2)
523 by the tracer will return a
524 .I status
525 value such that
528   status>>8 == (SIGTRAP | (PTRACE_EVENT_EXEC<<8))
531 If the execing thread is not a thread group leader,
532 the thread ID is reset to thread group leader's ID before this stop.
533 Since Linux 3.0, the former thread ID can be retrieved with
534 .BR PTRACE_GETEVENTMSG .
536 .BR PTRACE_O_TRACEEXIT " (since Linux 2.5.60)"
537 Stop the tracee at exit.
539 .BR waitpid (2)
540 by the tracer will return a
541 .I status
542 value such that
545   status>>8 == (SIGTRAP | (PTRACE_EVENT_EXIT<<8))
548 The tracee's exit status can be retrieved with
549 .BR PTRACE_GETEVENTMSG .
551 The tracee is stopped early during process exit,
552 when registers are still available,
553 allowing the tracer to see where the exit occurred,
554 whereas the normal exit notification is done after the process
555 is finished exiting.
556 Even though context is available,
557 the tracer cannot prevent the exit from happening at this point.
559 .BR PTRACE_O_TRACEFORK " (since Linux 2.5.46)"
560 Stop the tracee at the next
561 .BR fork (2)
562 and automatically start tracing the newly forked process,
563 which will start with a
564 .BR SIGSTOP ,
566 .B PTRACE_EVENT_STOP
568 .B PTRACE_SEIZE
569 was used.
571 .BR waitpid (2)
572 by the tracer will return a
573 .I status
574 value such that
577   status>>8 == (SIGTRAP | (PTRACE_EVENT_FORK<<8))
580 The PID of the new process can be retrieved with
581 .BR PTRACE_GETEVENTMSG .
583 .BR PTRACE_O_TRACESYSGOOD " (since Linux 2.4.6)"
584 When delivering system call traps, set bit 7 in the signal number
585 (i.e., deliver
586 .IR "SIGTRAP|0x80" ).
587 This makes it easy for the tracer to distinguish
588 normal traps from those caused by a system call.
590 .BR PTRACE_O_TRACEVFORK " (since Linux 2.5.46)"
591 Stop the tracee at the next
592 .BR vfork (2)
593 and automatically start tracing the newly vforked process,
594 which will start with a
595 .BR SIGSTOP ,
597 .B PTRACE_EVENT_STOP
599 .B PTRACE_SEIZE
600 was used.
602 .BR waitpid (2)
603 by the tracer will return a
604 .I status
605 value such that
608   status>>8 == (SIGTRAP | (PTRACE_EVENT_VFORK<<8))
611 The PID of the new process can be retrieved with
612 .BR PTRACE_GETEVENTMSG .
614 .BR PTRACE_O_TRACEVFORKDONE " (since Linux 2.5.60)"
615 Stop the tracee at the completion of the next
616 .BR vfork (2).
618 .BR waitpid (2)
619 by the tracer will return a
620 .I status
621 value such that
624   status>>8 == (SIGTRAP | (PTRACE_EVENT_VFORK_DONE<<8))
627 The PID of the new process can (since Linux 2.6.18) be retrieved with
628 .BR PTRACE_GETEVENTMSG .
630 .BR PTRACE_O_TRACESECCOMP " (since Linux 3.5)"
631 Stop the tracee when a
632 .BR seccomp (2)
633 .BR SECCOMP_RET_TRACE
634 rule is triggered.
636 .BR waitpid (2)
637 by the tracer will return a
638 .I status
639 value such that
642   status>>8 == (SIGTRAP | (PTRACE_EVENT_SECCOMP<<8))
645 While this triggers a
646 .BR PTRACE_EVENT
647 stop, it is similar to a syscall-enter-stop.
648 For details, see the note on
649 .B PTRACE_EVENT_SECCOMP
650 below.
651 The seccomp event message data (from the
652 .BR SECCOMP_RET_DATA
653 portion of the seccomp filter rule) can be retrieved with
654 .BR PTRACE_GETEVENTMSG .
656 .BR PTRACE_O_SUSPEND_SECCOMP " (since Linux 4.3)"
657 .\" commit 13c4a90119d28cfcb6b5bdd820c233b86c2b0237
658 Suspend the tracee's seccomp protections.
659 This applies regardless of mode, and
660 can be used when the tracee has not yet installed seccomp filters.
661 That is, a valid use case is to suspend a tracee's seccomp protections
662 before they are installed by the tracee,
663 let the tracee install the filters,
664 and then clear this flag when the filters should be resumed.
665 Setting this option requires that the tracer have the
666 .BR CAP_SYS_ADMIN
667 capability,
668 not have any seccomp protections installed, and not have
669 .BR PTRACE_O_SUSPEND_SECCOMP
670 set on itself.
673 .BR PTRACE_GETEVENTMSG " (since Linux 2.5.46)"
674 Retrieve a message (as an
675 .IR "unsigned long" )
676 about the ptrace event
677 that just happened, placing it at the address
678 .I data
679 in the tracer.
681 .BR PTRACE_EVENT_EXIT ,
682 this is the tracee's exit status.
684 .BR PTRACE_EVENT_FORK ,
685 .BR PTRACE_EVENT_VFORK ,
686 .BR PTRACE_EVENT_VFORK_DONE ,
688 .BR PTRACE_EVENT_CLONE ,
689 this is the PID of the new process.
691 .BR PTRACE_EVENT_SECCOMP ,
692 this is the
693 .BR seccomp (2)
694 filter's
695 .BR SECCOMP_RET_DATA
696 associated with the triggered rule.
697 .RI ( addr
698 is ignored.)
700 .B PTRACE_CONT
701 Restart the stopped tracee process.
703 .I data
704 is nonzero,
705 it is interpreted as the number of a signal to be delivered to the tracee;
706 otherwise, no signal is delivered.
707 Thus, for example, the tracer can control
708 whether a signal sent to the tracee is delivered or not.
709 .RI ( addr
710 is ignored.)
712 .BR PTRACE_SYSCALL ", " PTRACE_SINGLESTEP
713 Restart the stopped tracee as for
714 .BR PTRACE_CONT ,
715 but arrange for the tracee to be stopped at
716 the next entry to or exit from a system call,
717 or after execution of a single instruction, respectively.
718 (The tracee will also, as usual, be stopped upon receipt of a signal.)
719 From the tracer's perspective, the tracee will appear to have been
720 stopped by receipt of a
721 .BR SIGTRAP .
722 So, for
723 .BR PTRACE_SYSCALL ,
724 for example, the idea is to inspect
725 the arguments to the system call at the first stop,
726 then do another
727 .B PTRACE_SYSCALL
728 and inspect the return value of the system call at the second stop.
730 .I data
731 argument is treated as for
732 .BR PTRACE_CONT .
733 .RI ( addr
734 is ignored.)
736 .BR PTRACE_SYSEMU ", " PTRACE_SYSEMU_SINGLESTEP " (since Linux 2.6.14)"
738 .BR PTRACE_SYSEMU ,
739 continue and stop on entry to the next system call,
740 which will not be executed.
741 See the documentation on syscall-stops below.
743 .BR PTRACE_SYSEMU_SINGLESTEP ,
744 do the same but also singlestep if not a system call.
745 This call is used by programs like
746 User Mode Linux that want to emulate all the tracee's system calls.
748 .I data
749 argument is treated as for
750 .BR PTRACE_CONT .
752 .I addr
753 argument is ignored.
754 These requests are currently
755 .\" As at 3.7
756 supported only on x86.
758 .BR PTRACE_LISTEN " (since Linux 3.4)"
759 Restart the stopped tracee, but prevent it from executing.
760 The resulting state of the tracee is similar to a process which
761 has been stopped by a
762 .B SIGSTOP
763 (or other stopping signal).
764 See the "group-stop" subsection for additional information.
765 .B PTRACE_LISTEN
766 works only on tracees attached by
767 .BR PTRACE_SEIZE .
769 .B PTRACE_KILL
770 Send the tracee a
771 .B SIGKILL
772 to terminate it.
773 .RI ( addr
775 .I data
776 are ignored.)
778 .I This operation is deprecated; do not use it!
779 Instead, send a
780 .BR SIGKILL
781 directly using
782 .BR kill (2)
784 .BR tgkill (2).
785 The problem with
786 .B PTRACE_KILL
787 is that it requires the tracee to be in signal-delivery-stop,
788 otherwise it may not work
789 (i.e., may complete successfully but won't kill the tracee).
790 By contrast, sending a
791 .B SIGKILL
792 directly has no such limitation.
793 .\" [Note from Denys Vlasenko:
794 .\"     deprecation suggested by Oleg Nesterov. He prefers to deprecate it
795 .\"     instead of describing (and needing to support) PTRACE_KILL's quirks.]
797 .BR PTRACE_INTERRUPT " (since Linux 3.4)"
798 Stop a tracee.
799 If the tracee is running or sleeping in kernel space and
800 .B PTRACE_SYSCALL
801 is in effect,
802 the system call is interrupted and syscall-exit-stop is reported.
803 (The interrupted system call is restarted when the tracee is restarted.)
804 If the tracee was already stopped by a signal and
805 .B PTRACE_LISTEN
806 was sent to it,
807 the tracee stops with
808 .B PTRACE_EVENT_STOP
810 .I WSTOPSIG(status)
811 returns the stop signal.
812 If any other ptrace-stop is generated at the same time (for example,
813 if a signal is sent to the tracee), this ptrace-stop happens.
814 If none of the above applies (for example, if the tracee is running in user
815 space), it stops with
816 .B PTRACE_EVENT_STOP
817 with
818 .I WSTOPSIG(status)
820 .BR SIGTRAP .
821 .B PTRACE_INTERRUPT
822 only works on tracees attached by
823 .BR PTRACE_SEIZE .
825 .B PTRACE_ATTACH
826 Attach to the process specified in
827 .IR pid ,
828 making it a tracee of the calling process.
829 .\" No longer true (removed by Denys Vlasenko, 2011, who remarks:
830 .\"        "I think it isn't true in non-ancient 2.4 and in 2.6/3.x.
831 .\"         Basically, it's not true for any Linux in practical use.
832 .\" ; the behavior of the tracee is as if it had done a
833 .\" .BR PTRACE_TRACEME .
834 .\" The calling process actually becomes the parent of the tracee
835 .\" process for most purposes (e.g., it will receive
836 .\" notification of tracee events and appears in
837 .\" .BR ps (1)
838 .\" output as the tracee's parent), but a
839 .\" .BR getppid (2)
840 .\" by the tracee will still return the PID of the original parent.
841 The tracee is sent a
842 .BR SIGSTOP ,
843 but will not necessarily have stopped
844 by the completion of this call; use
845 .BR waitpid (2)
846 to wait for the tracee to stop.
847 See the "Attaching and detaching" subsection for additional information.
848 .RI ( addr
850 .I data
851 are ignored.)
853 Permission to perform a
854 .BR PTRACE_ATTACH
855 is governed by a ptrace access mode
856 .B PTRACE_MODE_ATTACH_REALCREDS
857 check; see below.
859 .BR PTRACE_SEIZE " (since Linux 3.4)"
861 .\" Noted by Dmitry Levin:
863 .\"     PTRACE_SEIZE was introduced by commit v3.1-rc1~308^2~28, but
864 .\"     it had to be used along with a temporary flag PTRACE_SEIZE_DEVEL,
865 .\"     which was removed later by commit v3.4-rc1~109^2~20.
867 .\"     That is, [before] v3.4 we had a test mode of PTRACE_SEIZE API,
868 .\"     which was not compatible with the current PTRACE_SEIZE API introduced
869 .\"     in Linux 3.4.
871 Attach to the process specified in
872 .IR pid ,
873 making it a tracee of the calling process.
874 Unlike
875 .BR PTRACE_ATTACH ,
876 .B PTRACE_SEIZE
877 does not stop the process.
878 Group-stops are reported as
879 .B PTRACE_EVENT_STOP
881 .I WSTOPSIG(status)
882 returns the stop signal.
883 Automatically attached children stop with
884 .B PTRACE_EVENT_STOP
886 .I WSTOPSIG(status)
887 returns
888 .B SIGTRAP
889 instead of having
890 .B SIGSTOP
891 signal delivered to them.
892 .BR execve (2)
893 does not deliver an extra
894 .BR SIGTRAP .
895 Only a
896 .BR PTRACE_SEIZE d
897 process can accept
898 .B PTRACE_INTERRUPT
900 .B PTRACE_LISTEN
901 commands.
902 The "seized" behavior just described is inherited by
903 children that are automatically attached using
904 .BR PTRACE_O_TRACEFORK ,
905 .BR PTRACE_O_TRACEVFORK ,
907 .BR PTRACE_O_TRACECLONE .
908 .I addr
909 must be zero.
910 .I data
911 contains a bit mask of ptrace options to activate immediately.
913 Permission to perform a
914 .BR PTRACE_SEIZE
915 is governed by a ptrace access mode
916 .B PTRACE_MODE_ATTACH_REALCREDS
917 check; see below.
920 .BR PTRACE_SECCOMP_GET_FILTER " (since Linux 4.4)"
921 .\" commit f8e529ed941ba2bbcbf310b575d968159ce7e895
922 This operation allows the tracer to dump the tracee's
923 classic BPF filters.
925 .I addr
926 is an integer specifying the index of the filter to be dumped.
927 The most recently installed filter has the index 0.
929 .I addr
930 is greater than the number of installed filters,
931 the operation fails with the error
932 .BR ENOENT .
934 .I data
935 is either a pointer to a
936 .IR "struct sock_filter"
937 array that is large enough to store the BPF program,
938 or NULL if the program is not to be stored.
940 Upon success,
941 the return value is the number of instructions in the BPF program.
943 .I data
944 was NULL, then this return value can be used to correctly size the
945 .IR "struct sock_filter"
946 array passed in a subsequent call.
948 This operation fails with the error
949 .B EACCES
950 if the caller does not have the
951 .B CAP_SYS_ADMIN
952 capability or if the caller is in strict or filter seccomp mode.
953 If the filter referred to by
954 .I addr
955 is not a classic BPF filter, the operation fails with the error
956 .BR EMEDIUMTYPE .
958 This operation is available if the kernel was configured with both the
959 .B CONFIG_SECCOMP_FILTER
960 and the
961 .B CONFIG_CHECKPOINT_RESTORE
962 options.
964 .B PTRACE_DETACH
965 Restart the stopped tracee as for
966 .BR PTRACE_CONT ,
967 but first detach from it.
968 Under Linux, a tracee can be detached in this way regardless
969 of which method was used to initiate tracing.
970 .RI ( addr
971 is ignored.)
974 .BR PTRACE_GET_THREAD_AREA " (since Linux 2.6.0)"
975 This operation performs a similar task to
976 .BR get_thread_area (2).
977 It reads the TLS entry in the GDT whose index is given in
978 .IR addr ,
979 placing a copy of the entry into the
980 .IR "struct user_desc"
981 pointed to by
982 .IR data .
983 (By contrast with
984 .BR get_thread_area (2),
986 .I entry_number
987 of the
988 .IR "struct user_desc"
989 is ignored.)
991 .BR PTRACE_SET_THREAD_AREA " (since Linux 2.6.0)"
992 This operation performs a similar task to
993 .BR set_thread_area (2).
994 It sets the TLS entry in the GDT whose index is given in
995 .IR addr ,
996 assigning it the data supplied in the
997 .IR "struct user_desc"
998 pointed to by
999 .IR data .
1000 (By contrast with
1001 .BR set_thread_area (2),
1003 .I entry_number
1004 of the
1005 .IR "struct user_desc"
1006 is ignored; in other words,
1007 this ptrace operation can't be used to allocate a free TLS entry.)
1009 .SS Death under ptrace
1010 When a (possibly multithreaded) process receives a killing signal
1011 (one whose disposition is set to
1012 .B SIG_DFL
1013 and whose default action is to kill the process),
1014 all threads exit.
1015 Tracees report their death to their tracer(s).
1016 Notification of this event is delivered via
1017 .BR waitpid (2).
1019 Note that the killing signal will first cause signal-delivery-stop
1020 (on one tracee only),
1021 and only after it is injected by the tracer
1022 (or after it was dispatched to a thread which isn't traced),
1023 will death from the signal happen on
1024 .I all
1025 tracees within a multithreaded process.
1026 (The term "signal-delivery-stop" is explained below.)
1028 .B SIGKILL
1029 does not generate signal-delivery-stop and
1030 therefore the tracer can't suppress it.
1031 .B SIGKILL
1032 kills even within system calls
1033 (syscall-exit-stop is not generated prior to death by
1034 .BR SIGKILL ).
1035 The net effect is that
1036 .B SIGKILL
1037 always kills the process (all its threads),
1038 even if some threads of the process are ptraced.
1040 When the tracee calls
1041 .BR _exit (2),
1042 it reports its death to its tracer.
1043 Other threads are not affected.
1045 When any thread executes
1046 .BR exit_group (2),
1047 every tracee in its thread group reports its death to its tracer.
1049 If the
1050 .B PTRACE_O_TRACEEXIT
1051 option is on,
1052 .B PTRACE_EVENT_EXIT
1053 will happen before actual death.
1054 This applies to exits via
1055 .BR exit (2),
1056 .BR exit_group (2),
1057 and signal deaths (except
1058 .BR SIGKILL ,
1059 depending on the kernel version; see BUGS below),
1060 and when threads are torn down on
1061 .BR execve (2)
1062 in a multithreaded process.
1064 The tracer cannot assume that the ptrace-stopped tracee exists.
1065 There are many scenarios when the tracee may die while stopped (such as
1066 .BR SIGKILL ).
1067 Therefore, the tracer must be prepared to handle an
1068 .B ESRCH
1069 error on any ptrace operation.
1070 Unfortunately, the same error is returned if the tracee
1071 exists but is not ptrace-stopped
1072 (for commands which require a stopped tracee),
1073 or if it is not traced by the process which issued the ptrace call.
1074 The tracer needs to keep track of the stopped/running state of the tracee,
1075 and interpret
1076 .B ESRCH
1077 as "tracee died unexpectedly" only if it knows that the tracee has
1078 been observed to enter ptrace-stop.
1079 Note that there is no guarantee that
1080 .I waitpid(WNOHANG)
1081 will reliably report the tracee's death status if a
1082 ptrace operation returned
1083 .BR ESRCH .
1084 .I waitpid(WNOHANG)
1085 may return 0 instead.
1086 In other words, the tracee may be "not yet fully dead",
1087 but already refusing ptrace requests.
1089 The tracer can't assume that the tracee
1090 .I always
1091 ends its life by reporting
1092 .I WIFEXITED(status)
1094 .IR WIFSIGNALED(status) ;
1095 there are cases where this does not occur.
1096 For example, if a thread other than thread group leader does an
1097 .BR execve (2),
1098 it disappears;
1099 its PID will never be seen again,
1100 and any subsequent ptrace stops will be reported under
1101 the thread group leader's PID.
1102 .SS Stopped states
1103 A tracee can be in two states: running or stopped.
1104 For the purposes of ptrace, a tracee which is blocked in a system call
1105 (such as
1106 .BR read (2),
1107 .BR pause (2),
1108 etc.)
1109 is nevertheless considered to be running, even if the tracee is blocked
1110 for a long time.
1111 The state of the tracee after
1112 .BR PTRACE_LISTEN
1113 is somewhat of a gray area: it is not in any ptrace-stop (ptrace commands
1114 won't work on it, and it will deliver
1115 .BR waitpid (2)
1116 notifications),
1117 but it also may be considered "stopped" because
1118 it is not executing instructions (is not scheduled), and if it was
1119 in group-stop before
1120 .BR PTRACE_LISTEN ,
1121 it will not respond to signals until
1122 .B SIGCONT
1123 is received.
1125 There are many kinds of states when the tracee is stopped, and in ptrace
1126 discussions they are often conflated.
1127 Therefore, it is important to use precise terms.
1129 In this manual page, any stopped state in which the tracee is ready
1130 to accept ptrace commands from the tracer is called
1131 .IR ptrace-stop .
1132 Ptrace-stops can
1133 be further subdivided into
1134 .IR signal-delivery-stop ,
1135 .IR group-stop ,
1136 .IR syscall-stop ,
1137 .IR "PTRACE_EVENT stops" ,
1138 and so on.
1139 These stopped states are described in detail below.
1141 When the running tracee enters ptrace-stop, it notifies its tracer using
1142 .BR waitpid (2)
1143 (or one of the other "wait" system calls).
1144 Most of this manual page assumes that the tracer waits with:
1146     pid = waitpid(pid_or_minus_1, &status, __WALL);
1148 Ptrace-stopped tracees are reported as returns with
1149 .I pid
1150 greater than 0 and
1151 .I WIFSTOPPED(status)
1152 true.
1153 .\" Denys Vlasenko:
1154 .\"     Do we require __WALL usage, or will just using 0 be ok? (With 0,
1155 .\"     I am not 100% sure there aren't ugly corner cases.) Are the
1156 .\"     rules different if user wants to use waitid? Will waitid require
1157 .\"     WEXITED?
1161 .B __WALL
1162 flag does not include the
1163 .B WSTOPPED
1165 .B WEXITED
1166 flags, but implies their functionality.
1168 Setting the
1169 .B WCONTINUED
1170 flag when calling
1171 .BR waitpid (2)
1172 is not recommended: the "continued" state is per-process and
1173 consuming it can confuse the real parent of the tracee.
1175 Use of the
1176 .B WNOHANG
1177 flag may cause
1178 .BR waitpid (2)
1179 to return 0 ("no wait results available yet")
1180 even if the tracer knows there should be a notification.
1181 Example:
1183 .in +4n
1185 errno = 0;
1186 ptrace(PTRACE_CONT, pid, 0L, 0L);
1187 if (errno == ESRCH) {
1188     /* tracee is dead */
1189     r = waitpid(tracee, &status, __WALL | WNOHANG);
1190     /* r can still be 0 here! */
1194 .\" FIXME .
1195 .\"     waitid usage? WNOWAIT?
1196 .\"     describe how wait notifications queue (or not queue)
1198 The following kinds of ptrace-stops exist: signal-delivery-stops,
1199 group-stops,
1200 .B PTRACE_EVENT
1201 stops, syscall-stops.
1202 They all are reported by
1203 .BR waitpid (2)
1204 with
1205 .I WIFSTOPPED(status)
1206 true.
1207 They may be differentiated by examining the value
1208 .IR status>>8 ,
1209 and if there is ambiguity in that value, by querying
1210 .BR PTRACE_GETSIGINFO .
1211 (Note: the
1212 .I WSTOPSIG(status)
1213 macro can't be used to perform this examination,
1214 because it returns the value
1215 .IR "(status>>8)\ &\ 0xff" .)
1216 .SS Signal-delivery-stop
1217 When a (possibly multithreaded) process receives any signal except
1218 .BR SIGKILL ,
1219 the kernel selects an arbitrary thread which handles the signal.
1220 (If the signal is generated with
1221 .BR tgkill (2),
1222 the target thread can be explicitly selected by the caller.)
1223 If the selected thread is traced, it enters signal-delivery-stop.
1224 At this point, the signal is not yet delivered to the process,
1225 and can be suppressed by the tracer.
1226 If the tracer doesn't suppress the signal,
1227 it passes the signal to the tracee in the next ptrace restart request.
1228 This second step of signal delivery is called
1229 .I "signal injection"
1230 in this manual page.
1231 Note that if the signal is blocked,
1232 signal-delivery-stop doesn't happen until the signal is unblocked,
1233 with the usual exception that
1234 .B SIGSTOP
1235 can't be blocked.
1237 Signal-delivery-stop is observed by the tracer as
1238 .BR waitpid (2)
1239 returning with
1240 .I WIFSTOPPED(status)
1241 true, with the signal returned by
1242 .IR WSTOPSIG(status) .
1243 If the signal is
1244 .BR SIGTRAP ,
1245 this may be a different kind of ptrace-stop;
1246 see the "Syscall-stops" and "execve" sections below for details.
1248 .I WSTOPSIG(status)
1249 returns a stopping signal, this may be a group-stop; see below.
1250 .SS Signal injection and suppression
1251 After signal-delivery-stop is observed by the tracer,
1252 the tracer should restart the tracee with the call
1254     ptrace(PTRACE_restart, pid, 0, sig)
1256 where
1257 .B PTRACE_restart
1258 is one of the restarting ptrace requests.
1260 .I sig
1261 is 0, then a signal is not delivered.
1262 Otherwise, the signal
1263 .I sig
1264 is delivered.
1265 This operation is called
1266 .I "signal injection"
1267 in this manual page, to distinguish it from signal-delivery-stop.
1270 .I sig
1271 value may be different from the
1272 .I WSTOPSIG(status)
1273 value: the tracer can cause a different signal to be injected.
1275 Note that a suppressed signal still causes system calls to return
1276 prematurely.
1277 In this case, system calls will be restarted: the tracer will
1278 observe the tracee to reexecute the interrupted system call (or
1279 .BR restart_syscall (2)
1280 system call for a few system calls which use a different mechanism
1281 for restarting) if the tracer uses
1282 .BR PTRACE_SYSCALL .
1283 Even system calls (such as
1284 .BR poll (2))
1285 which are not restartable after signal are restarted after
1286 signal is suppressed;
1287 however, kernel bugs exist which cause some system calls to fail with
1288 .B EINTR
1289 even though no observable signal is injected to the tracee.
1291 Restarting ptrace commands issued in ptrace-stops other than
1292 signal-delivery-stop are not guaranteed to inject a signal, even if
1293 .I sig
1294 is nonzero.
1295 No error is reported; a nonzero
1296 .I sig
1297 may simply be ignored.
1298 Ptrace users should not try to "create a new signal" this way: use
1299 .BR tgkill (2)
1300 instead.
1302 The fact that signal injection requests may be ignored
1303 when restarting the tracee after
1304 ptrace stops that are not signal-delivery-stops
1305 is a cause of confusion among ptrace users.
1306 One typical scenario is that the tracer observes group-stop,
1307 mistakes it for signal-delivery-stop, restarts the tracee with
1309     ptrace(PTRACE_restart, pid, 0, stopsig)
1311 with the intention of injecting
1312 .IR stopsig ,
1314 .I stopsig
1315 gets ignored and the tracee continues to run.
1318 .B SIGCONT
1319 signal has a side effect of waking up (all threads of)
1320 a group-stopped process.
1321 This side effect happens before signal-delivery-stop.
1322 The tracer can't suppress this side effect (it can
1323 only suppress signal injection, which only causes the
1324 .BR SIGCONT
1325 handler to not be executed in the tracee, if such a handler is installed).
1326 In fact, waking up from group-stop may be followed by
1327 signal-delivery-stop for signal(s)
1328 .I other than
1329 .BR SIGCONT ,
1330 if they were pending when
1331 .B SIGCONT
1332 was delivered.
1333 In other words,
1334 .B SIGCONT
1335 may be not the first signal observed by the tracee after it was sent.
1337 Stopping signals cause (all threads of) a process to enter group-stop.
1338 This side effect happens after signal injection, and therefore can be
1339 suppressed by the tracer.
1341 In Linux 2.4 and earlier, the
1342 .B SIGSTOP
1343 signal can't be injected.
1344 .\" In the Linux 2.4 sources, in arch/i386/kernel/signal.c::do_signal(),
1345 .\" there is:
1347 .\"             /* The debugger continued.  Ignore SIGSTOP.  */
1348 .\"             if (signr == SIGSTOP)
1349 .\"                     continue;
1351 .B PTRACE_GETSIGINFO
1352 can be used to retrieve a
1353 .I siginfo_t
1354 structure which corresponds to the delivered signal.
1355 .B PTRACE_SETSIGINFO
1356 may be used to modify it.
1358 .B PTRACE_SETSIGINFO
1359 has been used to alter
1360 .IR siginfo_t ,
1362 .I si_signo
1363 field and the
1364 .I sig
1365 parameter in the restarting command must match,
1366 otherwise the result is undefined.
1367 .SS Group-stop
1368 When a (possibly multithreaded) process receives a stopping signal,
1369 all threads stop.
1370 If some threads are traced, they enter a group-stop.
1371 Note that the stopping signal will first cause signal-delivery-stop
1372 (on one tracee only), and only after it is injected by the tracer
1373 (or after it was dispatched to a thread which isn't traced),
1374 will group-stop be initiated on
1375 .I all
1376 tracees within the multithreaded process.
1377 As usual, every tracee reports its group-stop separately
1378 to the corresponding tracer.
1380 Group-stop is observed by the tracer as
1381 .BR waitpid (2)
1382 returning with
1383 .I WIFSTOPPED(status)
1384 true, with the stopping signal available via
1385 .IR WSTOPSIG(status) .
1386 The same result is returned by some other classes of ptrace-stops,
1387 therefore the recommended practice is to perform the call
1389     ptrace(PTRACE_GETSIGINFO, pid, 0, &siginfo)
1391 The call can be avoided if the signal is not
1392 .BR SIGSTOP ,
1393 .BR SIGTSTP ,
1394 .BR SIGTTIN ,
1396 .BR SIGTTOU ;
1397 only these four signals are stopping signals.
1398 If the tracer sees something else, it can't be a group-stop.
1399 Otherwise, the tracer needs to call
1400 .BR PTRACE_GETSIGINFO .
1402 .B PTRACE_GETSIGINFO
1403 fails with
1404 .BR EINVAL ,
1405 then it is definitely a group-stop.
1406 (Other failure codes are possible, such as
1407 .B ESRCH
1408 ("no such process") if a
1409 .B SIGKILL
1410 killed the tracee.)
1412 If tracee was attached using
1413 .BR PTRACE_SEIZE ,
1414 group-stop is indicated by
1415 .BR PTRACE_EVENT_STOP :
1416 .IR "status>>16 == PTRACE_EVENT_STOP" .
1417 This allows detection of group-stops
1418 without requiring an extra
1419 .B PTRACE_GETSIGINFO
1420 call.
1422 As of Linux 2.6.38,
1423 after the tracer sees the tracee ptrace-stop and until it
1424 restarts or kills it, the tracee will not run,
1425 and will not send notifications (except
1426 .B SIGKILL
1427 death) to the tracer, even if the tracer enters into another
1428 .BR waitpid (2)
1429 call.
1431 The kernel behavior described in the previous paragraph
1432 causes a problem with transparent handling of stopping signals.
1433 If the tracer restarts the tracee after group-stop,
1434 the stopping signal
1435 is effectively ignored\(emthe tracee doesn't remain stopped, it runs.
1436 If the tracer doesn't restart the tracee before entering into the next
1437 .BR waitpid (2),
1438 future
1439 .B SIGCONT
1440 signals will not be reported to the tracer;
1441 this would cause the
1442 .B SIGCONT
1443 signals to have no effect on the tracee.
1445 Since Linux 3.4, there is a method to overcome this problem: instead of
1446 .BR PTRACE_CONT ,
1448 .B PTRACE_LISTEN
1449 command can be used to restart a tracee in a way where it does not execute,
1450 but waits for a new event which it can report via
1451 .BR waitpid (2)
1452 (such as when
1453 it is restarted by a
1454 .BR SIGCONT ).
1455 .SS PTRACE_EVENT stops
1456 If the tracer sets
1457 .B PTRACE_O_TRACE_*
1458 options, the tracee will enter ptrace-stops called
1459 .B PTRACE_EVENT
1460 stops.
1462 .B PTRACE_EVENT
1463 stops are observed by the tracer as
1464 .BR waitpid (2)
1465 returning with
1466 .IR WIFSTOPPED(status) ,
1468 .I WSTOPSIG(status)
1469 returns
1470 .BR SIGTRAP .
1471 An additional bit is set in the higher byte of the status word:
1472 the value
1473 .I status>>8
1474 will be
1476     (SIGTRAP | PTRACE_EVENT_foo << 8).
1478 The following events exist:
1480 .B PTRACE_EVENT_VFORK
1481 Stop before return from
1482 .BR vfork (2)
1484 .BR clone (2)
1485 with the
1486 .B CLONE_VFORK
1487 flag.
1488 When the tracee is continued after this stop, it will wait for child to
1489 exit/exec before continuing its execution
1490 (in other words, the usual behavior on
1491 .BR vfork (2)).
1493 .B PTRACE_EVENT_FORK
1494 Stop before return from
1495 .BR fork (2)
1497 .BR clone (2)
1498 with the exit signal set to
1499 .BR SIGCHLD .
1501 .B PTRACE_EVENT_CLONE
1502 Stop before return from
1503 .BR clone (2).
1505 .B PTRACE_EVENT_VFORK_DONE
1506 Stop before return from
1507 .BR vfork (2)
1509 .BR clone (2)
1510 with the
1511 .B CLONE_VFORK
1512 flag,
1513 but after the child unblocked this tracee by exiting or execing.
1515 For all four stops described above,
1516 the stop occurs in the parent (i.e., the tracee),
1517 not in the newly created thread.
1518 .BR PTRACE_GETEVENTMSG
1519 can be used to retrieve the new thread's ID.
1521 .B PTRACE_EVENT_EXEC
1522 Stop before return from
1523 .BR execve (2).
1524 Since Linux 3.0,
1525 .BR PTRACE_GETEVENTMSG
1526 returns the former thread ID.
1528 .B PTRACE_EVENT_EXIT
1529 Stop before exit (including death from
1530 .BR exit_group (2)),
1531 signal death, or exit caused by
1532 .BR execve (2)
1533 in a multithreaded process.
1534 .B PTRACE_GETEVENTMSG
1535 returns the exit status.
1536 Registers can be examined
1537 (unlike when "real" exit happens).
1538 The tracee is still alive; it needs to be
1539 .BR PTRACE_CONT ed
1541 .BR PTRACE_DETACH ed
1542 to finish exiting.
1544 .B PTRACE_EVENT_STOP
1545 Stop induced by
1546 .B PTRACE_INTERRUPT
1547 command, or group-stop, or initial ptrace-stop when a new child is attached
1548 (only if attached using
1549 .BR PTRACE_SEIZE ).
1551 .B PTRACE_EVENT_SECCOMP
1552 Stop triggered by a
1553 .BR seccomp (2)
1554 rule on tracee syscall entry when
1555 .BR PTRACE_O_TRACESECCOMP
1556 has been set by the tracer.
1557 The seccomp event message data (from the
1558 .BR SECCOMP_RET_DATA
1559 portion of the seccomp filter rule) can be retrieved with
1560 .BR PTRACE_GETEVENTMSG .
1561 The semantics of this stop are described in
1562 detail in a separate section below.
1564 .B PTRACE_GETSIGINFO
1566 .B PTRACE_EVENT
1567 stops returns
1568 .B SIGTRAP
1570 .IR si_signo ,
1571 with
1572 .I si_code
1573 set to
1574 .IR "(event<<8)\ |\ SIGTRAP" .
1575 .SS Syscall-stops
1576 If the tracee was restarted by
1577 .BR PTRACE_SYSCALL
1579 .BR PTRACE_SYSEMU ,
1580 the tracee enters
1581 syscall-enter-stop just prior to entering any system call (which
1582 will not be executed if the restart was using
1583 .BR PTRACE_SYSEMU ,
1584 regardless of any change made to registers at this point or how the
1585 tracee is restarted after this stop).
1586 No matter which method caused the syscall-entry-stop,
1587 if the tracer restarts the tracee with
1588 .BR PTRACE_SYSCALL ,
1589 the tracee enters syscall-exit-stop when the system call is finished,
1590 or if it is interrupted by a signal.
1591 (That is, signal-delivery-stop never happens between syscall-enter-stop
1592 and syscall-exit-stop; it happens
1593 .I after
1594 syscall-exit-stop.).
1595 If the tracee is continued using any other method (including
1596 .BR PTRACE_SYSEMU ),
1597 no syscall-exit-stop occurs.
1598 Note that all mentions
1599 .BR PTRACE_SYSEMU
1600 apply equally to
1601 .BR PTRACE_SYSEMU_SINGLESTEP.
1603 However, even if the tracee was continued using
1604 .BR PTRACE_SYSCALL ,
1605 it is not guaranteed that the next stop will be a syscall-exit-stop.
1606 Other possibilities are that the tracee may stop in a
1607 .B PTRACE_EVENT
1608 stop (including seccomp stops), exit (if it entered
1609 .BR _exit (2)
1611 .BR exit_group (2)),
1612 be killed by
1613 .BR SIGKILL ,
1614 or die silently (if it is a thread group leader, the
1615 .BR execve (2)
1616 happened in another thread,
1617 and that thread is not traced by the same tracer;
1618 this situation is discussed later).
1620 Syscall-enter-stop and syscall-exit-stop are observed by the tracer as
1621 .BR waitpid (2)
1622 returning with
1623 .I WIFSTOPPED(status)
1624 true, and
1625 .I WSTOPSIG(status)
1626 giving
1627 .BR SIGTRAP .
1628 If the
1629 .B PTRACE_O_TRACESYSGOOD
1630 option was set by the tracer, then
1631 .I WSTOPSIG(status)
1632 will give the value
1633 .IR "(SIGTRAP\ |\ 0x80)" .
1635 Syscall-stops can be distinguished from signal-delivery-stop with
1636 .B SIGTRAP
1637 by querying
1638 .BR PTRACE_GETSIGINFO
1639 for the following cases:
1641 .IR si_code " <= 0"
1642 .B SIGTRAP
1643 was delivered as a result of a user-space action,
1644 for example, a system call
1645 .RB ( tgkill (2),
1646 .BR kill (2),
1647 .BR sigqueue (3),
1648 etc.),
1649 expiration of a POSIX timer,
1650 change of state on a POSIX message queue,
1651 or completion of an asynchronous I/O request.
1653 .IR si_code " == SI_KERNEL (0x80)"
1654 .B SIGTRAP
1655 was sent by the kernel.
1657 .IR si_code " == SIGTRAP or " si_code " == (SIGTRAP|0x80)"
1658 This is a syscall-stop.
1660 However, syscall-stops happen very often (twice per system call),
1661 and performing
1662 .B PTRACE_GETSIGINFO
1663 for every syscall-stop may be somewhat expensive.
1665 Some architectures allow the cases to be distinguished
1666 by examining registers.
1667 For example, on x86,
1668 .I rax
1670 .RB - ENOSYS
1671 in syscall-enter-stop.
1672 Since
1673 .B SIGTRAP
1674 (like any other signal) always happens
1675 .I after
1676 syscall-exit-stop,
1677 and at this point
1678 .I rax
1679 almost never contains
1680 .RB - ENOSYS ,
1682 .B SIGTRAP
1683 looks like "syscall-stop which is not syscall-enter-stop";
1684 in other words, it looks like a
1685 "stray syscall-exit-stop" and can be detected this way.
1686 But such detection is fragile and is best avoided.
1688 Using the
1689 .B PTRACE_O_TRACESYSGOOD
1690 option is the recommended method to distinguish syscall-stops
1691 from other kinds of ptrace-stops,
1692 since it is reliable and does not incur a performance penalty.
1694 Syscall-enter-stop and syscall-exit-stop are
1695 indistinguishable from each other by the tracer.
1696 The tracer needs to keep track of the sequence of
1697 ptrace-stops in order to not misinterpret syscall-enter-stop as
1698 syscall-exit-stop or vice versa.
1699 In general, a syscall-enter-stop is
1700 always followed by syscall-exit-stop,
1701 .B PTRACE_EVENT
1702 stop, or the tracee's death;
1703 no other kinds of ptrace-stop can occur in between.
1704 However, note that seccomp stops (see below) can cause syscall-exit-stops,
1705 without preceding syscall-entry-stops.
1706 If seccomp is in use, care needs
1707 to be taken not to misinterpret such stops as syscall-entry-stops.
1709 If after syscall-enter-stop,
1710 the tracer uses a restarting command other than
1711 .BR PTRACE_SYSCALL ,
1712 syscall-exit-stop is not generated.
1714 .B PTRACE_GETSIGINFO
1715 on syscall-stops returns
1716 .B SIGTRAP
1718 .IR si_signo ,
1719 with
1720 .I si_code
1721 set to
1722 .B SIGTRAP
1724 .IR (SIGTRAP|0x80) .
1726 .SS PTRACE_EVENT_SECCOMP stops (Linux 3.5 to 4.7)
1727 The behavior of
1728 .BR PTRACE_EVENT_SECCOMP
1729 stops and their interaction with other kinds
1730 of ptrace stops has changed between kernel versions.
1731 This documents the behavior
1732 from their introduction until Linux 4.7 (inclusive).
1733 The behavior in later kernel versions is documented in the next section.
1736 .BR PTRACE_EVENT_SECCOMP
1737 stop occurs whenever a
1738 .BR SECCOMP_RET_TRACE
1739 rule is triggered.
1740 This is independent of which methods was used to restart the system call.
1741 Notably, seccomp still runs even if the tracee was restarted using
1742 .BR PTRACE_SYSEMU
1743 and this system call is unconditionally skipped.
1745 Restarts from this stop will behave as if the stop had occurred right
1746 before the system call in question.
1747 In particular, both
1748 .BR PTRACE_SYSCALL
1750 .BR PTRACE_SYSEMU
1751 will normally cause a subsequent syscall-entry-stop.
1752 However, if after the
1753 .BR PTRACE_EVENT_SECCOMP
1754 the system call number is negative,
1755 both the syscall-entry-stop and the system call itself will be skipped.
1756 This means that if the system call number is negative after a
1757 .BR PTRACE_EVENT_SECCOMP
1758 and the tracee is restarted using
1759 .BR PTRACE_SYSCALL ,
1760 the next observed stop will be a syscall-exit-stop,
1761 rather than the syscall-entry-stop that might have been expected.
1763 .SS PTRACE_EVENT_SECCOMP stops (since Linux 4.8)
1764 Starting with Linux 4.8,
1765 .\" commit 93e35efb8de45393cf61ed07f7b407629bf698ea
1767 .BR PTRACE_EVENT_SECCOMP
1768 stop was reordered to occur between syscall-entry-stop and
1769 syscall-exit-stop.
1770 Note that seccomp no longer runs (and no
1771 .B PTRACE_EVENT_SECCOMP
1772 will be reported) if the system call is skipped due to
1773 .BR PTRACE_SYSEMU .
1775 Functionally, a
1776 .B PTRACE_EVENT_SECCOMP
1777 stop functions comparably
1778 to a syscall-entry-stop (i.e., continuations using
1779 .BR PTRACE_SYSCALL
1780 will cause syscall-exit-stops,
1781 the system call number may be changed and any other modified registers
1782 are visible to the to-be-executed system call as well).
1783 Note that there may be,
1784 but need not have been a preceding syscall-entry-stop.
1786 After a
1787 .BR PTRACE_EVENT_SECCOMP
1788 stop, seccomp will be rerun, with a
1789 .BR SECCOMP_RET_TRACE
1790 rule now functioning the same as a
1791 .BR SECCOMP_RET_ALLOW .
1792 Specifically, this means that if registers are not modified during the
1793 .BR PTRACE_EVENT_SECCOMP
1794 stop, the system call will then be allowed.
1796 .SS PTRACE_SINGLESTEP stops
1797 [Details of these kinds of stops are yet to be documented.]
1799 .\" FIXME .
1800 .\" document stops occurring with PTRACE_SINGLESTEP
1802 .SS Informational and restarting ptrace commands
1803 Most ptrace commands (all except
1804 .BR PTRACE_ATTACH ,
1805 .BR PTRACE_SEIZE ,
1806 .BR PTRACE_TRACEME ,
1807 .BR PTRACE_INTERRUPT ,
1809 .BR PTRACE_KILL )
1810 require the tracee to be in a ptrace-stop, otherwise they fail with
1811 .BR ESRCH .
1813 When the tracee is in ptrace-stop,
1814 the tracer can read and write data to
1815 the tracee using informational commands.
1816 These commands leave the tracee in ptrace-stopped state:
1818 .in +4n
1820 ptrace(PTRACE_PEEKTEXT/PEEKDATA/PEEKUSER, pid, addr, 0);
1821 ptrace(PTRACE_POKETEXT/POKEDATA/POKEUSER, pid, addr, long_val);
1822 ptrace(PTRACE_GETREGS/GETFPREGS, pid, 0, &struct);
1823 ptrace(PTRACE_SETREGS/SETFPREGS, pid, 0, &struct);
1824 ptrace(PTRACE_GETREGSET, pid, NT_foo, &iov);
1825 ptrace(PTRACE_SETREGSET, pid, NT_foo, &iov);
1826 ptrace(PTRACE_GETSIGINFO, pid, 0, &siginfo);
1827 ptrace(PTRACE_SETSIGINFO, pid, 0, &siginfo);
1828 ptrace(PTRACE_GETEVENTMSG, pid, 0, &long_var);
1829 ptrace(PTRACE_SETOPTIONS, pid, 0, PTRACE_O_flags);
1833 Note that some errors are not reported.
1834 For example, setting signal information
1835 .RI ( siginfo )
1836 may have no effect in some ptrace-stops, yet the call may succeed
1837 (return 0 and not set
1838 .IR errno );
1839 querying
1840 .B PTRACE_GETEVENTMSG
1841 may succeed and return some random value if current ptrace-stop
1842 is not documented as returning a meaningful event message.
1844 The call
1846     ptrace(PTRACE_SETOPTIONS, pid, 0, PTRACE_O_flags);
1848 affects one tracee.
1849 The tracee's current flags are replaced.
1850 Flags are inherited by new tracees created and "auto-attached" via active
1851 .BR PTRACE_O_TRACEFORK ,
1852 .BR PTRACE_O_TRACEVFORK ,
1854 .BR PTRACE_O_TRACECLONE
1855 options.
1857 Another group of commands makes the ptrace-stopped tracee run.
1858 They have the form:
1860     ptrace(cmd, pid, 0, sig);
1862 where
1863 .I cmd
1865 .BR PTRACE_CONT ,
1866 .BR PTRACE_LISTEN ,
1867 .BR PTRACE_DETACH ,
1868 .BR PTRACE_SYSCALL ,
1869 .BR PTRACE_SINGLESTEP ,
1870 .BR PTRACE_SYSEMU ,
1872 .BR PTRACE_SYSEMU_SINGLESTEP .
1873 If the tracee is in signal-delivery-stop,
1874 .I sig
1875 is the signal to be injected (if it is nonzero).
1876 Otherwise,
1877 .I sig
1878 may be ignored.
1879 (When restarting a tracee from a ptrace-stop other than signal-delivery-stop,
1880 recommended practice is to always pass 0 in
1881 .IR sig .)
1882 .SS Attaching and detaching
1883 A thread can be attached to the tracer using the call
1885     ptrace(PTRACE_ATTACH, pid, 0, 0);
1889     ptrace(PTRACE_SEIZE, pid, 0, PTRACE_O_flags);
1891 .B PTRACE_ATTACH
1892 sends
1893 .B SIGSTOP
1894 to this thread.
1895 If the tracer wants this
1896 .B SIGSTOP
1897 to have no effect, it needs to suppress it.
1898 Note that if other signals are concurrently sent to
1899 this thread during attach,
1900 the tracer may see the tracee enter signal-delivery-stop
1901 with other signal(s) first!
1902 The usual practice is to reinject these signals until
1903 .B SIGSTOP
1904 is seen, then suppress
1905 .B SIGSTOP
1906 injection.
1907 The design bug here is that a ptrace attach and a concurrently delivered
1908 .B SIGSTOP
1909 may race and the concurrent
1910 .B SIGSTOP
1911 may be lost.
1913 .\" FIXME Describe how to attach to a thread which is already group-stopped.
1915 Since attaching sends
1916 .B SIGSTOP
1917 and the tracer usually suppresses it, this may cause a stray
1918 .B EINTR
1919 return from the currently executing system call in the tracee,
1920 as described in the "Signal injection and suppression" section.
1922 Since Linux 3.4,
1923 .B PTRACE_SEIZE
1924 can be used instead of
1925 .BR PTRACE_ATTACH .
1926 .B PTRACE_SEIZE
1927 does not stop the attached process.
1928 If you need to stop
1929 it after attach (or at any other time) without sending it any signals,
1931 .B PTRACE_INTERRUPT
1932 command.
1934 The request
1936     ptrace(PTRACE_TRACEME, 0, 0, 0);
1938 turns the calling thread into a tracee.
1939 The thread continues to run (doesn't enter ptrace-stop).
1940 A common practice is to follow the
1941 .B PTRACE_TRACEME
1942 with
1944     raise(SIGSTOP);
1946 and allow the parent (which is our tracer now) to observe our
1947 signal-delivery-stop.
1949 If the
1950 .BR PTRACE_O_TRACEFORK ,
1951 .BR PTRACE_O_TRACEVFORK ,
1953 .BR PTRACE_O_TRACECLONE
1954 options are in effect, then children created by, respectively,
1955 .BR vfork (2)
1957 .BR clone (2)
1958 with the
1959 .B CLONE_VFORK
1960 flag,
1961 .BR fork (2)
1963 .BR clone (2)
1964 with the exit signal set to
1965 .BR SIGCHLD ,
1966 and other kinds of
1967 .BR clone (2),
1968 are automatically attached to the same tracer which traced their parent.
1969 .B SIGSTOP
1970 is delivered to the children, causing them to enter
1971 signal-delivery-stop after they exit the system call which created them.
1973 Detaching of the tracee is performed by:
1975     ptrace(PTRACE_DETACH, pid, 0, sig);
1977 .B PTRACE_DETACH
1978 is a restarting operation;
1979 therefore it requires the tracee to be in ptrace-stop.
1980 If the tracee is in signal-delivery-stop, a signal can be injected.
1981 Otherwise, the
1982 .I sig
1983 parameter may be silently ignored.
1985 If the tracee is running when the tracer wants to detach it,
1986 the usual solution is to send
1987 .B SIGSTOP
1988 (using
1989 .BR tgkill (2),
1990 to make sure it goes to the correct thread),
1991 wait for the tracee to stop in signal-delivery-stop for
1992 .B SIGSTOP
1993 and then detach it (suppressing
1994 .B SIGSTOP
1995 injection).
1996 A design bug is that this can race with concurrent
1997 .BR SIGSTOP s.
1998 Another complication is that the tracee may enter other ptrace-stops
1999 and needs to be restarted and waited for again, until
2000 .B SIGSTOP
2001 is seen.
2002 Yet another complication is to be sure that
2003 the tracee is not already ptrace-stopped,
2004 because no signal delivery happens while it is\(emnot even
2005 .BR SIGSTOP .
2006 .\" FIXME Describe how to detach from a group-stopped tracee so that it
2007 .\" doesn't run, but continues to wait for SIGCONT.
2009 If the tracer dies, all tracees are automatically detached and restarted,
2010 unless they were in group-stop.
2011 Handling of restart from group-stop is currently buggy,
2012 but the "as planned" behavior is to leave tracee stopped and waiting for
2013 .BR SIGCONT .
2014 If the tracee is restarted from signal-delivery-stop,
2015 the pending signal is injected.
2016 .SS execve(2) under ptrace
2017 .\" clone(2) CLONE_THREAD says:
2018 .\"     If  any  of the threads in a thread group performs an execve(2),
2019 .\"     then all threads other than the thread group leader are terminated,
2020 .\"     and the new program is executed in the thread group leader.
2022 When one thread in a multithreaded process calls
2023 .BR execve (2),
2024 the kernel destroys all other threads in the process,
2025 .\" In kernel 3.1 sources, see fs/exec.c::de_thread()
2026 and resets the thread ID of the execing thread to the
2027 thread group ID (process ID).
2028 (Or, to put things another way, when a multithreaded process does an
2029 .BR execve (2),
2030 at completion of the call, it appears as though the
2031 .BR execve (2)
2032 occurred in the thread group leader, regardless of which thread did the
2033 .BR execve (2).)
2034 This resetting of the thread ID looks very confusing to tracers:
2035 .IP * 3
2036 All other threads stop in
2037 .B PTRACE_EVENT_EXIT
2038 stop, if the
2039 .BR PTRACE_O_TRACEEXIT
2040 option was turned on.
2041 Then all other threads except the thread group leader report
2042 death as if they exited via
2043 .BR _exit (2)
2044 with exit code 0.
2045 .IP *
2046 The execing tracee changes its thread ID while it is in the
2047 .BR execve (2).
2048 (Remember, under ptrace, the "pid" returned from
2049 .BR waitpid (2),
2050 or fed into ptrace calls, is the tracee's thread ID.)
2051 That is, the tracee's thread ID is reset to be the same as its process ID,
2052 which is the same as the thread group leader's thread ID.
2053 .IP *
2054 Then a
2055 .B PTRACE_EVENT_EXEC
2056 stop happens, if the
2057 .BR PTRACE_O_TRACEEXEC
2058 option was turned on.
2059 .IP *
2060 If the thread group leader has reported its
2061 .B PTRACE_EVENT_EXIT
2062 stop by this time,
2063 it appears to the tracer that
2064 the dead thread leader "reappears from nowhere".
2065 (Note: the thread group leader does not report death via
2066 .I WIFEXITED(status)
2067 until there is at least one other live thread.
2068 This eliminates the possibility that the tracer will see
2069 it dying and then reappearing.)
2070 If the thread group leader was still alive,
2071 for the tracer this may look as if thread group leader
2072 returns from a different system call than it entered,
2073 or even "returned from a system call even though
2074 it was not in any system call".
2075 If the thread group leader was not traced
2076 (or was traced by a different tracer), then during
2077 .BR execve (2)
2078 it will appear as if it has become a tracee of
2079 the tracer of the execing tracee.
2081 All of the above effects are the artifacts of
2082 the thread ID change in the tracee.
2085 .B PTRACE_O_TRACEEXEC
2086 option is the recommended tool for dealing with this situation.
2087 First, it enables
2088 .BR PTRACE_EVENT_EXEC
2089 stop,
2090 which occurs before
2091 .BR execve (2)
2092 returns.
2093 In this stop, the tracer can use
2094 .B PTRACE_GETEVENTMSG
2095 to retrieve the tracee's former thread ID.
2096 (This feature was introduced in Linux 3.0.)
2097 Second, the
2098 .B PTRACE_O_TRACEEXEC
2099 option disables legacy
2100 .B SIGTRAP
2101 generation on
2102 .BR execve (2).
2104 When the tracer receives
2105 .B PTRACE_EVENT_EXEC
2106 stop notification,
2107 it is guaranteed that except this tracee and the thread group leader,
2108 no other threads from the process are alive.
2110 On receiving the
2111 .B PTRACE_EVENT_EXEC
2112 stop notification,
2113 the tracer should clean up all its internal
2114 data structures describing the threads of this process,
2115 and retain only one data structure\(emone which
2116 describes the single still running tracee, with
2118     thread ID == thread group ID == process ID.
2120 Example: two threads call
2121 .BR execve (2)
2122 at the same time:
2125 *** we get syscall-enter-stop in thread 1: **
2126 PID1 execve("/bin/foo", "foo" <unfinished ...>
2127 *** we issue PTRACE_SYSCALL for thread 1 **
2128 *** we get syscall-enter-stop in thread 2: **
2129 PID2 execve("/bin/bar", "bar" <unfinished ...>
2130 *** we issue PTRACE_SYSCALL for thread 2 **
2131 *** we get PTRACE_EVENT_EXEC for PID0, we issue PTRACE_SYSCALL **
2132 *** we get syscall-exit-stop for PID0: **
2133 PID0 <... execve resumed> )             = 0
2136 If the
2137 .B PTRACE_O_TRACEEXEC
2138 option is
2139 .I not
2140 in effect for the execing tracee,
2141 and if the tracee was
2142 .BR PTRACE_ATTACH ed
2143 rather that
2144 .BR PTRACE_SEIZE d,
2145 the kernel delivers an extra
2146 .B SIGTRAP
2147 to the tracee after
2148 .BR execve (2)
2149 returns.
2150 This is an ordinary signal (similar to one which can be
2151 generated by
2152 .IR "kill -TRAP" ),
2153 not a special kind of ptrace-stop.
2154 Employing
2155 .B PTRACE_GETSIGINFO
2156 for this signal returns
2157 .I si_code
2158 set to 0
2159 .RI ( SI_USER ).
2160 This signal may be blocked by signal mask,
2161 and thus may be delivered (much) later.
2163 Usually, the tracer (for example,
2164 .BR strace (1))
2165 would not want to show this extra post-execve
2166 .B SIGTRAP
2167 signal to the user, and would suppress its delivery to the tracee (if
2168 .B SIGTRAP
2169 is set to
2170 .BR SIG_DFL ,
2171 it is a killing signal).
2172 However, determining
2173 .I which
2174 .B SIGTRAP
2175 to suppress is not easy.
2176 Setting the
2177 .B PTRACE_O_TRACEEXEC
2178 option or using
2179 .B PTRACE_SEIZE
2180 and thus suppressing this extra
2181 .B SIGTRAP
2182 is the recommended approach.
2183 .SS Real parent
2184 The ptrace API (ab)uses the standard UNIX parent/child signaling over
2185 .BR waitpid (2).
2186 This used to cause the real parent of the process to stop receiving
2187 several kinds of
2188 .BR waitpid (2)
2189 notifications when the child process is traced by some other process.
2191 Many of these bugs have been fixed, but as of Linux 2.6.38 several still
2192 exist; see BUGS below.
2194 As of Linux 2.6.38, the following is believed to work correctly:
2195 .IP * 3
2196 exit/death by signal is reported first to the tracer, then,
2197 when the tracer consumes the
2198 .BR waitpid (2)
2199 result, to the real parent (to the real parent only when the
2200 whole multithreaded process exits).
2201 If the tracer and the real parent are the same process,
2202 the report is sent only once.
2203 .SH RETURN VALUE
2204 On success, the
2205 .B PTRACE_PEEK*
2206 requests return the requested data (but see NOTES),
2208 .B PTRACE_SECCOMP_GET_FILTER
2209 request returns the number of instructions in the BPF program, and
2210 other requests return zero.
2212 On error, all requests return \-1, and
2213 .I errno
2214 is set appropriately.
2215 Since the value returned by a successful
2216 .B PTRACE_PEEK*
2217 request may be \-1, the caller must clear
2218 .I errno
2219 before the call, and then check it afterward
2220 to determine whether or not an error occurred.
2221 .SH ERRORS
2223 .B EBUSY
2224 (i386 only) There was an error with allocating or freeing a debug register.
2226 .B EFAULT
2227 There was an attempt to read from or write to an invalid area in
2228 the tracer's or the tracee's memory,
2229 probably because the area wasn't mapped or accessible.
2230 Unfortunately, under Linux, different variations of this fault
2231 will return
2232 .B EIO
2234 .B EFAULT
2235 more or less arbitrarily.
2237 .B EINVAL
2238 An attempt was made to set an invalid option.
2240 .B EIO
2241 .I request
2242 is invalid, or an attempt was made to read from or
2243 write to an invalid area in the tracer's or the tracee's memory,
2244 or there was a word-alignment violation,
2245 or an invalid signal was specified during a restart request.
2247 .B EPERM
2248 The specified process cannot be traced.
2249 This could be because the
2250 tracer has insufficient privileges (the required capability is
2251 .BR CAP_SYS_PTRACE );
2252 unprivileged processes cannot trace processes that they
2253 cannot send signals to or those running
2254 set-user-ID/set-group-ID programs, for obvious reasons.
2255 Alternatively, the process may already be being traced,
2256 or (on kernels before 2.6.26) be
2257 .BR init (1)
2258 (PID 1).
2260 .B ESRCH
2261 The specified process does not exist, or is not currently being traced
2262 by the caller, or is not stopped
2263 (for requests that require a stopped tracee).
2264 .SH CONFORMING TO
2265 SVr4, 4.3BSD.
2266 .SH NOTES
2267 Although arguments to
2268 .BR ptrace ()
2269 are interpreted according to the prototype given,
2270 glibc currently declares
2271 .BR ptrace ()
2272 as a variadic function with only the
2273 .I request
2274 argument fixed.
2275 It is recommended to always supply four arguments,
2276 even if the requested operation does not use them,
2277 setting unused/ignored arguments to
2278 .I 0L
2280 .IR "(void\ *)\ 0".
2282 In Linux kernels before 2.6.26,
2283 .\" See commit 00cd5c37afd5f431ac186dd131705048c0a11fdb
2284 .BR init (1),
2285 the process with PID 1, may not be traced.
2287 A tracees parent continues to be the tracer even if that tracer calls
2288 .BR execve (2).
2290 The layout of the contents of memory and the USER area are
2291 quite operating-system- and architecture-specific.
2292 The offset supplied, and the data returned,
2293 might not entirely match with the definition of
2294 .IR "struct user" .
2295 .\" See http://lkml.org/lkml/2008/5/8/375
2297 The size of a "word" is determined by the operating-system variant
2298 (e.g., for 32-bit Linux it is 32 bits).
2300 This page documents the way the
2301 .BR ptrace ()
2302 call works currently in Linux.
2303 Its behavior differs significantly on other flavors of UNIX.
2304 In any case, use of
2305 .BR ptrace ()
2306 is highly specific to the operating system and architecture.
2308 .\"""""""""""""""""""""""""""""""""""""""""""""""""""""""""""""""""""""""
2310 .SS Ptrace access mode checking
2311 Various parts of the kernel-user-space API (not just
2312 .BR ptrace ()
2313 operations), require so-called "ptrace access mode" checks,
2314 whose outcome determines whether an operation is permitted
2315 (or, in a few cases, causes a "read" operation to return sanitized data).
2316 These checks are performed in cases where one process can
2317 inspect sensitive information about,
2318 or in some cases modify the state of, another process.
2319 The checks are based on factors such as the credentials and capabilities
2320 of the two processes,
2321 whether or not the "target" process is dumpable,
2322 and the results of checks performed by any enabled Linux Security Module
2323 (LSM)\(emfor example, SELinux, Yama, or Smack\(emand by the commoncap LSM
2324 (which is always invoked).
2326 Prior to Linux 2.6.27, all access checks were of a single type.
2327 Since Linux 2.6.27,
2328 .\" commit 006ebb40d3d65338bd74abb03b945f8d60e362bd
2329 two access mode levels are distinguished:
2331 .BR PTRACE_MODE_READ
2332 For "read" operations or other operations that are less dangerous,
2333 such as:
2334 .BR get_robust_list (2);
2335 .BR kcmp (2);
2336 reading
2337 .IR /proc/[pid]/auxv ,
2338 .IR /proc/[pid]/environ ,
2340 .IR /proc/[pid]/stat ;
2342 .BR readlink (2)
2343 of a
2344 .IR /proc/[pid]/ns/*
2345 file.
2347 .BR PTRACE_MODE_ATTACH
2348 For "write" operations, or other operations that are more dangerous,
2349 such as: ptrace attaching
2350 .RB ( PTRACE_ATTACH )
2351 to another process
2352 or calling
2353 .BR process_vm_writev (2).
2354 .RB ( PTRACE_MODE_ATTACH
2355 was effectively the default before Linux 2.6.27.)
2357 .\" Regarding the above description of the distinction between
2358 .\" PTRACE_MODE_READ and PTRACE_MODE_ATTACH, Stephen Smalley notes:
2360 .\"     That was the intent when the distinction was introduced, but it doesn't
2361 .\"     appear to have been properly maintained, e.g. there is now a common
2362 .\"     helper lock_trace() that is used for
2363 .\"     /proc/pid/{stack,syscall,personality} but checks PTRACE_MODE_ATTACH, and
2364 .\"     PTRACE_MODE_ATTACH is also used in timerslack_ns_write/show().  Likely
2365 .\"     should review and make them consistent.  There was also some debate
2366 .\"     about proper handling of /proc/pid/fd.  Arguably that one might belong
2367 .\"     back in the _ATTACH camp.
2370 Since Linux 4.5,
2371 .\" commit caaee6234d05a58c5b4d05e7bf766131b810a657
2372 the above access mode checks are combined (ORed) with
2373 one of the following modifiers:
2375 .B PTRACE_MODE_FSCREDS
2376 Use the caller's filesystem UID and GID (see
2377 .BR credentials (7))
2378 or effective capabilities for LSM checks.
2380 .B PTRACE_MODE_REALCREDS
2381 Use the caller's real UID and GID or permitted capabilities for LSM checks.
2382 This was effectively the default before Linux 4.5.
2384 Because combining one of the credential modifiers with one of
2385 the aforementioned access modes is typical,
2386 some macros are defined in the kernel sources for the combinations:
2388 .B PTRACE_MODE_READ_FSCREDS
2389 Defined as
2390 .BR "PTRACE_MODE_READ | PTRACE_MODE_FSCREDS" .
2392 .B PTRACE_MODE_READ_REALCREDS
2393 Defined as
2394 .BR "PTRACE_MODE_READ | PTRACE_MODE_REALCREDS" .
2396 .B PTRACE_MODE_ATTACH_FSCREDS
2397 Defined as
2398 .BR "PTRACE_MODE_ATTACH | PTRACE_MODE_FSCREDS" .
2400 .B PTRACE_MODE_ATTACH_REALCREDS
2401 Defined as
2402 .BR "PTRACE_MODE_ATTACH | PTRACE_MODE_REALCREDS" .
2404 One further modifier can be ORed with the access mode:
2406 .BR PTRACE_MODE_NOAUDIT " (since Linux 3.3)"
2407 .\" commit 69f594a38967f4540ce7a29b3fd214e68a8330bd
2408 .\" Just for /proc/pid/stat
2409 Don't audit this access mode check.
2410 This modifier is employed for ptrace access mode checks
2411 (such as checks when reading
2412 .IR /proc/[pid]/stat )
2413 that merely cause the output to be filtered or sanitized,
2414 rather than causing an error to be returned to the caller.
2415 In these cases, accessing the file is not a security violation and
2416 there is no reason to generate a security audit record.
2417 This modifier suppresses the generation of
2418 such an audit record for the particular access check.
2420 Note that all of the
2421 .BR PTRACE_MODE_*
2422 constants described in this subsection are kernel-internal,
2423 and not visible to user space.
2424 The constant names are mentioned here in order to label the various kinds of
2425 ptrace access mode checks that are performed for various system calls
2426 and accesses to various pseudofiles (e.g., under
2427 .IR /proc ).
2428 These names are used in other manual pages to provide a simple
2429 shorthand for labeling the different kernel checks.
2431 The algorithm employed for ptrace access mode checking determines whether
2432 the calling process is allowed to perform the corresponding action
2433 on the target process.
2434 (In the case of opening
2435 .IR /proc/[pid]
2436 files, the "calling process" is the one opening the file,
2437 and the process with the corresponding PID is the "target process".)
2438 The algorithm is as follows:
2439 .IP 1. 3
2440 If the calling thread and the target thread are in the same
2441 thread group, access is always allowed.
2442 .IP 2.
2443 If the access mode specifies
2444 .BR PTRACE_MODE_FSCREDS ,
2445 then, for the check in the next step,
2446 employ the caller's filesystem UID and GID.
2447 (As noted in
2448 .BR credentials (7),
2449 the filesystem UID and GID almost always have the same values
2450 as the corresponding effective IDs.)
2452 Otherwise, the access mode specifies
2453 .BR PTRACE_MODE_REALCREDS ,
2454 so use the caller's real UID and GID for the checks in the next step.
2455 (Most APIs that check the caller's UID and GID use the effective IDs.
2456 For historical reasons, the
2457 .BR PTRACE_MODE_REALCREDS
2458 check uses the real IDs instead.)
2459 .IP 3.
2460 Deny access if
2461 .I neither
2462 of the following is true:
2464 .IP \(bu 2
2465 The real, effective, and saved-set user IDs of the target
2466 match the caller's user ID,
2467 .IR and
2468 the real, effective, and saved-set group IDs of the target
2469 match the caller's group ID.
2470 .IP \(bu
2471 The caller has the
2472 .B CAP_SYS_PTRACE
2473 capability in the user namespace of the target.
2475 .IP 4.
2476 Deny access if the target process "dumpable" attribute has a value other than 1
2477 .RB ( SUID_DUMP_USER ;
2478 see the discussion of
2479 .BR PR_SET_DUMPABLE
2481 .BR prctl (2)),
2482 and the caller does not have the
2483 .BR CAP_SYS_PTRACE
2484 capability in the user namespace of the target process.
2485 .IP 5.
2486 The kernel LSM
2487 .IR security_ptrace_access_check ()
2488 interface is invoked to see if ptrace access is permitted.
2489 The results depend on the LSM(s).
2490 The implementation of this interface in the commoncap LSM performs
2491 the following steps:
2492 .\" (in cap_ptrace_access_check()):
2494 .IP a) 3
2495 If the access mode includes
2496 .BR PTRACE_MODE_FSCREDS ,
2497 then use the caller's
2498 .I effective
2499 capability set
2500 in the following check;
2501 otherwise (the access mode specifies
2502 .BR PTRACE_MODE_REALCREDS ,
2503 so) use the caller's
2504 .I permitted
2505 capability set.
2506 .IP b)
2507 Deny access if
2508 .I neither
2509 of the following is true:
2511 .IP \(bu 2
2512 The caller and the target process are in the same user namespace,
2513 and the caller's capabilities are a proper superset of the target process's
2514 .I permitted
2515 capabilities.
2516 .IP \(bu
2517 The caller has the
2518 .B CAP_SYS_PTRACE
2519 capability in the target process's user namespace.
2522 Note that the commoncap LSM does not distinguish between
2523 .B PTRACE_MODE_READ
2525 .BR PTRACE_MODE_ATTACH .
2527 .IP 6.
2528 If access has not been denied by any of the preceding steps,
2529 then access is allowed.
2531 .\"""""""""""""""""""""""""""""""""""""""""""""""""""""""""""""""""""""""
2533 .SS /proc/sys/kernel/yama/ptrace_scope
2534 On systems with the Yama Linux Security Module (LSM) installed
2535 (i.e., the kernel was configured with
2536 .BR CONFIG_SECURITY_YAMA ),
2538 .I /proc/sys/kernel/yama/ptrace_scope
2539 file (available since Linux 3.4)
2540 .\" commit 2d514487faf188938a4ee4fb3464eeecfbdcf8eb
2541 can be used to restrict the ability to trace a process with
2542 .BR ptrace ()
2543 (and thus also the ability to use tools such as
2544 .BR strace (1)
2546 .BR gdb (1)).
2547 The goal of such restrictions is to prevent attack escalation whereby
2548 a compromised process can ptrace-attach to other sensitive processes
2549 (e.g., a GPG agent or an SSH session) owned by the user in order
2550 to gain additional credentials that may exist in memory
2551 and thus expand the scope of the attack.
2553 More precisely, the Yama LSM limits two types of operations:
2554 .IP * 3
2555 Any operation that performs a ptrace access mode
2556 .BR PTRACE_MODE_ATTACH
2557 check\(emfor example,
2558 .BR ptrace ()
2559 .BR PTRACE_ATTACH .
2560 (See the "Ptrace access mode checking" discussion above.)
2562 .IP *
2563 .BR ptrace ()
2564 .BR PTRACE_TRACEME .
2566 A process that has the
2567 .B CAP_SYS_PTRACE
2568 capability can update the
2569 .IR /proc/sys/kernel/yama/ptrace_scope
2570 file with one of the following values:
2572 0 ("classic ptrace permissions")
2573 No additional restrictions on operations that perform
2574 .BR PTRACE_MODE_ATTACH
2575 checks (beyond those imposed by the commoncap and other LSMs).
2577 The use of
2578 .BR PTRACE_TRACEME
2579 is unchanged.
2581 1 ("restricted ptrace") [default value]
2582 When performing an operation that requires a
2583 .BR PTRACE_MODE_ATTACH
2584 check, the calling process must either have the
2585 .B CAP_SYS_PTRACE
2586 capability in the user namespace of the target process or
2587 it must have a predefined relationship with the target process.
2588 By default,
2589 the predefined relationship is that the target process
2590 must be a descendant of the caller.
2592 A target process can employ the
2593 .BR prctl (2)
2594 .B PR_SET_PTRACER
2595 operation to declare an additional PID that is allowed to perform
2596 .BR PTRACE_MODE_ATTACH
2597 operations on the target.
2598 See the kernel source file
2599 .IR Documentation/admin\-guide/LSM/Yama.rst
2600 .\" commit 90bb766440f2147486a2acc3e793d7b8348b0c22
2602 .IR Documentation/security/Yama.txt
2603 before Linux 4.13)
2604 for further details.
2606 The use of
2607 .BR PTRACE_TRACEME
2608 is unchanged.
2610 2 ("admin-only attach")
2611 Only processes with the
2612 .B CAP_SYS_PTRACE
2613 capability in the user namespace of the target process may perform
2614 .BR PTRACE_MODE_ATTACH
2615 operations or trace children that employ
2616 .BR PTRACE_TRACEME .
2618 3 ("no attach")
2619 No process may perform
2620 .BR PTRACE_MODE_ATTACH
2621 operations or trace children that employ
2622 .BR PTRACE_TRACEME .
2624 Once this value has been written to the file, it cannot be changed.
2626 With respect to values 1 and 2,
2627 note that creating a new user namespace effectively removes the
2628 protection offered by Yama.
2629 This is because a process in the parent user namespace whose effective
2630 UID matches the UID of the creator of a child namespace
2631 has all capabilities (including
2632 .BR CAP_SYS_PTRACE )
2633 when performing operations within the child user namespace
2634 (and further-removed descendants of that namespace).
2635 Consequently, when a process tries to use user namespaces to sandbox itself,
2636 it inadvertently weakens the protections offered by the Yama LSM.
2638 .\"""""""""""""""""""""""""""""""""""""""""""""""""""""""""""""""""""""""
2640 .SS C library/kernel differences
2641 At the system call level, the
2642 .BR PTRACE_PEEKTEXT ,
2643 .BR PTRACE_PEEKDATA ,
2645 .BR PTRACE_PEEKUSER
2646 requests have a different API: they store the result
2647 at the address specified by the
2648 .I data
2649 parameter, and the return value is the error flag.
2650 The glibc wrapper function provides the API given in DESCRIPTION above,
2651 with the result being returned via the function return value.
2652 .SH BUGS
2653 On hosts with 2.6 kernel headers,
2654 .B PTRACE_SETOPTIONS
2655 is declared with a different value than the one for 2.4.
2656 This leads to applications compiled with 2.6 kernel
2657 headers failing when run on 2.4 kernels.
2658 This can be worked around by redefining
2659 .B PTRACE_SETOPTIONS
2661 .BR PTRACE_OLDSETOPTIONS ,
2662 if that is defined.
2664 Group-stop notifications are sent to the tracer, but not to real parent.
2665 Last confirmed on 2.6.38.6.
2667 If a thread group leader is traced and exits by calling
2668 .BR _exit (2),
2669 .\" Note from Denys Vlasenko:
2670 .\"     Here "exits" means any kind of death - _exit, exit_group,
2671 .\"     signal death. Signal death and exit_group cases are trivial,
2672 .\"     though: since signal death and exit_group kill all other threads
2673 .\"     too, "until all other threads exit" thing happens rather soon
2674 .\"     in these cases. Therefore, only _exit presents observably
2675 .\"     puzzling behavior to ptrace users: thread leader _exit's,
2676 .\"     but WIFEXITED isn't reported! We are trying to explain here
2677 .\"     why it is so.
2679 .B PTRACE_EVENT_EXIT
2680 stop will happen for it (if requested), but the subsequent
2681 .B WIFEXITED
2682 notification will not be delivered until all other threads exit.
2683 As explained above, if one of other threads calls
2684 .BR execve (2),
2685 the death of the thread group leader will
2686 .I never
2687 be reported.
2688 If the execed thread is not traced by this tracer,
2689 the tracer will never know that
2690 .BR execve (2)
2691 happened.
2692 One possible workaround is to
2693 .B PTRACE_DETACH
2694 the thread group leader instead of restarting it in this case.
2695 Last confirmed on 2.6.38.6.
2696 .\"  FIXME . need to test/verify this scenario
2699 .B SIGKILL
2700 signal may still cause a
2701 .B PTRACE_EVENT_EXIT
2702 stop before actual signal death.
2703 This may be changed in the future;
2704 .B SIGKILL
2705 is meant to always immediately kill tasks even under ptrace.
2706 Last confirmed on Linux 3.13.
2708 Some system calls return with
2709 .B EINTR
2710 if a signal was sent to a tracee, but delivery was suppressed by the tracer.
2711 (This is very typical operation: it is usually
2712 done by debuggers on every attach, in order to not introduce
2713 a bogus
2714 .BR SIGSTOP ).
2715 As of Linux 3.2.9, the following system calls are affected
2716 (this list is likely incomplete):
2717 .BR epoll_wait (2),
2719 .BR read (2)
2720 from an
2721 .BR inotify (7)
2722 file descriptor.
2723 The usual symptom of this bug is that when you attach to
2724 a quiescent process with the command
2726 .in +4n
2728 strace \-p <process-ID>
2732 then, instead of the usual
2733 and expected one-line output such as
2735 .in +4n
2737 restart_syscall(<... resuming interrupted call ...>_
2743 .in +4n
2745 select(6, [5], NULL, [5], NULL_
2749 ('_' denotes the cursor position), you observe more than one line.
2750 For example:
2752 .in +4n
2754     clock_gettime(CLOCK_MONOTONIC, {15370, 690928118}) = 0
2755     epoll_wait(4,_
2759 What is not visible here is that the process was blocked in
2760 .BR epoll_wait (2)
2761 before
2762 .BR strace (1)
2763 has attached to it.
2764 Attaching caused
2765 .BR epoll_wait (2)
2766 to return to user space with the error
2767 .BR EINTR .
2768 In this particular case, the program reacted to
2769 .B EINTR
2770 by checking the current time, and then executing
2771 .BR epoll_wait (2)
2772 again.
2773 (Programs which do not expect such "stray"
2774 .BR EINTR
2775 errors may behave in an unintended way upon an
2776 .BR strace (1)
2777 attach.)
2779 Contrary to the normal rules, the glibc wrapper for
2780 .BR ptrace ()
2781 can set
2782 .I errno
2783 to zero.
2784 .SH SEE ALSO
2785 .BR gdb (1),
2786 .BR ltrace (1),
2787 .BR strace (1),
2788 .BR clone (2),
2789 .BR execve (2),
2790 .BR fork (2),
2791 .BR gettid (2),
2792 .BR prctl (2),
2793 .BR seccomp (2),
2794 .BR sigaction (2),
2795 .BR tgkill (2),
2796 .BR vfork (2),
2797 .BR waitpid (2),
2798 .BR exec (3),
2799 .BR capabilities (7),
2800 .BR signal (7)