1.0.12.35: more safety -- less weakening of type checks
[sbcl/simd.git] / doc / manual / compiler.texinfo
blobd2d9746082bf1fdf53cc7318b93a5845683d4ed6
1 @node Compiler
2 @comment  node-name,  next,  previous,  up
3 @chapter Compiler
5 This chapter will discuss most compiler issues other than efficiency,
6 including compiler error messages, the SBCL compiler's unusual
7 approach to type safety in the presence of type declarations, the
8 effects of various compiler optimization policies, and the way that
9 inlining and open coding may cause optimized code to differ from a
10 naive translation. Efficiency issues are sufficiently varied and
11 separate that they have their own chapter, @ref{Efficiency}.
13 @menu
14 * Diagnostic Messages::
15 * Handling of Types::           
16 * Compiler Policy::             
17 * Compiler Errors::             
18 * Open Coding and Inline Expansion::  
19 * Interpreter::
20 @end menu
22 @node  Diagnostic Messages
23 @comment  node-name,  next,  previous,  up
24 @section Diagnostic Messages
25 @cindex Messages, Compiler
26 @cindex Compiler messages
28 @menu
29 * Controlling Verbosity::       
30 * Diagnostic Severity::         
31 * Understanding Compiler Diagnostics::  
32 @end menu
34 @node Controlling Verbosity
35 @comment  node-name,  next,  previous,  up
36 @subsection Controlling Verbosity
38 The compiler can be quite verbose in its diagnostic reporting, rather
39 more then some users would prefer -- the amount of noise emitted can
40 be controlled, however.
42 To control emission of compiler diagnostics (of any severity other
43 than @code{error}: @pxref{Diagnostic Severity}) use the
44 @code{sb-ext:muffle-conditions} and @code{sb-ext:unmuffle-conditions}
45 declarations, specifying the type of condition that is to be muffled
46 (the muffling is done using an associated @code{muffle-warning} restart).
48 Global control:
49 @lisp
50 ;;; Muffle compiler-notes globally
51 (declaim (sb-ext:muffle-conditions sb-ext:compiler-note))
52 @end lisp
54 Local control:
55 @lisp
56 ;;; Muffle compiler-notes based on lexical scope
57 (defun foo (x)
58   (declare (optimize speed) (fixnum x)
59            (sb-ext:muffle-conditions sb-ext:compiler-note))
60   (values (* x 5) ; no compiler note from this
61     (locally
62       (declare (sb-ext:unmuffle-conditions sb-ext:compiler-note))
63       ;; this one gives a compiler note
64       (* x -5))))
65 @end lisp
67 @deffn {Declaration} sb-ext:muffle-conditions
68 Syntax: type*
70 Muffles the diagnostic messages that would be caused by compile-time
71 signals of given types.
72 @end deffn
74 @deffn {Declaration} sb-ext:unmuffle-conditions
75 Syntax: type*
77 Cancels the effect of a previous @code{sb-ext:muffle-condition}
78 declaration.
79 @end deffn
81 Various details of @emph{how} the compiler messages are printed can be
82 controlled via the alist
83 @code{sb-ext:*compiler-print-variable-alist*}.
85 @include var-sb-ext-star-compiler-print-variable-alist-star.texinfo
87 @c <!-- FIXME: How much control over error messages is in SBCL?
88 @c      _     How much should be? How much of this documentation should
89 @c      _     we save or adapt? 
90 @c      _ 
91 @c      _ %%\node Error Message Parameterization,  , Read Errors, Interpreting Error Messages
92 @c      _ \subsection{Error Message Parameterization}
93 @c      _ \cpsubindex{error messages}{verbosity}
94 @c      _ \cpsubindex{verbosity}{of error messages}
95 @c      _ 
96 @c      _ There is some control over the verbosity of error messages.  See also
97 @c      _ \varref{undefined-warning-limit}, \code{*efficiency-note-limit*} and
98 @c      _ \varref{efficiency-note-cost-threshold}.
99 @c      _ 
100 @c      _ \begin{defvar}{}{enclosing-source-cutoff}
101 @c      _ 
102 @c      _   This variable specifies the number of enclosing actual source forms
103 @c      _   that are printed in full, rather than in the abbreviated processing
104 @c      _   path format.  Increasing the value from its default of \code{1}
105 @c      _   allows you to see more of the guts of the macroexpanded source,
106 @c      _   which is useful when debugging macros.
107 @c      _ \end{defvar}
108 @c      _ 
109 @c      _ \begin{defmac}{extensions:}{define-source-context}{%
110 @c      _     \args{\var{name} \var{lambda-list} \mstar{form}}}
111 @c      _ 
112 @c      _   This macro defines how to extract an abbreviated source context from
113 @c      _   the \var{name}d form when it appears in the compiler input.
114 @c      _   \var{lambda-list} is a \code{defmacro} style lambda-list used to
115 @c      _   parse the arguments.  The \var{body} should return a list of
116 @c      _   subforms that can be printed on about one line.  There are
117 @c      _   predefined methods for \code{defstruct}, \code{defmethod}, etc.  If
118 @c      _   no method is defined, then the first two subforms are returned.
119 @c      _   Note that this facility implicitly determines the string name
120 @c      _   associated with anonymous functions.
121 @c      _ \end{defmac}
122 @c      _ 
123 @c      _ -->
125 @node  Diagnostic Severity
126 @comment  node-name,  next,  previous,  up
127 @subsection Diagnostic Severity
128 @cindex Severity of compiler messages
129 @cindex Compiler Diagnostic Severity
130 @tindex error
131 @tindex warning
132 @tindex style-warning
133 @tindex compiler-note
134 @tindex code-deletion-note
136 There are four levels of compiler diagnostic severity: 
138 @enumerate 1
139 @item error
140 @item warning
141 @item style warning
142 @item note
143 @end enumerate
145 The first three levels correspond to condition classes which are
146 defined in the ANSI standard for Common Lisp and which have special
147 significance to the @code{compile} and @code{compile-file} functions.
148 These levels of compiler error severity occur when the compiler
149 handles conditions of these classes. 
151 The fourth level of compiler error severity, @emph{note}, corresponds
152 to the @code{sb-ext:compiler-note}, and is used for problems which are
153 too mild for the standard condition classes, typically hints about how
154 efficiency might be improved. The @code{sb-ext:code-deletion-note}, a
155 subtype of @code{compiler-note}, is signalled when the compiler
156 deletes user-supplied code, usually after proving that the code in
157 question is unreachable.
159 Future work for SBCL includes expanding this hierarchy of types to
160 allow more fine-grained control over emission of diagnostic messages.
162 @include condition-sb-ext-compiler-note.texinfo
163 @include condition-sb-ext-code-deletion-note.texinfo
166 @node Understanding Compiler Diagnostics
167 @comment  node-name,  next,  previous,  up
168 @subsection Understanding Compile Diagnostics
170 The messages emitted by the compiler contain a lot of detail in a
171 terse format, so they may be confusing at first. The messages will be
172 illustrated using this example program:
174 @lisp
175 (defmacro zoq (x)
176   `(roq (ploq (+ ,x 3))))
178 (defun foo (y)
179   (declare (symbol y))
180   (zoq y))
181 @end lisp
183 The main problem with this program is that it is trying to add
184 @code{3} to a symbol. Note also that the functions @code{roq} and
185 @code{ploq} aren't defined anywhere.
187 @menu
188 * The Parts of a Compiler Diagnostic::  
189 * The Original and Actual Source::  
190 * The Processing Path::         
191 @end menu
193 @node  The Parts of a Compiler Diagnostic
194 @comment  node-name,  next,  previous,  up
195 @subsubsection The Parts of a Compiler Diagnostic
197 When processing this program, the compiler will produce this warning:
199 @example
200 ; file: /tmp/foo.lisp
201 ; in: DEFUN FOO
202 ;     (ZOQ Y)
203 ; --> ROQ PLOQ
204 ; ==>
205 ;   (+ Y 3)
207 ; caught WARNING:
208 ;   Asserted type NUMBER conflicts with derived type (VALUES SYMBOL &OPTIONAL).
209 @end example
211 In this example we see each of the six possible parts of a compiler
212 diagnostic:
214 @enumerate
216 @item
217 @findex with-compilation-unit
218 @samp{file: /tmp/foo.lisp} This is the name of the file that the
219 compiler read the relevant code from.  The file name is displayed
220 because it may not be immediately obvious when there is an error
221 during compilation of a large system, especially when
222 @code{with-compilation-unit} is used to delay undefined warnings.
224 @item
225 @samp{in: DEFUN FOO} This is the definition top level form responsible
226 for the diagnostic. It is obtained by taking the first two elements of
227 the enclosing form whose first element is a symbol beginning with
228 ``@samp{def}''. If there is no such enclosing ``@samp{def}'' form,
229 then the outermost form is used. If there are multiple @samp{def}
230 forms, then they are all printed from the outside in, separated by
231 @samp{=>}'s. In this example, the problem was in the @code{defun} for
232 @code{foo}.
234 @item
235 @cindex Original Source
236 @samp{(ZOQ Y)} This is the @dfn{original source} form responsible for
237 the diagnostic. Original source means that the form directly appeared
238 in the original input to the compiler, i.e. in the lambda passed to
239 @code{compile} or in the top level form read from the source file. In
240 this example, the expansion of the @code{zoq} macro was responsible
241 for the message.
243 @item
244 @cindex Processing Path
245 @samp{--> ROQ PLOQ} This is the @dfn{processing path} that the
246 compiler used to produce the code that caused the message to be
247 emitted. The processing path is a representation of the evaluated
248 forms enclosing the actual source that the compiler encountered when
249 processing the original source. The path is the first element of each
250 form, or the form itself if the form is not a list. These forms result
251 from the expansion of macros or source-to-source transformation done
252 by the compiler. In this example, the enclosing evaluated forms are
253 the calls to @code{roq} and @code{ploq}. These calls resulted from the
254 expansion of the @code{zoq} macro.
256 @item
257 @cindex Actual Source
258 @samp{==> (+ Y 3)} This is the @dfn{actual source} responsible for the
259 diagnostic. If the actual source appears in the explanation, then we
260 print the next enclosing evaluated form, instead of printing the
261 actual source twice. (This is the form that would otherwise have been
262 the last form of the processing path.) In this example, the problem is
263 with the evaluation of the reference to the variable @code{y}.
265 @item
266 @samp{caught WARNING: Asserted type NUMBER conflicts with derived type
267 (VALUES SYMBOL &OPTIONAL).}  This is the @dfn{explanation} of the
268 problem. In this example, the problem is that, while the call to
269 @code{+} requires that its arguments are all of type @code{number},
270 the compiler has derived that @code{y} will evaluate to a
271 @code{symbol}.  Note that @samp{(VALUES SYMBOL &OPTIONAL)} expresses
272 that @code{y} evaluates to precisely one value.
274 @end enumerate
276 Note that each part of the message is distinctively marked:
278 @itemize
280 @item
281  @samp{file:} and @samp{in:} mark the file and definition,
282 respectively.
284 @item
285 The original source is an indented form with no prefix.
287 @item
288 Each line of the processing path is prefixed with @samp{-->}
290 @item
291 The actual source form is indented like the original source, but is
292 marked by a preceding @samp{==>} line.
293 @comment no it isn't.
295 @item
296 The explanation is prefixed with the diagnostic severity, which can be
297 @samp{caught ERROR:}, @samp{caught WARNING:}, @samp{caught
298 STYLE-WARNING:}, or @samp{note:}.
300 @end itemize
302 Each part of the message is more specific than the preceding one. If
303 consecutive messages are for nearby locations, then the front part of
304 the messages would be the same. In this case, the compiler omits as
305 much of the second message as in common with the first. For example:
307 @example
308 ; file: /tmp/foo.lisp
309 ; in: DEFUN FOO
310 ;     (ZOQ Y)
311 ; --> ROQ
312 ; ==>
313 ;   (PLOQ (+ Y 3))
315 ; caught STYLE-WARNING:
316 ;   undefined function: PLOQ
318 ; ==>
319 ;   (ROQ (PLOQ (+ Y 3)))
321 ; caught STYLE-WARNING:
322 ;   undefined function: ROQ
323 @end example
324 @comment fixing that weird blank line might be good
326 In this example, the file, definition and original source are
327 identical for the two messages, so the compiler omits them in the
328 second message. If consecutive messages are entirely identical, then
329 the compiler prints only the first message, followed by: @samp{[Last
330 message occurs @var{repeats} times]} where @var{repeats} is the number
331 of times the message was given.
333 If the source was not from a file, then no file line is printed. If
334 the actual source is the same as the original source, then the
335 processing path and actual source will be omitted. If no forms
336 intervene between the original source and the actual source, then the
337 processing path will also be omitted.
340 @node  The Original and Actual Source
341 @comment  node-name,  next,  previous,  up
342 @subsubsection The Original and Actual Source
343 @cindex Original Source
344 @cindex Actual Source
346 The @emph{original source} displayed will almost always be a list. If
347 the actual source for an message is a symbol, the original source will
348 be the immediately enclosing evaluated list form. So even if the
349 offending symbol does appear in the original source, the compiler will
350 print the enclosing list and then print the symbol as the actual
351 source (as though the symbol were introduced by a macro.)
353 When the @emph{actual source} is displayed (and is not a symbol), it
354 will always be code that resulted from the expansion of a macro or a
355 source-to-source compiler optimization. This is code that did not
356 appear in the original source program; it was introduced by the
357 compiler.
359 Keep in mind that when the compiler displays a source form in an
360 diagnostic message, it always displays the most specific (innermost)
361 responsible form. For example, compiling this function
363 @lisp
364 (defun bar (x)
365   (let (a)
366     (declare (fixnum a))
367     (setq a (foo x))
368     a))
369 @end lisp
371 gives this error message
373 @example
374 ; file: /tmp/foo.lisp
375 ; in: DEFUN BAR
376 ;     (LET (A)
377 ;     (DECLARE (FIXNUM A))
378 ;     (SETQ A (FOO X))
379 ;     A)
381 ; caught WARNING:
382 ;   Asserted type FIXNUM conflicts with derived type (VALUES NULL &OPTIONAL).
383 @end example
385 This message is not saying ``there is a problem somewhere in this
386 @code{let}'' -- it is saying that there is a problem with the
387 @code{let} itself. In this example, the problem is that @code{a}'s
388 @code{nil} initial value is not a @code{fixnum}.
390 @node The Processing Path
391 @comment  node-name,  next,  previous,  up
392 @subsubsection The Processing Path
393 @cindex Processing Path
394 @cindex Macroexpansion
395 @cindex Source-to-source transformation
397 The processing path is mainly useful for debugging macros, so if you
398 don't write macros, you can probably ignore it. Consider this example:
400 @lisp
401 (defun foo (n)
402   (dotimes (i n *undefined*)))
403 @end lisp
405 Compiling results in this error message:
407 @example
408 ; in: DEFUN FOO
409 ;     (DOTIMES (I N *UNDEFINED*))
410 ; --> DO BLOCK LET TAGBODY RETURN-FROM
411 ; ==>
412 ;   (PROGN *UNDEFINED*)
414 ; caught WARNING:
415 ;   undefined variable: *UNDEFINED*
416 @end example
418 Note that @code{do} appears in the processing path. This is because
419 @code{dotimes} expands into:
421 @lisp
422 (do ((i 0 (1+ i)) (#:g1 n))
423     ((>= i #:g1) *undefined*)
424   (declare (type unsigned-byte i)))
425 @end lisp
427 The rest of the processing path results from the expansion of
428 @code{do}:
430 @lisp
431 (block nil
432   (let ((i 0) (#:g1 n))
433     (declare (type unsigned-byte i))
434     (tagbody (go #:g3)
435       #:g2    (psetq i (1+ i))
436       #:g3    (unless (>= i #:g1) (go #:g2))
437       (return-from nil (progn *undefined*)))))
438 @end lisp
440 In this example, the compiler descended into the @code{block},
441 @code{let}, @code{tagbody} and @code{return-from} to reach the
442 @code{progn} printed as the actual source. This is a place where the
443 ``actual source appears in explanation'' rule was applied. The
444 innermost actual source form was the symbol @code{*undefined*} itself,
445 but that also appeared in the explanation, so the compiler backed out
446 one level.
452 @node  Handling of Types
453 @comment  node-name,  next,  previous,  up
454 @section Handling of Types
456 The most unusual features of the SBCL compiler (which is very
457 similar to the original CMUCL compiler, also known as @dfn{Python})
458 is its unusually sophisticated understanding of the Common Lisp type
459 system and its unusually conservative approach to the implementation
460 of type declarations.
462 These two features reward the use of type declarations throughout
463 development, even when high performance is not a concern. Also, as
464 discussed in the chapter on performance (@pxref{Efficiency}), the use
465 of appropriate type declarations can be very important for performance
466 as well.
468 @findex satisfies
469 The SBCL compiler also has a greater knowledge of the Common Lisp
470 type system than other compilers. Support is incomplete only for types
471 involving the @code{satisfies} type specifier.
473 @c <!-- FIXME: See also sections \ref{advanced-type-stuff}
474 @c      and \ref{type-inference}, once we snarf them from the
475 @c      CMU CL manual. -->
477 @c Also see my paper on improving Baker, when I get round to it.
479 @c Whose paper?
481 @menu
482 * Declarations as Assertions::  
483 * Precise Type Checking::       
484 * Getting Existing Programs to Run::  
485 * Implementation Limitations::  
486 @end menu
488 @node Declarations as Assertions
489 @comment  node-name,  next,  previous,  up
490 @subsection Declarations as Assertions
491 @findex safety
493 The SBCL compiler treats type declarations differently from most
494 other Lisp compilers. Under default compilation policy the compiler
495 doesn't blindly believe type declarations, but considers them
496 assertions about the program that should be checked: all type
497 declarations that have not been proven to always hold are asserted at
498 runtime.
500 @quotation
501 @emph{Remaining bugs in the compiler's handling of types unfortunately
502 provide some exceptions to this rule, see @ref{Implementation
503 Limitations}).}
504 @end quotation
506 There are three type checking policies available in SBCL,
507 selectable via @code{optimize} declarations.
509 @table @strong
511 @c FIXME: This should be properly integrated with general policy
512 @c stuff, once that gets cleaned up.
514 @item Full Type Checks
515 All declarations are considered assertions to be checked at runtime,
516 and all type checks are precise.
518 Used when @code{(and (< 0 safety) (or (>= safety 2) (>= safety speed)))}. The
519 default compilation policy provides full type checks.
521 @item Weak Type Checks
522 Any or all type declarations may be believed without runtime
523 assertions, and assertions that are done may be imprecise. It should
524 be noted that it is relatively easy to corrupt the heap when weak type
525 checks are used, and type-errors are introduced into the program.
527 Used when @code{(and (< safety 2) (< safety speed))}
529 @item No Type Checks
530 All declarations are believed without assertions. Also disables
531 argument count and array bounds checking.
533 Used when @code{(= safety 0)}.
535 @end table
537 @node  Precise Type Checking
538 @comment  node-name,  next,  previous,  up
539 @subsection Precise Type Checking
540 @cindex Precise type checking
541 @cindex Type checking, precise
543 Precise checking means that the check is done as though @code{typep}
544 had been called with the exact type specifier that appeared in the
545 declaration.
547 If a variable is declared to be @code{(integer 3 17)} then its value
548 must always be an integer between @code{3} and @code{17}. If multiple
549 type declarations apply to a single variable, then all the
550 declarations must be correct; it is as though all the types were
551 intersected producing a single @code{and} type specifier.
553 To gain maximum benefit from the compiler's type checking, you should
554 always declare the types of function arguments and structure slots as
555 precisely as possible. This often involves the use of @code{or},
556 @code{member}, and other list-style type specifiers. 
559 @node  Getting Existing Programs to Run
560 @comment  node-name,  next,  previous,  up
561 @subsection Getting Existing Programs to Run
562 @cindex Existing programs, to run
563 @cindex Types, portability
564 @cindex Compatibility with other Lisps
565 @c     (should also have an entry in the non-ANSI-isms section)-->
567 Since SBCL's compiler does much more comprehensive type checking than
568 most Lisp compilers, SBCL may detect type errors in programs that have
569 been debugged using other compilers. These errors are mostly incorrect
570 declarations, although compile-time type errors can find actual bugs
571 if parts of the program have never been tested.
573 Some incorrect declarations can only be detected by run-time type
574 checking. It is very important to initially compile a program with
575 full type checks (high @code{safety} optimization) and then test this
576 safe version. After the checking version has been tested, then you can
577 consider weakening or eliminating type checks.  @emph{This applies
578 even to previously debugged programs,} because the SBCL compiler does
579 much more type inference than other Common Lisp compilers, so an
580 incorrect declaration can do more damage.
582 The most common problem is with variables whose constant initial value
583 doesn't match the type declaration. Incorrect constant initial values
584 will always be flagged by a compile-time type error, and they are
585 simple to fix once located. Consider this code fragment:
587 @lisp
588 (prog (foo)
589   (declare (fixnum foo))
590   (setq foo ...)
591   ...)
592 @end lisp
594 Here @code{foo} is given an initial value of @code{nil}, but is
595 declared to be a @code{fixnum}.  Even if it is never read, the initial
596 value of a variable must match the declared type.  There are two ways
597 to fix this problem. Change the declaration
599 @lisp
600 (prog (foo)
601   (declare (type (or fixnum null) foo))
602   (setq foo ...)
603   ...)
604 @end lisp
606 or change the initial value
608 @lisp
609 (prog ((foo 0))
610   (declare (fixnum foo))
611   (setq foo ...)
612   ...)
613 @end lisp
615 It is generally preferable to change to a legal initial value rather
616 than to weaken the declaration, but sometimes it is simpler to weaken
617 the declaration than to try to make an initial value of the
618 appropriate type.
620 Another declaration problem occasionally encountered is incorrect
621 declarations on @code{defmacro} arguments. This can happen when a
622 function is converted into a macro. Consider this macro:
624 @lisp
625 (defmacro my-1+ (x)
626   (declare (fixnum x))
627   `(the fixnum (1+ ,x)))
628 @end lisp
630 Although legal and well-defined Common Lisp code, this meaning of this
631 definition is almost certainly not what the writer intended. For
632 example, this call is illegal:
634 @lisp
635 (my-1+ (+ 4 5))
636 @end lisp
638 This call is illegal because the argument to the macro is @code{(+ 4
639 5)}, which is a @code{list}, not a @code{fixnum}.  Because of macro
640 semantics, it is hardly ever useful to declare the types of macro
641 arguments.  If you really want to assert something about the type of
642 the result of evaluating a macro argument, then put a @code{the} in
643 the expansion:
645 @lisp
646 (defmacro my-1+ (x)
647   `(the fixnum (1+ (the fixnum ,x))))
648 @end lisp
650 In this case, it would be stylistically preferable to change this
651 macro back to a function and declare it inline. 
652 @c <!--FIXME: <xref>inline-expansion, once we crib the 
653 @c      relevant text from the CMU CL manual.-->
655 Some more subtle problems are caused by incorrect declarations that
656 can't be detected at compile time.  Consider this code:
657   
658 @lisp
659 (do ((pos 0 (position #\a string :start (1+ pos))))
660   ((null pos))
661   (declare (fixnum pos))
662   ...)
663 @end lisp
665 Although @code{pos} is almost always a @code{fixnum}, it is @code{nil}
666 at the end of the loop. If this example is compiled with full type
667 checks (the default), then running it will signal a type error at the
668 end of the loop. If compiled without type checks, the program will go
669 into an infinite loop (or perhaps @code{position} will complain
670 because @code{(1+ nil)} isn't a sensible start.) Why? Because if you
671 compile without type checks, the compiler just quietly believes the
672 type declaration. Since the compiler believes that @code{pos} is
673 always a @code{fixnum}, it believes that @code{pos} is never
674 @code{nil}, so @code{(null pos)} is never true, and the loop exit test
675 is optimized away. Such errors are sometimes flagged by unreachable
676 code notes, but it is still important to initially compile and test
677 any system with full type checks, even if the system works fine when
678 compiled using other compilers.
680 In this case, the fix is to weaken the type declaration to @code{(or
681 fixnum null)} @footnote{Actually, this declaration is unnecessary in
682 SBCL, since it already knows that @code{position} returns a
683 non-negative @code{fixnum} or @code{nil}.}.
685 Note that there is usually little performance penalty for weakening a
686 declaration in this way. Any numeric operations in the body can still
687 assume that the variable is a @code{fixnum}, since @code{nil} is not a
688 legal numeric argument. Another possible fix would be to say:
690 @lisp
691 (do ((pos 0 (position #\a string :start (1+ pos))))
692     ((null pos))
693   (let ((pos pos))
694     (declare (fixnum pos))
695     ...))
696 @end lisp
698 This would be preferable in some circumstances, since it would allow a
699 non-standard representation to be used for the local @code{pos}
700 variable in the loop body.
701 @c <!-- FIXME: <xref>ND-variables, once we crib the text from the 
702 @c      CMU CL manual. -->
704 @node  Implementation Limitations
705 @comment  node-name,  next,  previous,  up
706 @subsection Implementation Limitations
708 Ideally, the compiler would consider @emph{all} type declarations to
709 be assertions, so that adding type declarations to a program, no
710 matter how incorrect they might be, would @emph{never} cause undefined
711 behavior. However, the compiler is known to fall short of this goal in
712 two areas:
714 @itemize
716 @item
717 @emph{Proclaimed} constraints on argument and result types of a
718 function are supposed to be checked by the function. If the function
719 type is proclaimed before function definition, type checks are
720 inserted by the compiler, but the standard allows the reversed order,
721 in which case the compiler will trust the declaration.
723 @item
724 The compiler cannot check types of an unknown number of values; if the
725 number of generated values is unknown, but the number of consumed is
726 known, only consumed values are checked.
728 For example,
730 @lisp
731 (defun foo (x) 
732   (the integer (bar x)))
733 @end lisp
735 causes the following compiler diagnostic to be emitted:
737 @example
738 ; note: type assertion too complex to check:
739 ;  (VALUES INTEGER &REST T).
740 @end example
742 A partial workaround is instead write:
744 @lisp
745 (defun foo (x)
746   (the (values integer &optional) (bar x)))
747 @end lisp
749 @end itemize
751 These are important issues, but are not necessarily easy to fix, so
752 they may, alas, remain in the system for a while.
754 @node Compiler Policy
755 @comment  node-name,  next,  previous,  up
756 @section Compiler Policy
758 Compiler policy is controlled by the @code{optimize} declaration,
759 supporting all ANSI optimization qualities (@code{debug},
760 @code{safety}, @code{space}, and @code{speed}).@footnote{A deprecated
761 extension @code{sb-ext:inhibit-warnings} is still supported, but
762 liable to go away at any time.}
764 For effects of various optimization qualities on type-safety and
765 debuggability see @ref{Declarations as Assertions} and @ref{Debugger
766 Policy Control}.
768 Ordinarily, when the @code{speed} quality is high, the compiler emits
769 notes to notify the programmer about its inability to apply various
770 optimizations. For selective muffling of these notes @xref{Controlling
771 Verbosity}.
773 The value of @code{space} mostly influences the compiler's decision
774 whether to inline operations, which tend to increase the size of
775 programs. Use the value @code{0} with caution, since it can cause the
776 compiler to inline operations so indiscriminately that the net effect
777 is to slow the program by causing cache misses or even swapping.
779 @c <!-- FIXME: old CMU CL compiler policy, should perhaps be adapted
780 @c      _    for SBCL. (Unfortunately, the CMU CL docs are out of sync with the
781 @c      _    CMU CL code, so adapting this requires not only reformatting
782 @c      _    the documentation, but rooting out code rot.)
783 @c      _
784 @c      _<sect2 id="compiler-policy"><title>Compiler Policy</1000
785 @c      _  INDEX {policy}{compiler}
786 @c      _  INDEX compiler policy
787 @c      _
788 @c      _<para>The policy is what tells the compiler <emphasis>how</emphasis> to
789 @c      _compile a program. This is logically (and often textually) distinct
790 @c      _from the program itself. Broad control of policy is provided by the
791 @c      _<parameter>optimize</parameter> declaration; other declarations and variables
792 @c      _control more specific aspects of compilation.
793 @c      _
794 @c      _\begin{comment}
795 @c      _* The Optimize Declaration::
796 @c      _* The Optimize-Interface Declaration::
797 @c      _\end{comment}
798 @c      _
799 @c      _%%\node The Optimize Declaration, The Optimize-Interface Declaration, Compiler Policy, Compiler Policy
800 @c      _\subsection{The Optimize Declaration}
801 @c      _\label{optimize-declaration}
802 @c      _\cindex{optimize declaration}
803 @c      _\cpsubindex{declarations}{\code{optimize}}
804 @c      _
805 @c      _The \code{optimize} declaration recognizes six different
806 @c      _\var{qualities}.  The qualities are conceptually independent aspects
807 @c      _of program performance.  In reality, increasing one quality tends to
808 @c      _have adverse effects on other qualities.  The compiler compares the
809 @c      _relative values of qualities when it needs to make a trade-off; i.e.,
810 @c      _if \code{speed} is greater than \code{safety}, then improve speed at
811 @c      _the cost of safety.
812 @c      _
813 @c      _The default for all qualities (except \code{debug}) is \code{1}.
814 @c      _Whenever qualities are equal, ties are broken according to a broad
815 @c      _idea of what a good default environment is supposed to be.  Generally
816 @c      _this downplays \code{speed}, \code{compile-speed} and \code{space} in
817 @c      _favor of \code{safety} and \code{debug}.  Novice and casual users
818 @c      _should stick to the default policy.  Advanced users often want to
819 @c      _improve speed and memory usage at the cost of safety and
820 @c      _debuggability.
821 @c      _
822 @c      _If the value for a quality is \code{0} or \code{3}, then it may have a
823 @c      _special interpretation.  A value of \code{0} means ``totally
824 @c      _unimportant'', and a \code{3} means ``ultimately important.''  These
825 @c      _extreme optimization values enable ``heroic'' compilation strategies
826 @c      _that are not always desirable and sometimes self-defeating.
827 @c      _Specifying more than one quality as \code{3} is not desirable, since
828 @c      _it doesn't tell the compiler which quality is most important.
829 @c      _
830 @c      _
831 @c      _These are the optimization qualities:
832 @c      _\begin{Lentry}
833 @c      _
834 @c      _\item[\code{speed}] \cindex{speed optimization quality}How fast the
835 @c      _  program should is run.  \code{speed 3} enables some optimizations
836 @c      _  that hurt debuggability.
837 @c      _
838 @c      _\item[\code{compilation-speed}] \cindex{compilation-speed optimization
839 @c      _    quality}How fast the compiler should run.  Note that increasing
840 @c      _  this above \code{safety} weakens type checking.
841 @c      _
842 @c      _\item[\code{space}] \cindex{space optimization quality}How much space
843 @c      _  the compiled code should take up.  Inline expansion is mostly
844 @c      _  inhibited when \code{space} is greater than \code{speed}.  A value
845 @c      _  of \code{0} enables indiscriminate inline expansion.  Wide use of a
846 @c      _  \code{0} value is not recommended, as it may waste so much space
847 @c      _  that run time is slowed.  \xlref{inline-expansion} for a discussion
848 @c      _  of inline expansion.
849 @c      _
850 @c      _\item[\code{debug}] \cindex{debug optimization quality}How debuggable
851 @c      _  the program should be.  The quality is treated differently from the
852 @c      _  other qualities: each value indicates a particular level of debugger
853 @c      _  information; it is not compared with the other qualities.
854 @c      _  \xlref{debugger-policy} for more details.
855 @c      _
856 @c      _\item[\code{safety}] \cindex{safety optimization quality}How much
857 @c      _  error checking should be done.  If \code{speed}, \code{space} or
858 @c      _  \code{compilation-speed} is more important than \code{safety}, then
859 @c      _  type checking is weakened (\pxlref{weakened-type-checks}).  If
860 @c      _  \code{safety} if \code{0}, then no run time error checking is done.
861 @c      _  In addition to suppressing type checks, \code{0} also suppresses
862 @c      _  argument count checking, unbound-symbol checking and array bounds
863 @c      _  checks.
864 @c      _  ... and checking of tag existence in RETURN-FROM and GO.
865 @c      _
866 @c      _\item[\code{extensions:inhibit-warnings}] \cindex{inhibit-warnings
867 @c      _    optimization quality}This is a CMU extension that determines how
868 @c      _  little (or how much) diagnostic output should be printed during
869 @c      _  compilation.  This quality is compared to other qualities to
870 @c      _  determine whether to print style notes and warnings concerning those
871 @c      _  qualities.  If \code{speed} is greater than \code{inhibit-warnings},
872 @c      _  then notes about how to improve speed will be printed, etc.  The
873 @c      _  default value is \code{1}, so raising the value for any standard
874 @c      _  quality above its default enables notes for that quality.  If
875 @c      _  \code{inhibit-warnings} is \code{3}, then all notes and most
876 @c      _  non-serious warnings are inhibited.  This is useful with
877 @c      _  \code{declare} to suppress warnings about unavoidable problems.
878 @c      _\end{Lentry}
879 @c      _
880 @c      _%%\node The Optimize-Interface Declaration,  , The Optimize Declaration, Compiler Policy
881 @c      _\subsection{The Optimize-Interface Declaration}
882 @c      _\label{optimize-interface-declaration}
883 @c      _\cindex{optimize-interface declaration}
884 @c      _\cpsubindex{declarations}{\code{optimize-interface}}
885 @c      _
886 @c      _The \code{extensions:optimize-interface} declaration is identical in
887 @c      _syntax to the \code{optimize} declaration, but it specifies the policy
888 @c      _used during compilation of code the compiler automatically generates
889 @c      _to check the number and type of arguments supplied to a function.  It
890 @c      _is useful to specify this policy separately, since even thoroughly
891 @c      _debugged functions are vulnerable to being passed the wrong arguments.
892 @c      _The \code{optimize-interface} declaration can specify that arguments
893 @c      _should be checked even when the general \code{optimize} policy is
894 @c      _unsafe.
895 @c      _
896 @c      _Note that this argument checking is the checking of user-supplied
897 @c      _arguments to any functions defined within the scope of the
898 @c      _declaration, \code{not} the checking of arguments to \llisp{}
899 @c      _primitives that appear in those definitions.
900 @c      _
901 @c      _The idea behind this declaration is that it allows the definition of
902 @c      _functions that appear fully safe to other callers, but that do no
903 @c      _internal error checking.  Of course, it is possible that arguments may
904 @c      _be invalid in ways other than having incorrect type.  Functions
905 @c      _compiled unsafely must still protect themselves against things like
906 @c      _user-supplied array indices that are out of bounds and improper lists.
907 @c      _See also the \kwd{context-declarations} option to
908 @c      _\macref{with-compilation-unit}.
909 @c      _
910 @c      _(end of section on compiler policy)
911 @c      _-->
913 @node Compiler Errors
914 @comment  node-name,  next,  previous,  up
915 @section Compiler Errors
917 @menu
918 * Type Errors at Compile Time::  
919 * Errors During Macroexpansion::  
920 * Read Errors::                 
921 @end menu
923 @node  Type Errors at Compile Time
924 @comment  node-name,  next,  previous,  up
925 @subsection Type Errors at Compile Time
926 @cindex Compile time type errors
927 @cindex Type checking, at compile time
929 If the compiler can prove at compile time that some portion of the
930 program cannot be executed without a type error, then it will give a
931 warning at compile time.
933 It is possible that the offending code would never actually be
934 executed at run-time due to some higher level consistency constraint
935 unknown to the compiler, so a type warning doesn't always indicate an
936 incorrect program.
938 For example, consider this code fragment:
940 @lisp
941 (defun raz (foo)
942   (let ((x (case foo
943               (:this 13)
944               (:that 9)
945               (:the-other 42))))
946     (declare (fixnum x))
947     (foo x)))
948 @end lisp
950 Compilation produces this warning:
952 @example
953 ; in: DEFUN RAZ
954 ;     (CASE FOO (:THIS 13) (:THAT 9) (:THE-OTHER 42))
955 ; --> LET COND IF COND IF COND IF
956 ; ==>
957 ;   (COND)
959 ; caught WARNING:
960 ;   This is not a FIXNUM:
961 ;   NIL
962 @end example
964 In this case, the warning means that if @code{foo} isn't any of
965 @code{:this}, @code{:that} or @code{:the-other}, then @code{x} will be
966 initialized to @code{nil}, which the @code{fixnum} declaration makes
967 illegal. The warning will go away if @code{ecase} is used instead of
968 @code{case}, or if @code{:the-other} is changed to @code{t}.
970 This sort of spurious type warning happens moderately often in the
971 expansion of complex macros and in inline functions. In such cases,
972 there may be dead code that is impossible to correctly execute. The
973 compiler can't always prove this code is dead (could never be
974 executed), so it compiles the erroneous code (which will always signal
975 an error if it is executed) and gives a warning.
977 @node  Errors During Macroexpansion
978 @comment  node-name,  next,  previous,  up
979 @subsection Errors During Macroexpansion
980 @cindex Macroexpansion, errors during
982 The compiler handles errors that happen during macroexpansion, turning
983 them into compiler errors. If you want to debug the error (to debug a
984 macro), you can set @code{*break-on-signals*} to @code{error}. For
985 example, this definition:
987 @lisp
988 (defun foo (e l)
989   (do ((current l (cdr current))
990        ((atom current) nil))
991       (when (eq (car current) e) (return current))))
992 @end lisp
994 gives this error:
996 @example
997 ; in: DEFUN FOO
998 ;     (DO ((CURRENT L (CDR CURRENT))
999 ;        ((ATOM CURRENT) NIL))
1000 ;       (WHEN (EQ (CAR CURRENT) E) (RETURN CURRENT)))
1002 ; caught ERROR:
1003 ;   (in macroexpansion of (DO # #))
1004 ;   (hint: For more precise location, try *BREAK-ON-SIGNALS*.)
1005 ;   DO step variable is not a symbol: (ATOM CURRENT)
1006 @end example
1009 @node  Read Errors
1010 @comment  node-name,  next,  previous,  up
1011 @subsection Read Errors
1012 @cindex Read errors, compiler
1014 SBCL's compiler does not attempt to recover from read errors when
1015 reading a source file, but instead just reports the offending
1016 character position and gives up on the entire source file.
1018 @node  Open Coding and Inline Expansion
1019 @comment  node-name,  next,  previous,  up
1020 @section Open Coding and Inline Expansion
1021 @cindex Open-coding
1022 @cindex Inline expansion
1023 @cindex Static functions
1025 Since Common Lisp forbids the redefinition of standard functions, the
1026 compiler can have special knowledge of these standard functions
1027 embedded in it. This special knowledge is used in various ways (open
1028 coding, inline expansion, source transformation), but the implications
1029 to the user are basically the same:
1031 @itemize
1033 @item
1034 Attempts to redefine standard functions may be frustrated, since the
1035 function may never be called. Although it is technically illegal to
1036 redefine standard functions, users sometimes want to implicitly
1037 redefine these functions when they are debugging using the
1038 @code{trace} macro.  Special-casing of standard functions can be
1039 inhibited using the @code{notinline} declaration, but even then some
1040 phases of analysis such as type inferencing are applied by the
1041 compiler.
1043 @item
1044 The compiler can have multiple alternate implementations of standard
1045 functions that implement different trade-offs of speed, space and
1046 safety.  This selection is based on the compiler policy, @ref{Compiler
1047 Policy}.
1049 @end itemize
1051 When a function call is @emph{open coded}, inline code whose effect is
1052 equivalent to the function call is substituted for that function
1053 call. When a function call is @emph{closed coded}, it is usually left
1054 as is, although it might be turned into a call to a different function
1055 with different arguments. As an example, if @code{nthcdr} were to be
1056 open coded, then
1058 @lisp
1059 (nthcdr 4 foobar)
1060 @end lisp
1062 might turn into
1064 @lisp
1065 (cdr (cdr (cdr (cdr foobar))))
1066 @end lisp
1068 or even
1070 @lisp
1071 (do ((i 0 (1+ i))
1072   (list foobar (cdr foobar)))
1073   ((= i 4) list))
1074 @end lisp
1076 If @code{nth} is closed coded, then
1078 @lisp
1079 (nth x l)
1080 @end lisp
1082 might stay the same, or turn into something like
1084 @lisp
1085 (car (nthcdr x l))
1086 @end lisp
1088 In general, open coding sacrifices space for speed, but some functions
1089 (such as @code{car}) are so simple that they are always
1090 open-coded. Even when not open-coded, a call to a standard function
1091 may be transformed into a different function call (as in the last
1092 example) or compiled as @emph{static call}. Static function call uses
1093 a more efficient calling convention that forbids redefinition.
1095 @node  Interpreter
1096 @comment  node-name,  next,  previous,  up
1097 @section Interpreter
1098 @cindex Interpreter
1099 @vindex sb-ext:*evaluator-mode*
1101 By default SBCL implements @code{eval} by calling the native code
1102 compiler. SBCL also includes an interpreter for use in special cases
1103 where using the compiler is undesirable, for example due to compilation
1104 overhead. Unlike in some other Lisp implementations, in SBCL interpreted
1105 code is not safer or more debuggable than compiled code.
1107 Switching between the compiler and the interpreter is done using the
1108 special variable @code{sb-ext:*evaluator-mode*}. As of 0.9.17, valid
1109 values for @code{sb-ext:*evaluator-mode*} are @code{:compile} and
1110 @code{:interpret}.