Stage 7: add chained token support to input parser.
[m4/ericb.git] / NEWS
blob051a16a58bbce883105b5a624a6164228b0cf09a
1 GNU M4 NEWS - User visible changes.
2 Copyright (C) 1992, 1993, 1994, 2004, 2005, 2006, 2007 Free Software
3 Foundation, Inc.
5 Version 1.4.11 - ?? ??? 2007, by ????  (git version 1.4.10a-*)
7 * Security fixes for the -F option, for bugs present since -F was
8   introduced in 1.3: Avoid core dump with 'm4 -F file -t undefined', and
9   avoid arbitrary code execution with certain file names.
10 * Fix regression introduced in 1.4.9b in the `divert' builtin when more
11   than 512 kibibytes are saved in diversions on platforms like NetBSD where
12   fopen(name,"a+") seeks to the end of the file.
13 * The output of the `maketemp' and `mkstemp' builtins is now quoted if a
14   file was created.  This is a minor security fix, because it was possible
15   (although rather unlikely) that an unquoted string could match an
16   existing macro name, such that use of the `mkstemp' output would trigger
17   inadvertent macro expansion and operate on the wrong file name.
18 * Enhance the `defn' builtin to support concatenation of multiple text
19   arguments, as required by POSIX.  However, at this time, it is not
20   possible to concatenate a builtin macro with anything else; a warning is
21   now issued if this is attempted, although a future version of M4 may lift
22   this restriction to match other implementations.
23 * Several improvements in `index', `regexp', and `patsubst' builtins to
24   speed up typical Autoconf usage.
25 * Memory usage is greatly reduced in recursive macros.
26 * A number of portability improvements inherited from gnulib.
28 Version 1.4.10 - 09 Jul 2007, by Eric Blake  (CVS version 1.4.9c)
30 * Upgrade from GPL version 2 to GPL version 3 or later.
31 * A number of portability improvements inherited from gnulib.
32 * Avoid undefined behavior introduced in 1.4.9b in the `format' builtin
33   when handling %c.  However, this area of code has never been documented,
34   and currently does not match the POSIX behavior of printf(1), so it may
35   have further changes in the next version.
37 Version 1.4.9b - 29 May 2007, by Eric Blake  (CVS version 1.4.9a)
39 * Fix regression introduced in 1.4.9 in the `eval' builtin when performing
40   division.
41 * Fix regression introduced in 1.4.8 in the `-F' option that made it
42   impossible to freeze more than 512 kibibytes of diverted text.
43 * The synclines option `-s' no longer generates sync lines in the middle of
44   multiline comments or quoted strings.
45 * Work around a number of corner-case POSIX compliance bugs in various
46   broken stdio libraries.  In particular, the `syscmd' builtin behaves
47   more predictably when stdin is seekable.
48 * The `format' builtin now understands formats such as %a, %A, and %'hhd,
49   and works around a number of platform printf bugs.  Furthermore, the
50   sequence format(%*.*d,-1,-1,1) no longer outputs random data.  However,
51   some non-compliant platforms such as mingw still have known bugs in
52   strtod that may cause testsuite failures.
53 * The testsuite is improved to also run gnulib portability tests for the
54   features that M4 imports from gnulib.
56 Version 1.4.9 - 23 Mar 2007, by Eric Blake  (CVS version 1.4.8c)
58 * Minor documentation and portability cleanups.
60 Version 1.4.8b - 24 Feb 2007, by Eric Blake  (CVS version 1.4.8a)
62 * Fix a regression introduced in 1.4.8 that made m4 unable to process
63   files larger than 2GiB on some platforms.
64 * Fix a regression introduced in 1.4.8 that made m4 dump core when
65   invoked as 'm4 -- file'.
66 * The `eval' builtin now follows C precedence rules.  Additionally, the
67   short-circuit operators correctly short-circuit division by zero.  The
68   previously undocumented alias of '=' meaning '==' in eval now triggers a
69   deprecation warning, so that a future version of M4 can implement a form
70   of variable assignment as an extension.
71 * The `include' builtin now affects exit status on failure, as required by
72   POSIX.  Use `sinclude' if you need a successful exit status.
73 * The `-E'/`--fatal-warnings' command-line option now has two levels.  When
74   specified only once, warnings affect exit status, but execution
75   continues, so that you can see all warnings instead of fixing them one
76   at a time.  To acheive 1.4.8 behavior, where the first warning
77   immediately exits, specify -E twice on the command line.
78 * A new `--warn-macro-sequence' command-line option allows detection of
79   sequences in `define' and `pushdef' definitions that match an optional
80   regular expression.  The default regular expression is
81   `\$\({[^}]*}\|[0-9][0-9]+\)', corresponding to the sequences that might
82   not behave correctly when upgrading to the eventual M4 2.0.  By default,
83   M4 2.0 will follow the POSIX requirement that a macro definition
84   containing `$11' must expand to the first argument concatenated with 1,
85   rather than the eleventh argument; and will take advantage of the POSIX
86   wording that allows implementations to treat `${11}' as the eleventh
87   argument instead of literal text.  Be aware that Autoconf 2.61 will not
88   work with this option enabled with the default regular expression; but
89   Autoconf 2.62 will be compatible with this option.
90 * Improved portability to platforms such as BSD/OS and AIX.
92 Version 1.4.8 - 20 November 2006, by Eric Blake  (CVS version 1.4.7a)
94 * The `divert' macro and `-H'/`--hashsize' command line option no longer
95   cause a core dump when handed extra large values.  Also, `divert' now
96   uses memory proportional to the number of diversions in use, rather than
97   to the maximum diversion number encountered, so that large diversion
98   numbers are less likely to exhaust system memory; and is no longer
99   limited by the maximum number of file descriptors.
100 * The `--help' and `--version' command line options now consistently
101   override all earlier options.  For example, `m4 --debugfile=trace
102   --help' now no longer accidentally creates an empty file `trace'.
103 * The `-L'/`--nesting-limit' command line option can now be set to 0
104   to remove the default limit of 1024.  However, it is still possible that
105   heavily nested input can cause abrupt program termination due to stack
106   overflow.
107 * Problems encountered when writing to standard error, such as with the
108   `errprint' macro, now always cause a non-zero exit status.
109 * Warnings and errors issued during macro expansion are now consistently
110   reported at the line where the macro name was detected, rather than
111   where the close parenthesis resides.  Text wrapped by `m4wrap' now
112   remembers the location that was in effect when m4wrap was invoked,
113   rather than changing to line 0 and the empty string for a file.  The
114   macros `__line__' and `__file__' now work correctly even as the last
115   token in an included file.
116 * The `builtin' and `indir' macros now transparently handle builtin
117   tokens generated by `defn'.
118 * When diversions created by the `divert' macro collect enough text that
119   M4 must use temporary files, the environment variable $TMPDIR is now
120   consulted, and a better effort is made to clean up those files in the
121   event of a fatal signal.
122 * The `mkstemp' builtin is added with the same GNU semantics as `maketemp',
123   based on the recommendation of POSIX to deprecate the POSIX semantics of
124   `maketemp' as inherently insecure.  In GNU mode (no -G supplied on the
125   command line), `maketemp' silently retains the secure GNU semantics, but
126   a future release of M4 will change this to emit a warning.  In
127   traditional mode (m4 -G), `maketemp' now uses the POSIX-mandated insecure
128   semantics, and issues a warning that you should convert your script to
129   use `mkstemp' instead.  Additionally, `mkstemp' and `maketemp' are now
130   well-defined even if the template argument does not end in six `X'
131   characters.
132 * The manual has been improved, including a new section on a composite
133   macro `foreach'.
134 * The `changecom' and `changequote' macros now treat an empty second
135   argument the same as if it were missing, rather than using the empty
136   string and making it impossible to end a comment or quote.
137 * The `translit' macro now operates in linear instead of quadratic time,
138   and is now eight-bit clean.
139 * The `-D', `-U', `-s', and `-t' command line options now take effect
140   after any files encountered earlier on the command line, rather than up
141   front, as is done in traditional implementations and required by POSIX.
143 Version 1.4.7 - 25 September 2006, by Eric Blake  (CVS version 1.4.6a)
145 * Fix regression from 1.4.5 in handling a file that ends in a macro
146   expansion without arguments instead of a newline.
147 * The define and pushdef macros now warn when the first argument is not
148   a string, rather than silently doing nothing.
149 * Standard input can now be read more than once, as in 'm4 - file -', and
150   is not closed until all wrapped text is handled.  This makes a
151   difference when stdin is not a regular file, and also fixes bugs when
152   using the syscmd or esyscmd macros from wrapped text.
153 * When standard input is a seekable file, the m4exit, syscmd, and esyscmd
154   macros now restore the current position to the next unread byte rather
155   than discarding an arbitrary amount of buffered data.
156 * SysV command-line compatibility is no longer a goal of GNU M4; the
157   focus will be instead on POSIX compatibility.  This release continues to
158   support previous usage, but adds warnings in areas which will allow a
159   future version of GNU M4 to use its own extensions without being tied to
160   the SysV command line interface.
161 * The no-op compatibility command line options -B, -N, -S, -T, and
162   --diversions may be withdrawn or assigned new meanings in future
163   releases, so they now issue a warning if used.
164 * A new command line option -i replaces the compatibility -e as the
165   short spelling of --interactive, for consistency with other GNU tools; a
166   warning is issued if the old spelling is used, and it may be assigned new
167   meaning in future releases.
168 * A new command line option --debugfile replaces the options -o and
169   --error-output as the preferred spelling.  The old options were
170   misleading in their names and inconsistent with other GNU tools; they are
171   still silently accepted, but no longer documented in --help, and may be
172   assigned new meanings in future releases.
174 Version 1.4.6 - 25 August 2006, by Eric Blake  (CVS version 1.4.5a)
176 * Fix buffer overruns in regexp and patsubst macros when handed a trailing
177   backslash in the replacement text, or when handling \n substitutions
178   beyond the number of \(\) groups.
179 * Fix memory leak in regexp, patsubst, and changeword macros.
180 * The format macro now understands %F, %g, and %G.
181 * When loading frozen files, m4 now exits with status 63 if version
182   mismatch is detected.
183 * Fix bugs that occurred when invoked with stdout or stderr closed,
184   and detect write failures to stdout or to the target of the
185   debugfile macro.  In particular, the syscmd and esyscmd macros can
186   no longer interfere with the debug stream or diversions.
187 * The m4exit macro now converts values outside the range 0-255 to 1.
188 * It is now an error if a command-line input file ends in the middle of a
189   comment, matching the behavior of mid-string and mid-argument
190   collection.
191 * The dnl macro now warns if end of file is encountered instead of a
192   newline.
193 * The error message when end of file is encountered now uses the file and
194   line where the dangling construct started, rather than `NONE:0:'.
195 * The debugmode and __file__ macros, and the -s/--synclines option, now
196   show what directory a file was found in when the -I/--include option or
197   M4PATH variable had an effect.
198 * The changequote and changecom macros now work with 8-bit characters, and
199   quotes and comments that begin with `(' are properly recognized
200   following a word.
201 * The new macro __program__ is added, which allows the input file to issue
202   an error message that resembles messages from m4.  Warning and error
203   messages have been reformatted to comply with GNU Coding Standards.
204 * The errprint, m4wrap, and shift macros are now recognized only with
205   arguments.
206 * The index, substr, translit, regexp, and patsubst macros now produce
207   output when given only one argument, but still warn about a missing
208   second argument.
209 * The patsubst macro now reliably finds zero-length matches at the end
210   of a string.
212 Version 1.4.5 - 15 July 2006, by Eric Blake  (CVS version 1.4.4c)
214 * Fix sysval on BeOS, OS/2, and other systems that store exit status
215   in the low-order byte.  Additionally, on Unix platforms, if syscmd was
216   terminated by a signal, sysval now displays the signal number shifted
217   left by eight bits, to match traditional m4 implementations.
218 * The maketemp macro is no longer subject to platform limitations (such as
219   26 or 32 max files from a given template).
220 * Frozen files now require that the first directive be V (version), to
221   better diagnose version mismatch.  Additionally, if the F directive
222   (builtin function) names an unknown builtin that existed in the m4 that
223   froze the file but not in the current m4 (for example, changeword), the
224   warning is deferred until an attempt is made to actually use the
225   builtin.  This allows downgrading from beta m4-1.4o to stable m4-1.4.5
226   without breaking autoconf.
227 * The format and indir macros are now recognized only with arguments.
228 * The eval macro no longer crashes on x86 architectures when dividing the
229   minimum integer by -1.
230 * On systems with ecvt and fcvt, format no longer truncates trailing
231   zeroes on integers printed with %.0f.  On systems without these
232   functions, format is no longer subject to a buffer overflow that
233   permitted arbitrary code execution.
234 * On native Windows builds, the macro __windows__ is provided instead of
235   __unix__.  Likewise, on OS/2 builds, the macro __os2__ is provided.  This
236   allows input files to determine when syscmd might behave differently.
237 * Fix bug in 1.4.3 patch to use \n line-endings that did not work for
238   cygwin.
239 * When given the empty string or 0, undivert is now documented as a no-op
240   rather than closing stdout, warning about a non-existent file, or trying
241   to read a directory as a file.
242 * Many documentation improvements.  Also, the manual is now distributed
243   under FDL 1.2, rather than a stricter verbatim-only license.
244 * Raise the -L (--nesting-limit) command line option limit from 250 to
245   1024.
246 * The decr, incr, divert, m4exit, and substr macros treat an empty number
247   as 0, issue a warning, and expand as normal; rather than issuing an error
248   and expanding to the empty string.
249 * The eval macro now treats an empty radix argument as 10, handles radix 1,
250   and treats the width argument as number of digits excluding the sign,
251   for compatibility with other m4 implementations.
252 * The ifdef, divert, m4exit, substr, and translit macros now correctly
253   ignore extra arguments.
254 * The popdef and undefine macros now correctly accept multiple arguments.
255 * Although changeword is on its last leg, if enabled, it now reverts to the
256   default (faster) regexp when passed the empty string.
257 * The regexp and substr macros now warn and ignore a trailing backslash in
258   the replacement, and warn on \n for n larger than the number of
259   sub-expressions in the regexp.
261 Version 1.4.4b - 17 June 2006, by Eric Blake  (CVS version 1.4.4a)
263 * Fix a recursive push_string crashing bug, which affected changequote of
264   three or more characters on some compilers.
265 * Use automake to fix build portability issues.
266 * Fix a recursive m4wrap crashing bug.
267 * Fix a 1 in 2**32 hash crashing bug.
268 * Tracing a macro by name is now persistent, even if the macro is
269   subsequently undefined or redefined.  The traceon and traceoff macros no
270   longer warn about undefined symbols.  This solves a crash when using
271   indir on an undefined macro traced with the -t option, as well as an
272   incorrect result of ifdef.  Furthermore, tracing is no longer transferred
273   with builtins, solving the bug of "m4 -tm4_eval" failing to give trace
274   output on the input "define(`m4_eval',defn(`eval'))m4_eval(1)".
275 * Fix a crash when a macro is undefined while collecting its arguments, by
276   always using the definition that was in effect before argument
277   collection.  This behavior matches the C pre-processor, and means that
278   the sequence "define(`f',`1')f(define(`f',`2'))f" is now documented to
279   result in "12", rather than the previously undocumented "22".
280 * Update the regex engine to fix several bugs.
281 * Fix a potential crash on machines where char is signed.
283 Version 1.4.4 - October 2005, by Gary V. Vaughan
285 * ./configure --infodir=/usr/share/info now works correctly.
286 * When any file named on the command line is missing exit with status 1.
288 Version 1.4.3 - March 2005, by Gary V. Vaughan
290 * DESTDIR installs now work correctly.
291 * Don't segfault with uncompilable regexps to changeword().
292 * Always use \n line-endings for frozen files (fixes a Windows bug).
293 * Portability fix for systems lacking mkstemp(3).
294 * Approximately 20% speed up in the common case of usage with autoconf.
295 * Supported on QNX 6.3.
297 Version 1.4.2 - August 2004, by Paul Eggert
299 * No user visible changes; portability bug fixes only.
301 Version 1.4.1 - June 2004, by Paul Eggert
303 * maketemp now creates an empty file with the given name, instead of merely
304   returning the name of a nonexistent file.  This closes a security hole.
306 Version 1.4 - October 1994, by Franc,ois Pinard
308 (No user visible changes)
310 Version 1.3 - September 1994, by Franc,ois Pinard
312 * Diversions are created as needed.  Option `-N' is still accepted, but
313 otherwise ignored.  Users should use only negative diversion numbers,
314 instead of high positive numbers, for diverting to nowhere.
316 * Diversions should also work faster.  No temporary files will be needed
317 at all if all diversions taken altogether do not use more than 512K.
319 * Frozen state files may be produced with the `--freeze-state' (-F)
320 option and later brought back through the `--reload-state' (-R) option.
322 Version 1.2 - July 1994, by Franc,ois Pinard
324 * In patsubst(STRING, REGEXP, REPLACEMENT), \& in REPLACEMENT has been
325 changed to represent this part of STRING matched by the whole REGEXP,
326 instead of the whole STRING as before.  \0 does the same, but emits a
327 diagnostic saying it will disappear in some subsequent release.
329 * eval(EXPR) emits a diagnostic if EXPR has suffixed crumb.  The same for
330 other numeric conversions in incr(), decr(), divert(), etc.
332 * `--fatal-warnings' (-E) stops execution at first warning.
334 * `--nesting-limit=LEVEL' (-L LEVEL) sets a limit to macro nesting.
335 It is initially fixed at 250.
337 * `--word-regexp=REGEXP' (-W REGEXP) modifies macro name syntax, like
338 does the new `changeword(REGEXP)' macro.  This feature is experimental,
339 tell me your opinions about it.  You do need --enable-changeword at
340 configure time to get these things.  Do *not* depend on them yet.
342 * Trace output format is scannable by GNU Emacs' next-error function.
344 * Stack overflow is detected and diagnosed on some capable systems.
346 * Various bugs have been corrected, m4 should be more portable.  See the
347 ChangeLog for details.
349 Version 1.1 - November 1993, by Franc,ois Pinard
351 Changes which might affect existing GNU m4 scripts:
353 * Option `-V' has been removed, use `--version' instead.  `--version'
354 writes on standard output instead of standard error, and inhibits any
355 script execution.
357 * `--no-gnu-extensions' has been renamed `--traditional'.
359 * In `eval', `^' used to indicate exponentiation, use `**' instead.
361 * The automatic undiversion which takes place at end of all input is
362 forced into the main output stream.
364 Changes which are unlikely to affect existing scripts:
366 * `--help' prints an usage summary on standard output.  Script execution
367 is then inhibited.
369 * `--prefix-builtins' (-P) prefixes all builtin macros by `m4_'.
371 * Most builtin macros for which arguments are mandatory, called without
372 any arguments, are no more recognized as builtin macros: they are
373 consequently copied verbatim to the output stream.
375 * `define' and `pushdef' are usable with only one argument, they give
376 this argument an empty definition.
378 * `eval' new operators for binary representation handling: `^' for
379 exclusive-or, `~' for the bitwise negation, `<<' and `>>' for shifts.
381 * `eval' recognizes the notation 0bDIGITS for binary numbers and the
382 notation 0rRADIX:DIGITS for numbers in any radix from 1 to 36.
384 Version 1.0.3 - December 1992, by Franc,ois Pinard
386 Changes for the user:
388 * `dnl' outputs a diagnostic if immediately followed by `('.  Usually,
389 `dnl' is followed by newline or whitespace.
391 * `ifelse' accepts without complaining the common idiom of having only
392 one argument.  This is useful for introducing long comments.
394 * `eval' always expresses values as signed, whatever the radix.
396 * M4OPTS environment variable is no longer obeyed.
398 * `--no-warnings' option is renamed `--silent'.
400 * Debug lines use a new format more compatible with GNU standards.
402 * Various bugs have been corrected.  See the ChangeLog for details.
404 Changes for the installer:
406 * GNU m4 now uses an Autoconf-generated configure script, and should be
407 more easily portable in many ways.  (Cray is not supported yet).
409 * `make check' has been made more portable, expect no errors.
411 Changes for the programmer:
413 * Sources have been fully reindented to comply with GNU standards, and
414 cleaned up in many ways.
416 * Sources have been protoized.  Non-ANSI compilers are automatically
417 detected, then sources are unprotoized on the fly before compilation.
419 * GNU m4 uses newer versions of obstack, regex, getopt, etc.
421 Version 1.0 - October 1991, by Rene' Seindal
423 * Uses GNU configure, taken from the gdb distribution.
425 * Uses GNU getopt(), with long option names.
427 * The -Q/+quiet option is added, which suppresses warnings about missing
428 or superflous arguments to built-in macros.
430 * Added default options via the M4OPTS environment variable.
432 * Several minor bugs have been fixed.
434 Version 0.99 - July 1991, by Rene' Seindal
436 * The builtins `incr' and `decr' are now implemented without use of
437 `eval'.
439 * The builtin `indir' is added, to allow for indirect macro calls
440 (allows use of "illegal" macro names).
442 * The debugging and tracing facilities has been enhanced considerably.
443 See the manual for details.
445 * The -tMACRO option is added, marks MACRO for tracing as soon as it
446 is defined.
448 * Builtins are traced after renaming iff they were before.
450 * Named files can now be undiverted.
452 * The -Nnum option can be used to increase the number of divertions
453 available.
455 * Calling changecom without arguments now disables all comment handling.
457 * A bug in `dnl' is fixed.
459 * A bug in the multi-character quoting code is fixed.
461 * Several typos in the manual has been corrected.  More probably persist.
463 Version 0.75 - November 1990, by Rene' Seindal
465 * Implemented search path for include files (-I option and M4PATH
466 environment variable).
468 * Implemented builtin `format' for printf-like formatting.
470 * Implemented builtin `regexp' for searching for regular expressions.
472 * Implemented builtin `patsubst' for substitution with regular
473 expressions.
475 * Implemented builtin `esyscmd', which expands to a shell commands output.
477 * Implemented `__file__' and `__line__' for use in error messages.
479 * Implemented character ranges in `translit'.
481 * Implemented control over debugging output.
483 * Implemented multi-character quotes.
485 * Implemented multi-character comment delimiters.
487 * Changed predefined macro `gnu' to `__gnu__'.
489 * Changed predefined macro `unix' to `__unix__', when the -G option is
490 not used.  With -G, `unix' is still defined.
492 * Added program name to error messages.
494 * Fixed two missing null bytes bugs.
496 Version 0.50 - January 1990, by Rene' Seindal
498 * Initial beta release.
500 Local Variables:
501 mode: outline
502 fill-column: 75
503 End: