liblzma: Omit CRC tables when not needed with ARM64 optimizations.
[xz.git] / NEWS
blob37bef7fc094f3632f016631aee304be58f81086a
2 XZ Utils Release Notes
3 ======================
5 5.5.1alpha (2024-01-26)
7     * Added a new filter for RISC-V binaries. The filter can be used
8       for 32-bit and 64-bit binaries with either little or big
9       endianness. In liblzma, the Filter ID is LZMA_FILTER_RISCV (0x0B)
10       and the xz option is --riscv. liblzma filter string syntax
11       recognizes this filter as "riscv".
13     * liblzma:
15         - Added lzma_mt_block_size() to recommend a Block size for
16           multithreaded encoding
18         - Added CLMUL-based CRC32 on x86-64 and E2K with runtime
19           processor detection. Similar to CRC64, on 32-bit x86 it
20           isn't available unless --disable-assembler is used.
22         - Implemented GNU indirect function (IFUNC) as a runtime
23           function dispatching method for CRC32 and CRC64 fast
24           implementations on x86. Only GNU/Linux (glibc) and FreeBSD
25           builds will use IFUNC, unless --enable-ifunc is specified to
26           configure.
28         - Added definitions of mask values like
29           LZMA_INDEX_CHECK_MASK_CRC32 to <lzma/index.h>.
31         - The XZ logo is now included in the Doxygen generated
32           documentation. It is licensed under Creative Commons
33           Attribution-ShareAlike 4.0.
35     * xz:
37         - Multithreaded mode is now the default. This improves
38           compression speed and creates .xz files that can be
39           decompressed multithreaded at the cost of increased memory
40           usage and slightly worse compression ratio.
42         - Added new command line option --filters to set the filter
43           chain using liblzma filter string syntax.
45         - Added new command line options --filters1 ... --filters9 to
46           set additional filter chains using liblzma filter string
47           syntax. The --block-list option now allows specifying filter
48           chains that were set using these new options.
50         - Added support for Linux Landlock as a sandboxing method.
52         - xzdec now supports pledge(2), Capsicum, and Linux Landlock as
53           sandboxing methods.
55         - Progress indicator time stats remain accurate after pausing
56           xz with SIGTSTP.
58         - Ported xz and xzdec to Windows MSVC. Visual Studio 2015 or
59           later is required.
61     * CMake Build:
63         - Supports pledge(2), Capsicum, and Linux Landlock sandboxing
64           methods.
66         - Replacement functions for getopt_long() are used on platforms
67           that do not have it.
69     * Enabled unaligned access by default on PowerPC64LE and on RISC-V
70       targets that define __riscv_misaligned_fast.
72     * Tests:
74         - Added two new fuzz targets to OSS-Fuzz.
76         - Implemented Continuous Integration (CI) testing using
77           GitHub Actions.
79     * Changed quoting style from `...' to '...' in all messages,
80       scripts, and documentation.
82     * Added basic Codespell support to help catch typo errors.
85 5.4.6 (2024-01-26)
87     * Fixed a bug involving internal function pointers in liblzma not
88       being initialized to NULL. The bug can only be triggered if
89       lzma_filters_update() is called on a LZMA1 encoder, so it does
90       not affect xz or any application known to us that uses liblzma.
92     * xz:
94         - Fixed a regression introduced in 5.4.2 that caused encoding
95           in the raw format to unnecessarily fail if --suffix was not
96           used. For instance, the following command no longer reports
97           that --suffix must be used:
99               echo foo | xz --format=raw --lzma2 | wc -c
101         - Fixed an issue on MinGW-w64 builds that prevented reading
102           from or writing to non-terminal character devices like NUL.
104     * Added a new test.
107 5.4.5 (2023-11-31)
109     * liblzma:
111         - Use __attribute__((__no_sanitize_address__)) to avoid address
112           sanitization with CRC64 CLMUL. It uses 16-byte-aligned reads
113           which can extend past the bounds of the input buffer and
114           inherently trigger address sanitization errors. This isn't
115           a bug.
117         - Fixed an assertion failure that could be triggered by a large
118           unpadded_size argument. It was verified that there was no
119           other bug than the assertion failure.
121         - Fixed a bug that prevented building with Windows Vista
122           threading when __attribute__((__constructor__)) is not
123           supported.
125     * xz now properly handles special files such as "con" or "nul" on
126       Windows. Before this fix, the following wrote "foo" to the
127       console and deleted the input file "con_xz":
129           echo foo | xz > con_xz
130           xz --suffix=_xz --decompress con_xz
132     * Build systems:
134         - Allow builds with Windows win95 threading and small mode when
135           __attribute__((__constructor__)) is supported.
137         - Added a new line to liblzma.pc for MSYS2 (Windows):
139               Cflags.private: -DLZMA_API_STATIC
141           When compiling code that will link against static liblzma,
142           the LZMA_API_STATIC macro needs to be defined on Windows.
144         - CMake specific changes:
146             * Fixed a bug that allowed CLOCK_MONOTONIC to be used even
147               if the check for it failed.
149             * Fixed a bug where configuring CMake multiple times
150               resulted in HAVE_CLOCK_GETTIME and HAVE_CLOCK_MONOTONIC
151               not being set.
153             * Fixed the build with MinGW-w64-based Clang/LLVM 17.
154               llvm-windres now has more accurate GNU windres emulation
155               so the GNU windres workaround from 5.4.1 is needed with
156               llvm-windres version 17 too.
158             * The import library on Windows is now properly named
159               "liblzma.dll.a" instead of "libliblzma.dll.a"
161             * Fixed a bug causing the Ninja Generator to fail on
162               UNIX-like systems. This bug was introduced in 5.4.0.
164             * Added a new option to disable CLMUL CRC64.
166             * A module-definition (.def) file is now created when
167               building liblzma.dll with MinGW-w64.
169             * The pkg-config liblzma.pc file is now installed on all
170               builds except when using MSVC on Windows.
172             * Added large file support by default for platforms that
173               need it to handle files larger than 2 GiB. This includes
174               MinGW-w64, even 64-bit builds.
176     * Small fixes and improvements to the tests.
178     * Updated translations: Chinese (simplified) and Esperanto.
181 5.4.4 (2023-08-02)
183     * liblzma and xzdec can now build against WASI SDK when threading
184       support is disabled. xz and tests don't build yet.
186     * CMake:
188         - Fixed a bug preventing other projects from including liblzma
189           multiple times using find_package().
191         - Don't create broken symlinks in Cygwin and MSYS2 unless
192           supported by the environment. This prevented building for the
193           default MSYS2 environment. The problem was introduced in
194           xz 5.4.0.
196     * Documentation:
198         - Small improvements to man pages.
200         - Small improvements and typo fixes for liblzma API
201           documentation.
203     * Tests:
205         - Added a new section to INSTALL to describe basic test usage
206           and address recent questions about building the tests when
207           cross compiling.
209         - Small fixes and improvements to the tests.
211     * Translations:
213         - Fixed a mistake that caused one of the error messages to not
214           be translated. This only affected versions 5.4.2 and 5.4.3.
216         - Updated the Chinese (simplified), Croatian, Esperanto, German,
217           Korean, Polish, Romanian, Spanish, Swedish, Ukrainian, and
218           Vietnamese translations.
220         - Updated the German, Korean, Romanian, and Ukrainian man page
221           translations.
224 5.4.3 (2023-05-04)
226     * All fixes from 5.2.12
228     * Features in the CMake build can now be disabled as CMake cache
229       variables, similar to the Autotools build.
231     * Minor update to the Croatian translation.
234 5.4.2 (2023-03-18)
236     * All fixes from 5.2.11 that were not included in 5.4.1.
238     * If xz is built with support for the Capsicum sandbox but running
239       in an environment that doesn't support Capsicum, xz now runs
240       normally without sandboxing instead of exiting with an error.
242     * liblzma:
244         - Documentation was updated to improve the style, consistency,
245           and completeness of the liblzma API headers.
247         - The Doxygen-generated HTML documentation for the liblzma API
248           header files is now included in the source release and is
249           installed as part of "make install". All JavaScript is
250           removed to simplify license compliance and to reduce the
251           install size.
253         - Fixed a minor bug in lzma_str_from_filters() that produced
254           too many filters in the output string instead of reporting
255           an error if the input array had more than four filters. This
256           bug did not affect xz.
258     * Build systems:
260         - autogen.sh now invokes the doxygen tool via the new wrapper
261           script doxygen/update-doxygen, unless the command line option
262           --no-doxygen is used.
264         - Added microlzma_encoder.c and microlzma_decoder.c to the
265           VS project files for Windows and to the CMake build. These
266           should have been included in 5.3.2alpha.
268     * Tests:
270         - Added a test to the CMake build that was forgotten in the
271           previous release.
273         - Added and refactored a few tests.
275     * Translations:
277         - Updated the Brazilian Portuguese translation.
279         - Added Brazilian Portuguese man page translation.
282 5.4.1 (2023-01-11)
284     * liblzma:
286         - Fixed the return value of lzma_microlzma_encoder() if the
287           LZMA options lc/lp/pb are invalid. Invalid lc/lp/pb options
288           made the function return LZMA_STREAM_END without encoding
289           anything instead of returning LZMA_OPTIONS_ERROR.
291         - Windows / Visual Studio: Workaround a possible compiler bug
292           when targeting 32-bit x86 and compiling the CLMUL version of
293           the CRC64 code. The CLMUL code isn't enabled by the Windows
294           project files but it is in the CMake-based builds.
296     * Build systems:
298         - Windows-specific CMake changes:
300             * Don't try to enable CLMUL CRC64 code if _mm_set_epi64x()
301               isn't available. This fixes CMake-based build with Visual
302               Studio 2013.
304             * Created a workaround for a build failure with windres
305               from GNU binutils. It is used only when the C compiler
306               is GCC (not Clang). The workaround is incompatible
307               with llvm-windres, resulting in "XZx20Utils" instead
308               of "XZ Utils" in the resource file, but without the
309               workaround llvm-windres works correctly. See the
310               comment in CMakeLists.txt for details.
312             * Included the resource files in the xz and xzdec build
313               rules. Building the command line tools is still
314               experimental but possible with MinGW-w64.
316         - Visual Studio: Added stream_decoder_mt.c to the project
317           files. Now the threaded decompressor lzma_stream_decoder_mt()
318           gets built. CMake-based build wasn't affected.
320         - Updated windows/INSTALL-MSVC.txt to mention that CMake-based
321           build is now the preferred method with Visual Studio. The
322           project files will probably be removed after 5.4.x releases.
324         - Changes to #defines in config.h:
326             * HAVE_DECL_CLOCK_MONOTONIC was replaced by
327               HAVE_CLOCK_MONOTONIC. The old macro was always defined
328               in configure-generated config.h to either 0 or 1. The
329               new macro is defined (to 1) only if the declaration of
330               CLOCK_MONOTONIC is available. This matches the way most
331               other config.h macros work and makes things simpler with
332               other build systems.
334             * HAVE_DECL_PROGRAM_INVOCATION_NAME was replaced by
335               HAVE_PROGRAM_INVOCATION_NAME for the same reason.
337     * Tests:
339         - Fixed test script compatibility with ancient /bin/sh
340           versions. Now the five test_compress_* tests should
341           no longer fail on Solaris 10.
343         - Added and refactored a few tests.
345     * Translations:
347         - Updated the Catalan and Esperanto translations.
349         - Added Korean and Ukrainian man page translations.
352 5.4.0 (2022-12-13)
354     This bumps the minor version of liblzma because new features were
355     added. The API and ABI are still backward compatible with liblzma
356     5.2.x and 5.0.x.
358     Since 5.3.5beta:
360     * All fixes from 5.2.10.
362     * The ARM64 filter is now stable. The xz option is now --arm64.
363       Decompression requires XZ Utils 5.4.0. In the future the ARM64
364       filter will be supported by XZ for Java, XZ Embedded (including
365       the version in Linux), LZMA SDK, and 7-Zip.
367     * Translations:
369         - Updated Catalan, Croatian, German, Romanian, and Turkish
370           translations.
372         - Updated German man page translations.
374         - Added Romanian man page translations.
376     Summary of new features added in the 5.3.x development releases:
378     * liblzma:
380         - Added threaded .xz decompressor lzma_stream_decoder_mt().
381           It can use multiple threads with .xz files that have multiple
382           Blocks with size information in Block Headers. The threaded
383           encoder in xz has always created such files.
385           Single-threaded encoder cannot store the size information in
386           Block Headers even if one used LZMA_FULL_FLUSH to create
387           multiple Blocks, so this threaded decoder cannot use multiple
388           threads with such files.
390           If there are multiple Streams (concatenated .xz files), one
391           Stream will be decompressed completely before starting the
392           next Stream.
394         - A new decoder flag LZMA_FAIL_FAST was added. It makes the
395           threaded decompressor report errors soon instead of first
396           flushing all pending data before the error location.
398         - New Filter IDs:
399             * LZMA_FILTER_ARM64 is for ARM64 binaries.
400             * LZMA_FILTER_LZMA1EXT is for raw LZMA1 streams that don't
401               necessarily use the end marker.
403         - Added lzma_str_to_filters(), lzma_str_from_filters(), and
404           lzma_str_list_filters() to convert a preset or a filter chain
405           string to a lzma_filter[] and vice versa. These should make
406           it easier to write applications that allow users to specify
407           custom compression options.
409         - Added lzma_filters_free() which can be convenient for freeing
410           the filter options in a filter chain (an array of lzma_filter
411           structures).
413         - lzma_file_info_decoder() to makes it a little easier to get
414           the Index field from .xz files. This helps in getting the
415           uncompressed file size but an easy-to-use random access
416           API is still missing which has existed in XZ for Java for
417           a long time.
419         - Added lzma_microlzma_encoder() and lzma_microlzma_decoder().
420           It is used by erofs-utils and may be used by others too.
422           The MicroLZMA format is a raw LZMA stream (without end marker)
423           whose first byte (always 0x00) has been replaced with
424           bitwise-negation of the LZMA properties (lc/lp/pb). It was
425           created for use in EROFS but may be used in other contexts
426           as well where it is important to avoid wasting bytes for
427           stream headers or footers. The format is also supported by
428           XZ Embedded (the XZ Embedded version in Linux got MicroLZMA
429           support in Linux 5.16).
431           The MicroLZMA encoder API in liblzma can compress into a
432           fixed-sized output buffer so that as much data is compressed
433           as can be fit into the buffer while still creating a valid
434           MicroLZMA stream. This is needed for EROFS.
436         - Added lzma_lzip_decoder() to decompress the .lz (lzip) file
437           format version 0 and the original unextended version 1 files.
438           Also lzma_auto_decoder() supports .lz files.
440         - lzma_filters_update() can now be used with the multi-threaded
441           encoder (lzma_stream_encoder_mt()) to change the filter chain
442           after LZMA_FULL_BARRIER or LZMA_FULL_FLUSH.
444         - In lzma_options_lzma, allow nice_len = 2 and 3 with the match
445           finders that require at least 3 or 4. Now it is internally
446           rounded up if needed.
448         - CLMUL-based CRC64 on x86-64 and E2K with runtime processor
449           detection. On 32-bit x86 it currently isn't available unless
450           --disable-assembler is used which can make the non-CLMUL
451           CRC64 slower; this might be fixed in the future.
453         - Building with --disable-threads --enable-small
454           is now thread-safe if the compiler supports
455           __attribute__((__constructor__)).
457     * xz:
459         - Using -T0 (--threads=0) will now use multi-threaded encoder
460           even on a single-core system. This is to ensure that output
461           from the same xz binary is identical on both single-core and
462           multi-core systems.
464         - --threads=+1 or -T+1 is now a way to put xz into
465           multi-threaded mode while using only one worker thread.
466           The + is ignored if the number is not 1.
468         - A default soft memory usage limit is now used for compression
469           when -T0 is used and no explicit limit has been specified.
470           This soft limit is used to restrict the number of threads
471           but if the limit is exceeded with even one thread then xz
472           will continue with one thread using the multi-threaded
473           encoder and this limit is ignored. If the number of threads
474           is specified manually then no default limit will be used;
475           this affects only -T0.
477           This change helps on systems that have very many cores and
478           using all of them for xz makes no sense. Previously xz -T0
479           could run out of memory on such systems because it attempted
480           to reserve memory for too many threads.
482           This also helps with 32-bit builds which don't have a large
483           amount of address space that would be required for many
484           threads. The default soft limit for -T0 is at most 1400 MiB
485           on all 32-bit platforms.
487         - Previously a low value in --memlimit-compress wouldn't cause
488           xz to switch from multi-threaded mode to single-threaded mode
489           if the limit cannot otherwise be met; xz failed instead. Now
490           xz can switch to single-threaded mode and then, if needed,
491           scale down the LZMA2 dictionary size too just like it already
492           did when it was started in single-threaded mode.
494         - The option --no-adjust no longer prevents xz from scaling down
495           the number of threads as that doesn't affect the compressed
496           output (only performance). Now --no-adjust only prevents
497           adjustments that affect compressed output, that is, with
498           --no-adjust xz won't switch from multi-threaded mode to
499           single-threaded mode and won't scale down the LZMA2
500           dictionary size.
502         - Added a new option --memlimit-mt-decompress=LIMIT. This is
503           used to limit the number of decompressor threads (possibly
504           falling back to single-threaded mode) but it will never make
505           xz refuse to decompress a file. This has a system-specific
506           default value because without any limit xz could end up
507           allocating memory for the whole compressed input file, the
508           whole uncompressed output file, multiple thread-specific
509           decompressor instances and so on. Basically xz could
510           attempt to use an insane amount of memory even with fairly
511           common files. The system-specific default value is currently
512           the same as the one used for compression with -T0.
514           The new option works together with the existing option
515           --memlimit-decompress=LIMIT. The old option sets a hard limit
516           that must not be exceeded (xz will refuse to decompress)
517           while the new option only restricts the number of threads.
518           If the limit set with --memlimit-mt-decompress is greater
519           than the limit set with --memlimit-compress, then the latter
520           value is used also for --memlimit-mt-decompress.
522         - Added new information to the output of xz --info-memory and
523           new fields to the output of xz --robot --info-memory.
525         - In --lzma2=nice=NUMBER allow 2 and 3 with all match finders
526           now that liblzma handles it.
528         - Don't mention endianness for ARM and ARM-Thumb filters in
529           --long-help. The filters only work for little endian
530           instruction encoding but modern ARM processors using
531           big endian data access still use little endian
532           instruction encoding. So the help text was misleading.
533           In contrast, the PowerPC filter is only for big endian
534           32/64-bit PowerPC code. Little endian PowerPC would need
535           a separate filter.
537         - Added decompression support for the .lz (lzip) file format
538           version 0 and the original unextended version 1. It is
539           autodetected by default. See also the option --format on
540           the xz man page.
542         - Sandboxing enabled by default:
543             * Capsicum (FreeBSD)
544             * pledge(2) (OpenBSD)
546     * Scripts now support the .lz format using xz.
548     * A few new tests were added.
550     * The liblzma-specific tests are now supported in CMake-based
551       builds too ("make test").
554 5.3.5beta (2022-12-01)
556     * All fixes from 5.2.9.
558     * liblzma:
560         - Added new LZMA_FILTER_LZMA1EXT for raw encoder and decoder to
561           handle raw LZMA1 streams that don't have end of payload marker
562           (EOPM) alias end of stream (EOS) marker. It can be used in
563           filter chains, for example, with the x86 BCJ filter.
565         - Added lzma_str_to_filters(), lzma_str_from_filters(), and
566           lzma_str_list_filters() to make it easier for applications
567           to get custom compression options from a user and convert
568           it to an array of lzma_filter structures.
570         - Added lzma_filters_free().
572         - lzma_filters_update() can now be used with the multi-threaded
573           encoder (lzma_stream_encoder_mt()) to change the filter chain
574           after LZMA_FULL_BARRIER or LZMA_FULL_FLUSH.
576         - In lzma_options_lzma, allow nice_len = 2 and 3 with the match
577           finders that require at least 3 or 4. Now it is internally
578           rounded up if needed.
580         - ARM64 filter was modified. It is still experimental.
582         - Fixed LTO build with Clang if -fgnuc-version=10 or similar
583           was used to make Clang look like GCC >= 10. Now it uses
584           __has_attribute(__symver__) which should be reliable.
586     * xz:
588         - --threads=+1 or -T+1 is now a way to put xz into multi-threaded
589           mode while using only one worker thread.
591         - In --lzma2=nice=NUMBER allow 2 and 3 with all match finders
592           now that liblzma handles it.
594     * Updated translations: Chinese (simplified), Korean, and Turkish.
597 5.3.4alpha (2022-11-15)
599     * All fixes from 5.2.7 and 5.2.8.
601     * liblzma:
603         - Minor improvements to the threaded decoder.
605         - Added CRC64 implementation that uses SSSE3, SSE4.1, and CLMUL
606           instructions on 32/64-bit x86 and E2K. On 32-bit x86 it's
607           not enabled unless --disable-assembler is used but then
608           the non-CLMUL code might be slower. Processor support is
609           detected at runtime so this is built by default on x86-64
610           and E2K. On these platforms, if compiler flags indicate
611           unconditional CLMUL support (-msse4.1 -mpclmul) then the
612           generic version is not built, making liblzma 8-9 KiB smaller
613           compared to having both versions included.
615           With extremely compressible files this can make decompression
616           up to twice as fast but with typical files 5 % improvement
617           is a more realistic expectation.
619           The CLMUL version is slower than the generic version with
620           tiny inputs (especially at 1-8 bytes per call, but up to
621           16 bytes). In normal use in xz this doesn't matter at all.
623         - Added an experimental ARM64 filter. This is *not* the final
624           version! Files created with this experimental version won't
625           be supported in the future versions! The filter design is
626           a compromise where improving one use case makes some other
627           cases worse.
629         - Added decompression support for the .lz (lzip) file format
630           version 0 and the original unextended version 1. See the
631           API docs of lzma_lzip_decoder() for details. Also
632           lzma_auto_decoder() supports .lz files.
634         - Building with --disable-threads --enable-small
635           is now thread-safe if the compiler supports
636           __attribute__((__constructor__))
638     * xz:
640         - Added support for OpenBSD's pledge(2) as a sandboxing method.
642         - Don't mention endianness for ARM and ARM-Thumb filters in
643           --long-help. The filters only work for little endian
644           instruction encoding but modern ARM processors using
645           big endian data access still use little endian
646           instruction encoding. So the help text was misleading.
647           In contrast, the PowerPC filter is only for big endian
648           32/64-bit PowerPC code. Little endian PowerPC would need
649           a separate filter.
651         - Added --experimental-arm64. This will be renamed once the
652           filter is finished. Files created with this experimental
653           filter will not be supported in the future!
655         - Added new fields to the output of xz --robot --info-memory.
657         - Added decompression support for the .lz (lzip) file format
658           version 0 and the original unextended version 1. It is
659           autodetected by default. See also the option --format on
660           the xz man page.
662     * Scripts now support the .lz format using xz.
664     * Build systems:
666         - New #defines in config.h: HAVE_ENCODER_ARM64,
667           HAVE_DECODER_ARM64, HAVE_LZIP_DECODER, HAVE_CPUID_H,
668           HAVE_FUNC_ATTRIBUTE_CONSTRUCTOR, HAVE_USABLE_CLMUL
670         - New configure options: --disable-clmul-crc,
671           --disable-microlzma, --disable-lzip-decoder, and
672           'pledge' is now an option in --enable-sandbox (but
673           it's autodetected by default anyway).
675         - INSTALL was updated to document the new configure options.
677         - PACKAGERS now lists also --disable-microlzma and
678           --disable-lzip-decoder as configure options that must
679           not be used in builds for non-embedded use.
681     * Tests:
683         - Fix some of the tests so that they skip instead of fail if
684           certain features have been disabled with configure options.
685           It's still not perfect.
687         - Other improvements to tests.
689     * Updated translations: Croatian, Finnish, Hungarian, Polish,
690       Romanian, Spanish, Swedish, and Ukrainian.
693 5.3.3alpha (2022-08-22)
695     * All fixes from 5.2.6.
697     * liblzma:
699         - Fixed 32-bit build.
701         - Added threaded .xz decompressor lzma_stream_decoder_mt().
702           It can use multiple threads with .xz files that have multiple
703           Blocks with size information in Block Headers. The threaded
704           encoder in xz has always created such files.
706           Single-threaded encoder cannot store the size information in
707           Block Headers even if one used LZMA_FULL_FLUSH to create
708           multiple Blocks, so this threaded decoder cannot use multiple
709           threads with such files.
711           If there are multiple Streams (concatenated .xz files), one
712           Stream will be decompressed completely before starting the
713           next Stream.
715         - A new decoder flag LZMA_FAIL_FAST was added. It makes the
716           threaded decompressor report errors soon instead of first
717           flushing all pending data before the error location.
719     * xz:
721         - Using -T0 (--threads=0) will now use multi-threaded encoder
722           even on a single-core system. This is to ensure that output
723           from the same xz binary is identical on both single-core and
724           multi-core systems.
726         - A default soft memory usage limit is now used for compression
727           when -T0 is used and no explicit limit has been specified.
728           This soft limit is used to restrict the number of threads
729           but if the limit is exceeded with even one thread then xz
730           will continue with one thread using the multi-threaded
731           encoder and this limit is ignored. If the number of threads
732           is specified manually then no default limit will be used;
733           this affects only -T0.
735           This change helps on systems that have very many cores and
736           using all of them for xz makes no sense. Previously xz -T0
737           could run out of memory on such systems because it attempted
738           to reserve memory for too many threads.
740           This also helps with 32-bit builds which don't have a large
741           amount of address space that would be required for many
742           threads. The default limit is 1400 MiB on all 32-bit
743           platforms with -T0.
745           Now xz -T0 should just work. It might use too few threads
746           in some cases but at least it shouldn't easily run out of
747           memory. It's possible that this will be tweaked before 5.4.0.
749         - Changes to --memlimit-compress and --no-adjust:
751           In single-threaded mode, --memlimit-compress can make xz
752           scale down the LZMA2 dictionary size to meet the memory usage
753           limit. This obviously affects the compressed output. However,
754           if xz was in threaded mode, --memlimit-compress could make xz
755           reduce the number of threads but it wouldn't make xz switch
756           from multi-threaded mode to single-threaded mode or scale
757           down the LZMA2 dictionary size. This seemed illogical.
759           Now --memlimit-compress can make xz switch to single-threaded
760           mode if one thread in multi-threaded mode uses too much
761           memory. If memory usage is still too high, then the LZMA2
762           dictionary size can be scaled down too.
764           The option --no-adjust was also changed so that it no longer
765           prevents xz from scaling down the number of threads as that
766           doesn't affect compressed output (only performance). After
767           this commit --no-adjust only prevents adjustments that affect
768           compressed output, that is, with --no-adjust xz won't switch
769           from multithreaded mode to single-threaded mode and won't
770           scale down the LZMA2 dictionary size.
772         - Added a new option --memlimit-mt-decompress=LIMIT. This is
773           used to limit the number of decompressor threads (possibly
774           falling back to single-threaded mode) but it will never make
775           xz refuse to decompress a file. This has a system-specific
776           default value because without any limit xz could end up
777           allocating memory for the whole compressed input file, the
778           whole uncompressed output file, multiple thread-specific
779           decompressor instances and so on. Basically xz could
780           attempt to use an insane amount of memory even with fairly
781           common files.
783           The new option works together with the existing option
784           --memlimit-decompress=LIMIT. The old option sets a hard limit
785           that must not be exceeded (xz will refuse to decompress)
786           while the new option only restricts the number of threads.
787           If the limit set with --memlimit-mt-decompress is greater
788           than the limit set with --memlimit-compress, then the latter
789           value is used also for --memlimit-mt-decompress.
791     * Tests:
793         - Added a few more tests.
795         - Added tests/code_coverage.sh to create a code coverage report
796           of the tests.
798     * Build systems:
800         - Automake's parallel test harness is now used to make tests
801           finish faster.
803         - Added the CMake files to the distribution tarball. These were
804           supposed to be in 5.2.5 already.
806         - Added liblzma tests to the CMake build.
808         - Windows: Fix building of liblzma.dll with the included
809           Visual Studio project files.
812 5.3.2alpha (2021-10-28)
814     This release was made on short notice so that recent erofs-utils can
815     be built with LZMA support without needing a snapshot from xz.git.
816     Thus many pending things were not included, not even updated
817     translations (which would need to be updated for the new --list
818     strings anyway).
820     * All fixes from 5.2.5.
822     * xz:
824         - When copying metadata from the source file to the destination
825           file, don't try to set the group (GID) if it is already set
826           correctly. This avoids a failure on OpenBSD (and possibly on
827           a few other OSes) where files may get created so that their
828           group doesn't belong to the user, and fchown(2) can fail even
829           if it needs to do nothing.
831         - The --keep option now accepts symlinks, hardlinks, and
832           setuid, setgid, and sticky files. Previously this required
833           using --force.
835         - Split the long strings used in --list and --info-memory modes
836           to make them much easier for translators.
838         - If built with sandbox support and enabling the sandbox fails,
839           xz will now immediately exit with exit status of 1. Previously
840           it would only display a warning if -vv was used.
842         - Cap --memlimit-compress to 2000 MiB on MIPS32 because on
843           MIPS32 userspace processes are limited to 2 GiB of address
844           space.
846     * liblzma:
848         - Added lzma_microlzma_encoder() and lzma_microlzma_decoder().
849           The API is in lzma/container.h.
851           The MicroLZMA format is a raw LZMA stream (without end marker)
852           whose first byte (always 0x00) has been replaced with
853           bitwise-negation of the LZMA properties (lc/lp/pb). It was
854           created for use in EROFS but may be used in other contexts
855           as well where it is important to avoid wasting bytes for
856           stream headers or footers. The format is also supported by
857           XZ Embedded.
859           The MicroLZMA encoder API in liblzma can compress into a
860           fixed-sized output buffer so that as much data is compressed
861           as can be fit into the buffer while still creating a valid
862           MicroLZMA stream. This is needed for EROFS.
864         - Added fuzzing support.
866         - Support Intel Control-flow Enforcement Technology (CET) in
867           32-bit x86 assembly files.
869         - Visual Studio: Use non-standard _MSVC_LANG to detect C++
870           standard version in the lzma.h API header. It's used to
871           detect when "noexcept" can be used.
873     * Scripts:
875         - Fix exit status of xzdiff/xzcmp. Exit status could be 2 when
876           the correct value is 1.
878         - Fix exit status of xzgrep.
880         - Detect corrupt .bz2 files in xzgrep.
882         - Add zstd support to xzgrep and xzdiff/xzcmp.
884         - Fix less(1) version detection in xzless. It failed if the
885           version number from "less -V" contained a dot.
887     * Fix typos and technical issues in man pages.
889     * Build systems:
891         - Windows: Fix building of resource files when config.h isn't
892           used. CMake + Visual Studio can now build liblzma.dll.
894         - Various fixes to the CMake support. It might still need a few
895           more fixes even for liblzma-only builds.
898 5.3.1alpha (2018-04-29)
900     * All fixes from 5.2.4.
902     * Add lzma_file_info_decoder() into liblzma and use it in xz to
903       implement the --list feature.
905     * Capsicum sandbox support is enabled by default where available
906       (FreeBSD >= 10).
909 5.2.12 (2023-05-04)
911     * Fixed a build system bug that prevented building liblzma as a
912       shared library when configured with --disable-threads. This bug
913       affected releases 5.2.6 to 5.2.11 and 5.4.0 to 5.4.2.
915     * Include <intrin.h> for Windows intrinsic functions where they are
916       needed. This fixed a bug that prevented building liblzma using
917       clang-cl on Windows.
919     * Minor update to the Croatian translation. The small change
920       applies to a string in both 5.2 and 5.4 branches.
923 5.2.11 (2023-03-18)
925     * Removed all possible cases of null pointer + 0. It is undefined
926       behavior in C99 and C17. This was detected by a sanitizer and had
927       not caused any known issues.
929     * Build systems:
931         - Added a workaround for building with GCC on MicroBlaze Linux.
932           GCC 12 on MicroBlaze doesn't support the __symver__ attribute
933           even though __has_attribute(__symver__) returns true. The
934           build is now done without the extra RHEL/CentOS 7 symbols
935           that were added in XZ Utils 5.2.7. The workaround only
936           applies to the Autotools build (not CMake).
938         - CMake: Ensure that the C compiler language is set to C99 or
939           a newer standard.
941         - CMake changes from XZ Utils 5.4.1:
943             * Added a workaround for a build failure with
944               windres from GNU binutils.
946             * Included the Windows resource files in the xz
947               and xzdec build rules.
950 5.2.10 (2022-12-13)
952     * xz: Don't modify argv[] when parsing the --memlimit* and
953       --block-list command line options. This fixes confusing
954       arguments in process listing (like "ps auxf").
956     * GNU/Linux only: Use __has_attribute(__symver__) to detect if
957       that attribute is supported. This fixes build on Mandriva where
958       Clang is patched to define __GNUC__ to 11 by default (instead
959       of 4 as used by Clang upstream).
962 5.2.9 (2022-11-30)
964     * liblzma:
966         - Fixed an infinite loop in LZMA encoder initialization
967           if dict_size >= 2 GiB. (The encoder only supports up
968           to 1536 MiB.)
970         - Fixed two cases of invalid free() that can happen if
971           a tiny allocation fails in encoder re-initialization
972           or in lzma_filters_update(). These bugs had some
973           similarities with the bug fixed in 5.2.7.
975         - Fixed lzma_block_encoder() not allowing the use of
976           LZMA_SYNC_FLUSH with lzma_code() even though it was
977           documented to be supported. The sync-flush code in
978           the Block encoder was already used internally via
979           lzma_stream_encoder(), so this was just a missing flag
980           in the lzma_block_encoder() API function.
982         - GNU/Linux only: Don't put symbol versions into static
983           liblzma as it breaks things in some cases (and even if
984           it didn't break anything, symbol versions in static
985           libraries are useless anyway). The downside of the fix
986           is that if the configure options --with-pic or --without-pic
987           are used then it's not possible to build both shared and
988           static liblzma at the same time on GNU/Linux anymore;
989           with those options --disable-static or --disable-shared
990           must be used too.
992     * New email address for bug reports is <xz@tukaani.org> which
993       forwards messages to Lasse Collin and Jia Tan.
996 5.2.8 (2022-11-13)
998     * xz:
1000         - If xz cannot remove an input file when it should, this
1001           is now treated as a warning (exit status 2) instead of
1002           an error (exit status 1). This matches GNU gzip and it
1003           is more logical as at that point the output file has
1004           already been successfully closed.
1006         - Fix handling of .xz files with an unsupported check type.
1007           Previously such printed a warning message but then xz
1008           behaved as if an error had occurred (didn't decompress,
1009           exit status 1). Now a warning is printed, decompression
1010           is done anyway, and exit status is 2. This used to work
1011           slightly before 5.0.0. In practice this bug matters only
1012           if xz has been built with some check types disabled. As
1013           instructed in PACKAGERS, such builds should be done in
1014           special situations only.
1016         - Fix "xz -dc --single-stream tests/files/good-0-empty.xz"
1017           which failed with "Internal error (bug)". That is,
1018           --single-stream was broken if the first .xz stream in
1019           the input file didn't contain any uncompressed data.
1021         - Fix displaying file sizes in the progress indicator when
1022           working in passthru mode and there are multiple input files.
1023           Just like "gzip -cdf", "xz -cdf" works like "cat" when the
1024           input file isn't a supported compressed file format. In
1025           this case the file size counters weren't reset between
1026           files so with multiple input files the progress indicator
1027           displayed an incorrect (too large) value.
1029     * liblzma:
1031         - API docs in lzma/container.h:
1032             * Update the list of decoder flags in the decoder
1033               function docs.
1034             * Explain LZMA_CONCATENATED behavior with .lzma files
1035               in lzma_auto_decoder() docs.
1037         - OpenBSD: Use HW_NCPUONLINE to detect the number of
1038           available hardware threads in lzma_physmem().
1040         - Fix use of wrong macro to detect x86 SSE2 support.
1041           __SSE2_MATH__ was used with GCC/Clang but the correct
1042           one is __SSE2__. The first one means that SSE2 is used
1043           for floating point math which is irrelevant here.
1044           The affected SSE2 code isn't used on x86-64 so this affects
1045           only 32-bit x86 builds that use -msse2 without -mfpmath=sse
1046           (there is no runtime detection for SSE2). It improves LZMA
1047           compression speed (not decompression).
1049         - Fix the build with Intel C compiler 2021 (ICC, not ICX)
1050           on Linux. It defines __GNUC__ to 10 but doesn't support
1051           the __symver__ attribute introduced in GCC 10.
1053     * Scripts: Ignore warnings from xz by using --quiet --no-warn.
1054       This is needed if the input .xz files use an unsupported
1055       check type.
1057     * Translations:
1059         - Updated Croatian and Turkish translations.
1061         - One new translations wasn't included because it needed
1062           technical fixes. It will be in upcoming 5.4.0. No new
1063           translations will be added to the 5.2.x branch anymore.
1065         - Renamed the French man page translation file from
1066           fr_FR.po to fr.po and thus also its install directory
1067           (like /usr/share/man/fr_FR -> .../fr).
1069         - Man page translations for upcoming 5.4.0 are now handled
1070           in the Translation Project.
1072     * Update doc/faq.txt a little so it's less out-of-date.
1075 5.2.7 (2022-09-30)
1077     * liblzma:
1079         - Made lzma_filters_copy() to never modify the destination
1080           array if an error occurs. lzma_stream_encoder() and
1081           lzma_stream_encoder_mt() already assumed this. Before this
1082           change, if a tiny memory allocation in lzma_filters_copy()
1083           failed it would lead to a crash (invalid free() or invalid
1084           memory reads) in the cleanup paths of these two encoder
1085           initialization functions.
1087         - Added missing integer overflow check to lzma_index_append().
1088           This affects xz --list and other applications that decode
1089           the Index field from .xz files using lzma_index_decoder().
1090           Normal decompression of .xz files doesn't call this code
1091           and thus most applications using liblzma aren't affected
1092           by this bug.
1094         - Single-threaded .xz decoder (lzma_stream_decoder()): If
1095           lzma_code() returns LZMA_MEMLIMIT_ERROR it is now possible
1096           to use lzma_memlimit_set() to increase the limit and continue
1097           decoding. This was supposed to work from the beginning
1098           but there was a bug. With other decoders (.lzma or
1099           threaded .xz decoder) this already worked correctly.
1101         - Fixed accumulation of integrity check type statistics in
1102           lzma_index_cat(). This bug made lzma_index_checks() return
1103           only the type of the integrity check of the last Stream
1104           when multiple lzma_indexes were concatenated. Most
1105           applications don't use these APIs but in xz it made
1106           xz --list not list all check types from concatenated .xz
1107           files. In xz --list --verbose only the per-file "Check:"
1108           lines were affected and in xz --robot --list only the "file"
1109           line was affected.
1111         - Added ABI compatibility with executables that were linked
1112           against liblzma in RHEL/CentOS 7 or other liblzma builds
1113           that had copied the problematic patch from RHEL/CentOS 7
1114           (xz-5.2.2-compat-libs.patch). For the details, see the
1115           comment at the top of src/liblzma/validate_map.sh.
1117           WARNING: This uses __symver__ attribute with GCC >= 10.
1118           In other cases the traditional __asm__(".symver ...")
1119           is used. Using link-time optimization (LTO, -flto) with
1120           GCC versions older than 10 can silently result in
1121           broken liblzma.so.5 (incorrect symbol versions)! If you
1122           want to use -flto with GCC, you must use GCC >= 10.
1123           LTO with Clang seems to work even with the traditional
1124           __asm__(".symver ...") method.
1126     * xzgrep: Fixed compatibility with old shells that break if
1127       comments inside command substitutions have apostrophes (').
1128       This problem was introduced in 5.2.6.
1130     * Build systems:
1132         - New #define in config.h: HAVE_SYMBOL_VERSIONS_LINUX
1134         - Windows: Fixed liblzma.dll build with Visual Studio project
1135           files. It broke in 5.2.6 due to a change that was made to
1136           improve CMake support.
1138         - Windows: Building liblzma with UNICODE defined should now
1139           work.
1141         - CMake files are now actually included in the release tarball.
1142           They should have been in 5.2.5 already.
1144         - Minor CMake fixes and improvements.
1146     * Added a new translation: Turkish
1149 5.2.6 (2022-08-12)
1151     * xz:
1153         - The --keep option now accepts symlinks, hardlinks, and
1154           setuid, setgid, and sticky files. Previously this required
1155           using --force.
1157         - When copying metadata from the source file to the destination
1158           file, don't try to set the group (GID) if it is already set
1159           correctly. This avoids a failure on OpenBSD (and possibly on
1160           a few other OSes) where files may get created so that their
1161           group doesn't belong to the user, and fchown(2) can fail even
1162           if it needs to do nothing.
1164         - Cap --memlimit-compress to 2000 MiB instead of 4020 MiB on
1165           MIPS32 because on MIPS32 userspace processes are limited
1166           to 2 GiB of address space.
1168     * liblzma:
1170         - Fixed a missing error-check in the threaded encoder. If a
1171           small memory allocation fails, a .xz file with an invalid
1172           Index field would be created. Decompressing such a file would
1173           produce the correct output but result in an error at the end.
1174           Thus this is a "mild" data corruption bug. Note that while
1175           a failed memory allocation can trigger the bug, it cannot
1176           cause invalid memory access.
1178         - The decoder for .lzma files now supports files that have
1179           uncompressed size stored in the header and still use the
1180           end of payload marker (end of stream marker) at the end
1181           of the LZMA stream. Such files are rare but, according to
1182           the documentation in LZMA SDK, they are valid.
1183           doc/lzma-file-format.txt was updated too.
1185         - Improved 32-bit x86 assembly files:
1186             * Support Intel Control-flow Enforcement Technology (CET)
1187             * Use non-executable stack on FreeBSD.
1189         - Visual Studio: Use non-standard _MSVC_LANG to detect C++
1190           standard version in the lzma.h API header. It's used to
1191           detect when "noexcept" can be used.
1193     * xzgrep:
1195         - Fixed arbitrary command injection via a malicious filename
1196           (CVE-2022-1271, ZDI-CAN-16587). A standalone patch for
1197           this was released to the public on 2022-04-07. A slight
1198           robustness improvement has been made since then and, if
1199           using GNU or *BSD grep, a new faster method is now used
1200           that doesn't use the old sed-based construct at all. This
1201           also fixes bad output with GNU grep >= 3.5 (2020-09-27)
1202           when xzgrepping binary files.
1204           This vulnerability was discovered by:
1205           cleemy desu wayo working with Trend Micro Zero Day Initiative
1207         - Fixed detection of corrupt .bz2 files.
1209         - Improved error handling to fix exit status in some situations
1210           and to fix handling of signals: in some situations a signal
1211           didn't make xzgrep exit when it clearly should have. It's
1212           possible that the signal handling still isn't quite perfect
1213           but hopefully it's good enough.
1215         - Documented exit statuses on the man page.
1217         - xzegrep and xzfgrep now use "grep -E" and "grep -F" instead
1218           of the deprecated egrep and fgrep commands.
1220         - Fixed parsing of the options -E, -F, -G, -P, and -X. The
1221           problem occurred when multiple options were specified in
1222           a single argument, for example,
1224               echo foo | xzgrep -Fe foo
1226           treated foo as a filename because -Fe wasn't correctly
1227           split into -F -e.
1229         - Added zstd support.
1231     * xzdiff/xzcmp:
1233         - Fixed wrong exit status. Exit status could be 2 when the
1234           correct value is 1.
1236         - Documented on the man page that exit status of 2 is used
1237           for decompression errors.
1239         - Added zstd support.
1241     * xzless:
1243         - Fix less(1) version detection. It failed if the version number
1244           from "less -V" contained a dot.
1246     * Translations:
1248         - Added new translations: Catalan, Croatian, Esperanto,
1249           Korean, Portuguese, Romanian, Serbian, Spanish, Swedish,
1250           and Ukrainian
1252         - Updated the Brazilian Portuguese translation.
1254         - Added French man page translation. This and the existing
1255           German translation aren't complete anymore because the
1256           English man pages got a few updates and the translators
1257           weren't reached so that they could update their work.
1259     * Build systems:
1261         - Windows: Fix building of resource files when config.h isn't
1262           used. CMake + Visual Studio can now build liblzma.dll.
1264         - Various fixes to the CMake support. Building static or shared
1265           liblzma should work fine in most cases. In contrast, building
1266           the command line tools with CMake is still clearly incomplete
1267           and experimental and should be used for testing only.
1270 5.2.5 (2020-03-17)
1272     * liblzma:
1274         - Fixed several C99/C11 conformance bugs. Now the code is clean
1275           under gcc/clang -fsanitize=undefined. Some of these changes
1276           might have a negative effect on performance with old GCC
1277           versions or compilers other than GCC and Clang. The configure
1278           option --enable-unsafe-type-punning can be used to (mostly)
1279           restore the old behavior but it shouldn't normally be used.
1281         - Improved API documentation of lzma_properties_decode().
1283         - Added a very minor encoder speed optimization.
1285     * xz:
1287         - Fixed a crash in "xz -dcfv not_an_xz_file". All four options
1288           were required to trigger it. The crash occurred in the
1289           progress indicator code when xz was in passthru mode where
1290           xz works like "cat".
1292         - Fixed an integer overflow with 32-bit off_t. It could happen
1293           when decompressing a file that has a long run of zero bytes
1294           which xz would try to write as a sparse file. Since the build
1295           system enables large file support by default, off_t is
1296           normally 64-bit even on 32-bit systems.
1298         - Fixes for --flush-timeout:
1299             * Fix semi-busy-waiting.
1300             * Avoid unneeded flushes when no new input has arrived
1301               since the previous flush was completed.
1303         - Added a special case for 32-bit xz: If --memlimit-compress is
1304           used to specify a limit that exceeds 4020 MiB, the limit will
1305           be set to 4020 MiB. The values "0" and "max" aren't affected
1306           by this and neither is decompression. This hack can be
1307           helpful when a 32-bit xz has access to 4 GiB address space
1308           but the specified memlimit exceeds 4 GiB. This can happen
1309           e.g. with some scripts.
1311         - Capsicum sandbox is now enabled by default where available
1312           (FreeBSD >= 10). The sandbox debug messages (xz -vv) were
1313           removed since they seemed to be more annoying than useful.
1315         - DOS build now requires DJGPP 2.05 instead of 2.04beta.
1316           A workaround for a locale problem with DJGPP 2.05 was added.
1318     * xzgrep and other scripts:
1320         - Added a configure option --enable-path-for-scripts=PREFIX.
1321           It is disabled by default except on Solaris where the default
1322           is /usr/xpg4/bin. See INSTALL for details.
1324         - Added a workaround for a POSIX shell detection problem on
1325           Solaris.
1327     * Build systems:
1329         - Added preliminary build instructions for z/OS. See INSTALL
1330           section 1.2.9.
1332         - Experimental CMake support was added. It should work to build
1333           static liblzma on a few operating systems. It may or may not
1334           work to build shared liblzma. On some platforms it can build
1335           xz and xzdec too but those are only for testing. See the
1336           comment in the beginning of CMakeLists.txt for details.
1338         - Visual Studio project files were updated.
1339           WindowsTargetPlatformVersion was removed from VS2017 files
1340           and set to "10.0" in the added VS2019 files. In the future
1341           the VS project files will be removed when CMake support is
1342           good enough.
1344         - New #defines in config.h: HAVE___BUILTIN_ASSUME_ALIGNED,
1345           HAVE___BUILTIN_BSWAPXX, and TUKLIB_USE_UNSAFE_TYPE_PUNNING.
1347         - autogen.sh has a new optional dependency on po4a and a new
1348           option --no-po4a to skip that step. This matters only if one
1349           wants to remake the build files. po4a is used to update the
1350           translated man pages but as long as the man pages haven't
1351           been modified, there's nothing to update and one can use
1352           --no-po4a to avoid the dependency on po4a.
1354     * Translations:
1356         - XZ Utils translations are now handled by the Translation
1357           Project: https://translationproject.org/domain/xz.html
1359         - All man pages are now included in German too.
1361         - New xz translations: Brazilian Portuguese, Finnish,
1362           Hungarian, Chinese (simplified), Chinese (traditional),
1363           and Danish (partial translation)
1365         - Updated xz translations: French, German, Italian, and Polish
1367         - Unfortunately a few new xz translations weren't included due
1368           to technical problems like too long lines in --help output or
1369           misaligned column headings in tables. In the future, many of
1370           these strings will be split and e.g. the table column
1371           alignment will be handled in software. This should make the
1372           strings easier to translate.
1375 5.2.4 (2018-04-29)
1377     * liblzma:
1379         - Allow 0 as memory usage limit instead of returning
1380           LZMA_PROG_ERROR. Now 0 is treated as if 1 byte was specified,
1381           which effectively is the same as 0.
1383         - Use "noexcept" keyword instead of "throw()" in the public
1384           headers when a C++11 (or newer standard) compiler is used.
1386         - Added a portability fix for recent Intel C Compilers.
1388         - Microsoft Visual Studio build files have been moved under
1389           windows/vs2013 and windows/vs2017.
1391     * xz:
1393         - Fix "xz --list --robot missing_or_bad_file.xz" which would
1394           try to print an uninitialized string and thus produce garbage
1395           output. Since the exit status is non-zero, most uses of such
1396           a command won't try to interpret the garbage output.
1398         - "xz --list foo.xz" could print "Internal error (bug)" in a
1399           corner case where a specific memory usage limit had been set.
1402 5.2.3 (2016-12-30)
1404     * xz:
1406         - Always close a file before trying to delete it to avoid
1407           problems on some operating system and file system combinations.
1409         - Fixed copying of file timestamps on Windows.
1411         - Added experimental (disabled by default) sandbox support using
1412           Capsicum (FreeBSD >= 10). See --enable-sandbox in INSTALL.
1414     * C99/C11 conformance fixes to liblzma. The issues affected at least
1415       some builds using link-time optimizations.
1417     * Fixed bugs in the rarely-used function lzma_index_dup().
1419     * Use of external SHA-256 code is now disabled by default.
1420       It can still be enabled by passing --enable-external-sha256
1421       to configure. The reasons to disable it by default (see INSTALL
1422       for more details):
1424         - Some OS-specific SHA-256 implementations conflict with
1425           OpenSSL and cause problems in programs that link against both
1426           liblzma and libcrypto. At least FreeBSD 10 and MINIX 3.3.0
1427           are affected.
1429         - The internal SHA-256 is faster than the SHA-256 code in
1430           some operating systems.
1432     * Changed CPU core count detection to use sched_getaffinity() on
1433       GNU/Linux and GNU/kFreeBSD.
1435     * Fixes to the build-system and xz to make xz buildable even when
1436       encoders, decoders, or threading have been disabled from libilzma
1437       using configure options. These fixes added two new #defines to
1438       config.h: HAVE_ENCODERS and HAVE_DECODERS.
1441 5.2.2 (2015-09-29)
1443     * Fixed bugs in QNX-specific code.
1445     * Omitted the use of pipe2() even if it is available to avoid
1446       portability issues with some old Linux and glibc combinations.
1448     * Updated German translation.
1450     * Added project files to build static and shared liblzma (not the
1451       whole XZ Utils) with Visual Studio 2013 update 2 or later.
1453     * Documented that threaded decompression hasn't been implemented
1454       yet. A 5.2.0 NEWS entry describing multi-threading support had
1455       incorrectly said "decompression" when it should have said
1456       "compression".
1459 5.2.1 (2015-02-26)
1461     * Fixed a compression-ratio regression in fast mode of LZMA1 and
1462       LZMA2. The bug is present in 5.1.4beta and 5.2.0 releases.
1464     * Fixed a portability problem in xz that affected at least OpenBSD.
1466     * Fixed xzdiff to be compatible with FreeBSD's mktemp which differs
1467       from most other mktemp implementations.
1469     * Changed CPU core count detection to use cpuset_getaffinity() on
1470       FreeBSD.
1473 5.2.0 (2014-12-21)
1475     Since 5.1.4beta:
1477     * All fixes from 5.0.8
1479     * liblzma: Fixed lzma_stream_encoder_mt_memusage() when a preset
1480       was used.
1482     * xzdiff: If mktemp isn't installed, mkdir will be used as
1483       a fallback to create a temporary directory. Installing mktemp
1484       is still recommended.
1486     * Updated French, German, Italian, Polish, and Vietnamese
1487       translations.
1489     Summary of fixes and new features added in the 5.1.x development
1490     releases:
1492     * liblzma:
1494         - Added support for multi-threaded compression. See the
1495           lzma_mt structure, lzma_stream_encoder_mt(), and
1496           lzma_stream_encoder_mt_memusage() in <lzma/container.h>,
1497           lzma_get_progress() in <lzma/base.h>, and lzma_cputhreads()
1498           in <lzma/hardware.h> for details.
1500         - Made the uses of lzma_allocator const correct.
1502         - Added lzma_block_uncomp_encode() to create uncompressed
1503           .xz Blocks using LZMA2 uncompressed chunks.
1505         - Added support for LZMA_IGNORE_CHECK.
1507         - A few speed optimizations were made.
1509         - Added support for symbol versioning. It is enabled by default
1510           on GNU/Linux, other GNU-based systems, and FreeBSD.
1512         - liblzma (not the whole XZ Utils) should now be buildable
1513           with MSVC 2013 update 2 or later using windows/config.h.
1515     * xz:
1517         - Fixed a race condition in the signal handling. It was
1518           possible that e.g. the first SIGINT didn't make xz exit
1519           if reading or writing blocked and one had bad luck. The fix
1520           is non-trivial, so as of writing it is unknown if it will be
1521           backported to the v5.0 branch.
1523         - Multi-threaded compression can be enabled with the
1524           --threads (-T) option.
1525           [Fixed: This originally said "decompression".]
1527         - New command line options in xz: --single-stream,
1528           --block-size=SIZE, --block-list=SIZES,
1529           --flush-timeout=TIMEOUT, and --ignore-check.
1531         - xz -lvv now shows the minimum xz version that is required to
1532           decompress the file. Currently it is 5.0.0 for all supported
1533           .xz files except files with empty LZMA2 streams require 5.0.2.
1535     * xzdiff and xzgrep now support .lzo files if lzop is installed.
1536       The .tzo suffix is also recognized as a shorthand for .tar.lzo.
1539 5.1.4beta (2014-09-14)
1541     * All fixes from 5.0.6
1543     * liblzma: Fixed the use of presets in threaded encoder
1544       initialization.
1546     * xz --block-list and --block-size can now be used together
1547       in single-threaded mode. Previously the combination only
1548       worked in multi-threaded mode.
1550     * Added support for LZMA_IGNORE_CHECK to liblzma and made it
1551       available in xz as --ignore-check.
1553     * liblzma speed optimizations:
1555         - Initialization of a new LZMA1 or LZMA2 encoder has been
1556           optimized. (The speed of reinitializing an already-allocated
1557           encoder isn't affected.) This helps when compressing many
1558           small buffers with lzma_stream_buffer_encode() and other
1559           similar situations where an already-allocated encoder state
1560           isn't reused. This speed-up is visible in xz too if one
1561           compresses many small files one at a time instead running xz
1562           once and giving all files as command-line arguments.
1564         - Buffer comparisons are now much faster when unaligned access
1565           is allowed (configured with --enable-unaligned-access). This
1566           speeds up encoding significantly. There is arch-specific code
1567           for 32-bit and 64-bit x86 (32-bit needs SSE2 for the best
1568           results and there's no run-time CPU detection for now).
1569           For other archs there is only generic code which probably
1570           isn't as optimal as arch-specific solutions could be.
1572         - A few speed optimizations were made to the SHA-256 code.
1573           (Note that the builtin SHA-256 code isn't used on all
1574           operating systems.)
1576     * liblzma can now be built with MSVC 2013 update 2 or later
1577       using windows/config.h.
1579     * Vietnamese translation was added.
1582 5.1.3alpha (2013-10-26)
1584     * All fixes from 5.0.5
1586     * liblzma:
1588         - Fixed a deadlock in the threaded encoder.
1590         - Made the uses of lzma_allocator const correct.
1592         - Added lzma_block_uncomp_encode() to create uncompressed
1593           .xz Blocks using LZMA2 uncompressed chunks.
1595         - Added support for native threads on Windows and the ability
1596           to detect the number of CPU cores.
1598     * xz:
1600         - Fixed a race condition in the signal handling. It was
1601           possible that e.g. the first SIGINT didn't make xz exit
1602           if reading or writing blocked and one had bad luck. The fix
1603           is non-trivial, so as of writing it is unknown if it will be
1604           backported to the v5.0 branch.
1606         - Made the progress indicator work correctly in threaded mode.
1608         - Threaded encoder now works together with --block-list=SIZES.
1610         - Added preliminary support for --flush-timeout=TIMEOUT.
1611           It can be useful for (somewhat) real-time streaming. For
1612           now the decompression side has to be done with something
1613           else than the xz tool due to how xz does buffering, but this
1614           should be fixed.
1617 5.1.2alpha (2012-07-04)
1619     * All fixes from 5.0.3 and 5.0.4
1621     * liblzma:
1623         - Fixed a deadlock and an invalid free() in the threaded encoder.
1625         - Added support for symbol versioning. It is enabled by default
1626           on GNU/Linux, other GNU-based systems, and FreeBSD.
1628         - Use SHA-256 implementation from the operating system if one is
1629           available in libc, libmd, or libutil. liblzma won't use e.g.
1630           OpenSSL or libgcrypt to avoid introducing new dependencies.
1632         - Fixed liblzma.pc for static linking.
1634         - Fixed a few portability bugs.
1636     * xz --decompress --single-stream now fixes the input position after
1637       successful decompression. Now the following works:
1639           echo foo | xz > foo.xz
1640           echo bar | xz >> foo.xz
1641           ( xz -dc --single-stream ; xz -dc --single-stream ) < foo.xz
1643       Note that it doesn't work if the input is not seekable
1644       or if there is Stream Padding between the concatenated
1645       .xz Streams.
1647     * xz -lvv now shows the minimum xz version that is required to
1648       decompress the file. Currently it is 5.0.0 for all supported .xz
1649       files except files with empty LZMA2 streams require 5.0.2.
1651     * Added an *incomplete* implementation of --block-list=SIZES to xz.
1652       It only works correctly in single-threaded mode and when
1653       --block-size isn't used at the same time. --block-list allows
1654       specifying the sizes of Blocks which can be useful e.g. when
1655       creating files for random-access reading.
1658 5.1.1alpha (2011-04-12)
1660     * All fixes from 5.0.2
1662     * liblzma fixes that will also be included in 5.0.3:
1664         - A memory leak was fixed.
1666         - lzma_stream_buffer_encode() no longer creates an empty .xz
1667           Block if encoding an empty buffer. Such an empty Block with
1668           LZMA2 data would trigger a bug in 5.0.1 and older (see the
1669           first bullet point in 5.0.2 notes). When releasing 5.0.2,
1670           I thought that no encoder creates this kind of files but
1671           I was wrong.
1673         - Validate function arguments better in a few functions. Most
1674           importantly, specifying an unsupported integrity check to
1675           lzma_stream_buffer_encode() no longer creates a corrupt .xz
1676           file. Probably no application tries to do that, so this
1677           shouldn't be a big problem in practice.
1679         - Document that lzma_block_buffer_encode(),
1680           lzma_easy_buffer_encode(), lzma_stream_encoder(), and
1681           lzma_stream_buffer_encode() may return LZMA_UNSUPPORTED_CHECK.
1683         - The return values of the _memusage() functions are now
1684           documented better.
1686     * Support for multithreaded compression was added using the simplest
1687       method, which splits the input data into blocks and compresses
1688       them independently. Other methods will be added in the future.
1689       The current method has room for improvement, e.g. it is possible
1690       to reduce the memory usage.
1692     * Added the options --single-stream and --block-size=SIZE to xz.
1694     * xzdiff and xzgrep now support .lzo files if lzop is installed.
1695       The .tzo suffix is also recognized as a shorthand for .tar.lzo.
1697     * Support for short 8.3 filenames under DOS was added to xz. It is
1698       experimental and may change before it gets into a stable release.
1701 5.0.8 (2014-12-21)
1703     * Fixed an old bug in xzgrep that affected OpenBSD and probably
1704       a few other operating systems too.
1706     * Updated French and German translations.
1708     * Added support for detecting the amount of RAM on AmigaOS/AROS.
1710     * Minor build system updates.
1713 5.0.7 (2014-09-20)
1715     * Fix regressions introduced in 5.0.6:
1717         - Fix building with non-GNU make.
1719         - Fix invalid Libs.private value in liblzma.pc which broke
1720           static linking against liblzma if the linker flags were
1721           taken from pkg-config.
1724 5.0.6 (2014-09-14)
1726     * xzgrep now exits with status 0 if at least one file matched.
1728     * A few minor portability and build system fixes
1731 5.0.5 (2013-06-30)
1733     * lzmadec and liblzma's lzma_alone_decoder(): Support decompressing
1734       .lzma files that have less common settings in the headers
1735       (dictionary size other than 2^n or 2^n + 2^(n-1), or uncompressed
1736       size greater than 256 GiB). The limitations existed to avoid false
1737       positives when detecting .lzma files. The lc + lp <= 4 limitation
1738       still remains since liblzma's LZMA decoder has that limitation.
1740       NOTE: xz's .lzma support or liblzma's lzma_auto_decoder() are NOT
1741       affected by this change. They still consider uncommon .lzma headers
1742       as not being in the .lzma format. Changing this would give way too
1743       many false positives.
1745     * xz:
1747         - Interaction of preset and custom filter chain options was
1748           made less illogical. This affects only certain less typical
1749           uses cases so few people are expected to notice this change.
1751           Now when a custom filter chain option (e.g. --lzma2) is
1752           specified, all preset options (-0 ... -9, -e) earlier are on
1753           the command line are completely forgotten. Similarly, when
1754           a preset option is specified, all custom filter chain options
1755           earlier on the command line are completely forgotten.
1757           Example 1: "xz -9 --lzma2=preset=5 -e" is equivalent to "xz -e"
1758           which is equivalent to "xz -6e". Earlier -e didn't put xz back
1759           into preset mode and thus the example command was equivalent
1760           to "xz --lzma2=preset=5".
1762           Example 2: "xz -9e --lzma2=preset=5 -7" is equivalent to
1763           "xz -7". Earlier a custom filter chain option didn't make
1764           xz forget the -e option so the example was equivalent to
1765           "xz -7e".
1767         - Fixes and improvements to error handling.
1769         - Various fixes to the man page.
1771     * xzless: Fixed to work with "less" versions 448 and later.
1773     * xzgrep: Made -h an alias for --no-filename.
1775     * Include the previously missing debug/translation.bash which can
1776       be useful for translators.
1778     * Include a build script for Mac OS X. This has been in the Git
1779       repository since 2010 but due to a mistake in Makefile.am the
1780       script hasn't been included in a release tarball before.
1783 5.0.4 (2012-06-22)
1785     * liblzma:
1787         - Fix lzma_index_init(). It could crash if memory allocation
1788           failed.
1790         - Fix the possibility of an incorrect LZMA_BUF_ERROR when a BCJ
1791           filter is used and the application only provides exactly as
1792           much output space as is the uncompressed size of the file.
1794         - Fix a bug in doc/examples_old/xz_pipe_decompress.c. It didn't
1795           check if the last call to lzma_code() really returned
1796           LZMA_STREAM_END, which made the program think that truncated
1797           files are valid.
1799         - New example programs in doc/examples (old programs are now in
1800           doc/examples_old). These have more comments and more detailed
1801           error handling.
1803     * Fix "xz -lvv foo.xz". It could crash on some corrupted files.
1805     * Fix output of "xz --robot -lv" and "xz --robot -lvv" which
1806       incorrectly printed the filename also in the "foo (x/x)" format.
1808     * Fix exit status of "xzdiff foo.xz bar.xz".
1810     * Fix exit status of "xzgrep foo binary_file".
1812     * Fix portability to EBCDIC systems.
1814     * Fix a configure issue on AIX with the XL C compiler. See INSTALL
1815       for details.
1817     * Update French, German, Italian, and Polish translations.
1820 5.0.3 (2011-05-21)
1822     * liblzma fixes:
1824         - A memory leak was fixed.
1826         - lzma_stream_buffer_encode() no longer creates an empty .xz
1827           Block if encoding an empty buffer. Such an empty Block with
1828           LZMA2 data would trigger a bug in 5.0.1 and older (see the
1829           first bullet point in 5.0.2 notes). When releasing 5.0.2,
1830           I thought that no encoder creates this kind of files but
1831           I was wrong.
1833         - Validate function arguments better in a few functions. Most
1834           importantly, specifying an unsupported integrity check to
1835           lzma_stream_buffer_encode() no longer creates a corrupt .xz
1836           file. Probably no application tries to do that, so this
1837           shouldn't be a big problem in practice.
1839         - Document that lzma_block_buffer_encode(),
1840           lzma_easy_buffer_encode(), lzma_stream_encoder(), and
1841           lzma_stream_buffer_encode() may return LZMA_UNSUPPORTED_CHECK.
1843         - The return values of the _memusage() functions are now
1844           documented better.
1846     * Fix command name detection in xzgrep. xzegrep and xzfgrep now
1847       correctly use egrep and fgrep instead of grep.
1849     * French translation was added.
1852 5.0.2 (2011-04-01)
1854     * LZMA2 decompressor now correctly accepts LZMA2 streams with no
1855       uncompressed data. Previously it considered them corrupt. The
1856       bug can affect applications that use raw LZMA2 streams. It is
1857       very unlikely to affect .xz files because no compressor creates
1858       .xz files with empty LZMA2 streams. (Empty .xz files are a
1859       different thing than empty LZMA2 streams.)
1861     * "xz --suffix=.foo filename.foo" now refuses to compress the
1862       file due to it already having the suffix .foo. It was already
1863       documented on the man page, but the code lacked the test.
1865     * "xzgrep -l foo bar.xz" works now.
1867     * Polish translation was added.
1870 5.0.1 (2011-01-29)
1872     * xz --force now (de)compresses files that have setuid, setgid,
1873       or sticky bit set and files that have multiple hard links.
1874       The man page had it documented this way already, but the code
1875       had a bug.
1877     * gzip and bzip2 support in xzdiff was fixed.
1879     * Portability fixes
1881     * Minor fix to Czech translation
1884 5.0.0 (2010-10-23)
1886     Only the most important changes compared to 4.999.9beta are listed
1887     here. One change is especially important:
1889       * The memory usage limit is now disabled by default. Some scripts
1890         written before this change may have used --memory=max on xz command
1891         line or in XZ_OPT. THESE USES OF --memory=max SHOULD BE REMOVED
1892         NOW, because they interfere with user's ability to set the memory
1893         usage limit himself. If user-specified limit causes problems to
1894         your script, blame the user.
1896     Other significant changes:
1898       * Added support for XZ_DEFAULTS environment variable. This variable
1899         allows users to set default options for xz, e.g. default memory
1900         usage limit or default compression level. Scripts that use xz
1901         must never set or unset XZ_DEFAULTS. Scripts should use XZ_OPT
1902         instead if they need a way to pass options to xz via an
1903         environment variable.
1905       * The compression settings associated with the preset levels
1906         -0 ... -9 have been changed. --extreme was changed a little too.
1907         It is now less likely to make compression worse, but with some
1908         files the new --extreme may compress slightly worse than the old
1909         --extreme.
1911       * If a preset level (-0 ... -9) is specified after a custom filter
1912         chain options have been used (e.g. --lzma2), the custom filter
1913         chain will be forgotten. Earlier the preset options were
1914         completely ignored after custom filter chain options had been
1915         seen.
1917       * xz will create sparse files when decompressing if the uncompressed
1918         data contains long sequences of binary zeros. This is done even
1919         when writing to standard output that is connected to a regular
1920         file and certain additional conditions are met to make it safe.
1922       * Support for "xz --list" was added. Combine with --verbose or
1923         --verbose --verbose (-vv) for detailed output.
1925       * I had hoped that liblzma API would have been stable after
1926         4.999.9beta, but there have been a couple of changes in the
1927         advanced features, which don't affect most applications:
1929           - Index handling code was revised. If you were using the old
1930             API, you will get a compiler error (so it's easy to notice).
1932           - A subtle but important change was made to the Block handling
1933             API. lzma_block.version has to be initialized even for
1934             lzma_block_header_decode(). Code that doesn't do it will work
1935             for now, but might break in the future, which makes this API
1936             change easy to miss.
1938       * The major soname has been bumped to 5.0.0. liblzma API and ABI
1939         are now stable, so the need to recompile programs linking against
1940         liblzma shouldn't arise soon.