liblzma: Add RISC-V BCJ filter.
[xz.git] / NEWS
blob824f58537ea8708f94c7601372c22bcbc61b41ef
2 XZ Utils Release Notes
3 ======================
5 5.4.5 (2023-11-31)
7     * liblzma:
9         - Use __attribute__((__no_sanitize_address__)) to avoid address
10           sanitization with CRC64 CLMUL. It uses 16-byte-aligned reads
11           which can extend past the bounds of the input buffer and
12           inherently trigger address sanitization errors. This isn't
13           a bug.
15         - Fixed an assertion failure that could be triggered by a large
16           unpadded_size argument. It was verified that there was no
17           other bug than the assertion failure.
19         - Fixed a bug that prevented building with Windows Vista
20           threading when __attribute__((__constructor__)) is not
21           supported.
23     * xz now properly handles special files such as "con" or "nul" on
24       Windows. Before this fix, the following wrote "foo" to the
25       console and deleted the input file "con_xz":
27           echo foo | xz > con_xz
28           xz --suffix=_xz --decompress con_xz
30     * Build systems:
32         - Allow builds with Windows win95 threading and small mode when
33           __attribute__((__constructor__)) is supported.
35         - Added a new line to liblzma.pc for MSYS2 (Windows):
37               Cflags.private: -DLZMA_API_STATIC
39           When compiling code that will link against static liblzma,
40           the LZMA_API_STATIC macro needs to be defined on Windows.
42         - CMake specific changes:
44             * Fixed a bug that allowed CLOCK_MONOTONIC to be used even
45               if the check for it failed.
47             * Fixed a bug where configuring CMake multiple times
48               resulted in HAVE_CLOCK_GETTIME and HAVE_CLOCK_MONOTONIC
49               not being set.
51             * Fixed the build with MinGW-w64-based Clang/LLVM 17.
52               llvm-windres now has more accurate GNU windres emulation
53               so the GNU windres workaround from 5.4.1 is needed with
54               llvm-windres version 17 too.
56             * The import library on Windows is now properly named
57               "liblzma.dll.a" instead of "libliblzma.dll.a"
59             * Fixed a bug causing the Ninja Generator to fail on
60               UNIX-like systems. This bug was introduced in 5.4.0.
62             * Added a new option to disable CLMUL CRC64.
64             * A module-definition (.def) file is now created when
65               building liblzma.dll with MinGW-w64.
67             * The pkg-config liblzma.pc file is now installed on all
68               builds except when using MSVC on Windows.
70             * Added large file support by default for platforms that
71               need it to handle files larger than 2 GiB. This includes
72               MinGW-w64, even 64-bit builds.
74     * Small fixes and improvements to the tests.
76     * Updated translations: Chinese (simplified) and Esperanto.
79 5.4.4 (2023-08-02)
81     * liblzma and xzdec can now build against WASI SDK when threading
82       support is disabled. xz and tests don't build yet.
84     * CMake:
86         - Fixed a bug preventing other projects from including liblzma
87           multiple times using find_package().
89         - Don't create broken symlinks in Cygwin and MSYS2 unless
90           supported by the environment. This prevented building for the
91           default MSYS2 environment. The problem was introduced in
92           xz 5.4.0.
94     * Documentation:
96         - Small improvements to man pages.
98         - Small improvements and typo fixes for liblzma API
99           documentation.
101     * Tests:
103         - Added a new section to INSTALL to describe basic test usage
104           and address recent questions about building the tests when
105           cross compiling.
107         - Small fixes and improvements to the tests.
109     * Translations:
111         - Fixed a mistake that caused one of the error messages to not
112           be translated. This only affected versions 5.4.2 and 5.4.3.
114         - Updated the Chinese (simplified), Croatian, Esperanto, German,
115           Korean, Polish, Romanian, Spanish, Swedish, Ukrainian, and
116           Vietnamese translations.
118         - Updated the German, Korean, Romanian, and Ukrainian man page
119           translations.
122 5.4.3 (2023-05-04)
124     * All fixes from 5.2.12
126     * Features in the CMake build can now be disabled as CMake cache
127       variables, similar to the Autotools build.
129     * Minor update to the Croatian translation.
132 5.4.2 (2023-03-18)
134     * All fixes from 5.2.11 that were not included in 5.4.1.
136     * If xz is built with support for the Capsicum sandbox but running
137       in an environment that doesn't support Capsicum, xz now runs
138       normally without sandboxing instead of exiting with an error.
140     * liblzma:
142         - Documentation was updated to improve the style, consistency,
143           and completeness of the liblzma API headers.
145         - The Doxygen-generated HTML documentation for the liblzma API
146           header files is now included in the source release and is
147           installed as part of "make install". All JavaScript is
148           removed to simplify license compliance and to reduce the
149           install size.
151         - Fixed a minor bug in lzma_str_from_filters() that produced
152           too many filters in the output string instead of reporting
153           an error if the input array had more than four filters. This
154           bug did not affect xz.
156     * Build systems:
158         - autogen.sh now invokes the doxygen tool via the new wrapper
159           script doxygen/update-doxygen, unless the command line option
160           --no-doxygen is used.
162         - Added microlzma_encoder.c and microlzma_decoder.c to the
163           VS project files for Windows and to the CMake build. These
164           should have been included in 5.3.2alpha.
166     * Tests:
168         - Added a test to the CMake build that was forgotten in the
169           previous release.
171         - Added and refactored a few tests.
173     * Translations:
175         - Updated the Brazilian Portuguese translation.
177         - Added Brazilian Portuguese man page translation.
180 5.4.1 (2023-01-11)
182     * liblzma:
184         - Fixed the return value of lzma_microlzma_encoder() if the
185           LZMA options lc/lp/pb are invalid. Invalid lc/lp/pb options
186           made the function return LZMA_STREAM_END without encoding
187           anything instead of returning LZMA_OPTIONS_ERROR.
189         - Windows / Visual Studio: Workaround a possible compiler bug
190           when targeting 32-bit x86 and compiling the CLMUL version of
191           the CRC64 code. The CLMUL code isn't enabled by the Windows
192           project files but it is in the CMake-based builds.
194     * Build systems:
196         - Windows-specific CMake changes:
198             * Don't try to enable CLMUL CRC64 code if _mm_set_epi64x()
199               isn't available. This fixes CMake-based build with Visual
200               Studio 2013.
202             * Created a workaround for a build failure with windres
203               from GNU binutils. It is used only when the C compiler
204               is GCC (not Clang). The workaround is incompatible
205               with llvm-windres, resulting in "XZx20Utils" instead
206               of "XZ Utils" in the resource file, but without the
207               workaround llvm-windres works correctly. See the
208               comment in CMakeLists.txt for details.
210             * Included the resource files in the xz and xzdec build
211               rules. Building the command line tools is still
212               experimental but possible with MinGW-w64.
214         - Visual Studio: Added stream_decoder_mt.c to the project
215           files. Now the threaded decompressor lzma_stream_decoder_mt()
216           gets built. CMake-based build wasn't affected.
218         - Updated windows/INSTALL-MSVC.txt to mention that CMake-based
219           build is now the preferred method with Visual Studio. The
220           project files will probably be removed after 5.4.x releases.
222         - Changes to #defines in config.h:
224             * HAVE_DECL_CLOCK_MONOTONIC was replaced by
225               HAVE_CLOCK_MONOTONIC. The old macro was always defined
226               in configure-generated config.h to either 0 or 1. The
227               new macro is defined (to 1) only if the declaration of
228               CLOCK_MONOTONIC is available. This matches the way most
229               other config.h macros work and makes things simpler with
230               other build systems.
232             * HAVE_DECL_PROGRAM_INVOCATION_NAME was replaced by
233               HAVE_PROGRAM_INVOCATION_NAME for the same reason.
235     * Tests:
237         - Fixed test script compatibility with ancient /bin/sh
238           versions. Now the five test_compress_* tests should
239           no longer fail on Solaris 10.
241         - Added and refactored a few tests.
243     * Translations:
245         - Updated the Catalan and Esperanto translations.
247         - Added Korean and Ukrainian man page translations.
250 5.4.0 (2022-12-13)
252     This bumps the minor version of liblzma because new features were
253     added. The API and ABI are still backward compatible with liblzma
254     5.2.x and 5.0.x.
256     Since 5.3.5beta:
258     * All fixes from 5.2.10.
260     * The ARM64 filter is now stable. The xz option is now --arm64.
261       Decompression requires XZ Utils 5.4.0. In the future the ARM64
262       filter will be supported by XZ for Java, XZ Embedded (including
263       the version in Linux), LZMA SDK, and 7-Zip.
265     * Translations:
267         - Updated Catalan, Croatian, German, Romanian, and Turkish
268           translations.
270         - Updated German man page translations.
272         - Added Romanian man page translations.
274     Summary of new features added in the 5.3.x development releases:
276     * liblzma:
278         - Added threaded .xz decompressor lzma_stream_decoder_mt().
279           It can use multiple threads with .xz files that have multiple
280           Blocks with size information in Block Headers. The threaded
281           encoder in xz has always created such files.
283           Single-threaded encoder cannot store the size information in
284           Block Headers even if one used LZMA_FULL_FLUSH to create
285           multiple Blocks, so this threaded decoder cannot use multiple
286           threads with such files.
288           If there are multiple Streams (concatenated .xz files), one
289           Stream will be decompressed completely before starting the
290           next Stream.
292         - A new decoder flag LZMA_FAIL_FAST was added. It makes the
293           threaded decompressor report errors soon instead of first
294           flushing all pending data before the error location.
296         - New Filter IDs:
297             * LZMA_FILTER_ARM64 is for ARM64 binaries.
298             * LZMA_FILTER_LZMA1EXT is for raw LZMA1 streams that don't
299               necessarily use the end marker.
301         - Added lzma_str_to_filters(), lzma_str_from_filters(), and
302           lzma_str_list_filters() to convert a preset or a filter chain
303           string to a lzma_filter[] and vice versa. These should make
304           it easier to write applications that allow users to specify
305           custom compression options.
307         - Added lzma_filters_free() which can be convenient for freeing
308           the filter options in a filter chain (an array of lzma_filter
309           structures).
311         - lzma_file_info_decoder() to makes it a little easier to get
312           the Index field from .xz files. This helps in getting the
313           uncompressed file size but an easy-to-use random access
314           API is still missing which has existed in XZ for Java for
315           a long time.
317         - Added lzma_microlzma_encoder() and lzma_microlzma_decoder().
318           It is used by erofs-utils and may be used by others too.
320           The MicroLZMA format is a raw LZMA stream (without end marker)
321           whose first byte (always 0x00) has been replaced with
322           bitwise-negation of the LZMA properties (lc/lp/pb). It was
323           created for use in EROFS but may be used in other contexts
324           as well where it is important to avoid wasting bytes for
325           stream headers or footers. The format is also supported by
326           XZ Embedded (the XZ Embedded version in Linux got MicroLZMA
327           support in Linux 5.16).
329           The MicroLZMA encoder API in liblzma can compress into a
330           fixed-sized output buffer so that as much data is compressed
331           as can be fit into the buffer while still creating a valid
332           MicroLZMA stream. This is needed for EROFS.
334         - Added lzma_lzip_decoder() to decompress the .lz (lzip) file
335           format version 0 and the original unextended version 1 files.
336           Also lzma_auto_decoder() supports .lz files.
338         - lzma_filters_update() can now be used with the multi-threaded
339           encoder (lzma_stream_encoder_mt()) to change the filter chain
340           after LZMA_FULL_BARRIER or LZMA_FULL_FLUSH.
342         - In lzma_options_lzma, allow nice_len = 2 and 3 with the match
343           finders that require at least 3 or 4. Now it is internally
344           rounded up if needed.
346         - CLMUL-based CRC64 on x86-64 and E2K with runtime processor
347           detection. On 32-bit x86 it currently isn't available unless
348           --disable-assembler is used which can make the non-CLMUL
349           CRC64 slower; this might be fixed in the future.
351         - Building with --disable-threads --enable-small
352           is now thread-safe if the compiler supports
353           __attribute__((__constructor__)).
355     * xz:
357         - Using -T0 (--threads=0) will now use multi-threaded encoder
358           even on a single-core system. This is to ensure that output
359           from the same xz binary is identical on both single-core and
360           multi-core systems.
362         - --threads=+1 or -T+1 is now a way to put xz into
363           multi-threaded mode while using only one worker thread.
364           The + is ignored if the number is not 1.
366         - A default soft memory usage limit is now used for compression
367           when -T0 is used and no explicit limit has been specified.
368           This soft limit is used to restrict the number of threads
369           but if the limit is exceeded with even one thread then xz
370           will continue with one thread using the multi-threaded
371           encoder and this limit is ignored. If the number of threads
372           is specified manually then no default limit will be used;
373           this affects only -T0.
375           This change helps on systems that have very many cores and
376           using all of them for xz makes no sense. Previously xz -T0
377           could run out of memory on such systems because it attempted
378           to reserve memory for too many threads.
380           This also helps with 32-bit builds which don't have a large
381           amount of address space that would be required for many
382           threads. The default soft limit for -T0 is at most 1400 MiB
383           on all 32-bit platforms.
385         - Previously a low value in --memlimit-compress wouldn't cause
386           xz to switch from multi-threaded mode to single-threaded mode
387           if the limit cannot otherwise be met; xz failed instead. Now
388           xz can switch to single-threaded mode and then, if needed,
389           scale down the LZMA2 dictionary size too just like it already
390           did when it was started in single-threaded mode.
392         - The option --no-adjust no longer prevents xz from scaling down
393           the number of threads as that doesn't affect the compressed
394           output (only performance). Now --no-adjust only prevents
395           adjustments that affect compressed output, that is, with
396           --no-adjust xz won't switch from multi-threaded mode to
397           single-threaded mode and won't scale down the LZMA2
398           dictionary size.
400         - Added a new option --memlimit-mt-decompress=LIMIT. This is
401           used to limit the number of decompressor threads (possibly
402           falling back to single-threaded mode) but it will never make
403           xz refuse to decompress a file. This has a system-specific
404           default value because without any limit xz could end up
405           allocating memory for the whole compressed input file, the
406           whole uncompressed output file, multiple thread-specific
407           decompressor instances and so on. Basically xz could
408           attempt to use an insane amount of memory even with fairly
409           common files. The system-specific default value is currently
410           the same as the one used for compression with -T0.
412           The new option works together with the existing option
413           --memlimit-decompress=LIMIT. The old option sets a hard limit
414           that must not be exceeded (xz will refuse to decompress)
415           while the new option only restricts the number of threads.
416           If the limit set with --memlimit-mt-decompress is greater
417           than the limit set with --memlimit-compress, then the latter
418           value is used also for --memlimit-mt-decompress.
420         - Added new information to the output of xz --info-memory and
421           new fields to the output of xz --robot --info-memory.
423         - In --lzma2=nice=NUMBER allow 2 and 3 with all match finders
424           now that liblzma handles it.
426         - Don't mention endianness for ARM and ARM-Thumb filters in
427           --long-help. The filters only work for little endian
428           instruction encoding but modern ARM processors using
429           big endian data access still use little endian
430           instruction encoding. So the help text was misleading.
431           In contrast, the PowerPC filter is only for big endian
432           32/64-bit PowerPC code. Little endian PowerPC would need
433           a separate filter.
435         - Added decompression support for the .lz (lzip) file format
436           version 0 and the original unextended version 1. It is
437           autodetected by default. See also the option --format on
438           the xz man page.
440         - Sandboxing enabled by default:
441             * Capsicum (FreeBSD)
442             * pledge(2) (OpenBSD)
444     * Scripts now support the .lz format using xz.
446     * A few new tests were added.
448     * The liblzma-specific tests are now supported in CMake-based
449       builds too ("make test").
452 5.3.5beta (2022-12-01)
454     * All fixes from 5.2.9.
456     * liblzma:
458         - Added new LZMA_FILTER_LZMA1EXT for raw encoder and decoder to
459           handle raw LZMA1 streams that don't have end of payload marker
460           (EOPM) alias end of stream (EOS) marker. It can be used in
461           filter chains, for example, with the x86 BCJ filter.
463         - Added lzma_str_to_filters(), lzma_str_from_filters(), and
464           lzma_str_list_filters() to make it easier for applications
465           to get custom compression options from a user and convert
466           it to an array of lzma_filter structures.
468         - Added lzma_filters_free().
470         - lzma_filters_update() can now be used with the multi-threaded
471           encoder (lzma_stream_encoder_mt()) to change the filter chain
472           after LZMA_FULL_BARRIER or LZMA_FULL_FLUSH.
474         - In lzma_options_lzma, allow nice_len = 2 and 3 with the match
475           finders that require at least 3 or 4. Now it is internally
476           rounded up if needed.
478         - ARM64 filter was modified. It is still experimental.
480         - Fixed LTO build with Clang if -fgnuc-version=10 or similar
481           was used to make Clang look like GCC >= 10. Now it uses
482           __has_attribute(__symver__) which should be reliable.
484     * xz:
486         - --threads=+1 or -T+1 is now a way to put xz into multi-threaded
487           mode while using only one worker thread.
489         - In --lzma2=nice=NUMBER allow 2 and 3 with all match finders
490           now that liblzma handles it.
492     * Updated translations: Chinese (simplified), Korean, and Turkish.
495 5.3.4alpha (2022-11-15)
497     * All fixes from 5.2.7 and 5.2.8.
499     * liblzma:
501         - Minor improvements to the threaded decoder.
503         - Added CRC64 implementation that uses SSSE3, SSE4.1, and CLMUL
504           instructions on 32/64-bit x86 and E2K. On 32-bit x86 it's
505           not enabled unless --disable-assembler is used but then
506           the non-CLMUL code might be slower. Processor support is
507           detected at runtime so this is built by default on x86-64
508           and E2K. On these platforms, if compiler flags indicate
509           unconditional CLMUL support (-msse4.1 -mpclmul) then the
510           generic version is not built, making liblzma 8-9 KiB smaller
511           compared to having both versions included.
513           With extremely compressible files this can make decompression
514           up to twice as fast but with typical files 5 % improvement
515           is a more realistic expectation.
517           The CLMUL version is slower than the generic version with
518           tiny inputs (especially at 1-8 bytes per call, but up to
519           16 bytes). In normal use in xz this doesn't matter at all.
521         - Added an experimental ARM64 filter. This is *not* the final
522           version! Files created with this experimental version won't
523           be supported in the future versions! The filter design is
524           a compromise where improving one use case makes some other
525           cases worse.
527         - Added decompression support for the .lz (lzip) file format
528           version 0 and the original unextended version 1. See the
529           API docs of lzma_lzip_decoder() for details. Also
530           lzma_auto_decoder() supports .lz files.
532         - Building with --disable-threads --enable-small
533           is now thread-safe if the compiler supports
534           __attribute__((__constructor__))
536     * xz:
538         - Added support for OpenBSD's pledge(2) as a sandboxing method.
540         - Don't mention endianness for ARM and ARM-Thumb filters in
541           --long-help. The filters only work for little endian
542           instruction encoding but modern ARM processors using
543           big endian data access still use little endian
544           instruction encoding. So the help text was misleading.
545           In contrast, the PowerPC filter is only for big endian
546           32/64-bit PowerPC code. Little endian PowerPC would need
547           a separate filter.
549         - Added --experimental-arm64. This will be renamed once the
550           filter is finished. Files created with this experimental
551           filter will not be supported in the future!
553         - Added new fields to the output of xz --robot --info-memory.
555         - Added decompression support for the .lz (lzip) file format
556           version 0 and the original unextended version 1. It is
557           autodetected by default. See also the option --format on
558           the xz man page.
560     * Scripts now support the .lz format using xz.
562     * Build systems:
564         - New #defines in config.h: HAVE_ENCODER_ARM64,
565           HAVE_DECODER_ARM64, HAVE_LZIP_DECODER, HAVE_CPUID_H,
566           HAVE_FUNC_ATTRIBUTE_CONSTRUCTOR, HAVE_USABLE_CLMUL
568         - New configure options: --disable-clmul-crc,
569           --disable-microlzma, --disable-lzip-decoder, and
570           'pledge' is now an option in --enable-sandbox (but
571           it's autodetected by default anyway).
573         - INSTALL was updated to document the new configure options.
575         - PACKAGERS now lists also --disable-microlzma and
576           --disable-lzip-decoder as configure options that must
577           not be used in builds for non-embedded use.
579     * Tests:
581         - Fix some of the tests so that they skip instead of fail if
582           certain features have been disabled with configure options.
583           It's still not perfect.
585         - Other improvements to tests.
587     * Updated translations: Croatian, Finnish, Hungarian, Polish,
588       Romanian, Spanish, Swedish, and Ukrainian.
591 5.3.3alpha (2022-08-22)
593     * All fixes from 5.2.6.
595     * liblzma:
597         - Fixed 32-bit build.
599         - Added threaded .xz decompressor lzma_stream_decoder_mt().
600           It can use multiple threads with .xz files that have multiple
601           Blocks with size information in Block Headers. The threaded
602           encoder in xz has always created such files.
604           Single-threaded encoder cannot store the size information in
605           Block Headers even if one used LZMA_FULL_FLUSH to create
606           multiple Blocks, so this threaded decoder cannot use multiple
607           threads with such files.
609           If there are multiple Streams (concatenated .xz files), one
610           Stream will be decompressed completely before starting the
611           next Stream.
613         - A new decoder flag LZMA_FAIL_FAST was added. It makes the
614           threaded decompressor report errors soon instead of first
615           flushing all pending data before the error location.
617     * xz:
619         - Using -T0 (--threads=0) will now use multi-threaded encoder
620           even on a single-core system. This is to ensure that output
621           from the same xz binary is identical on both single-core and
622           multi-core systems.
624         - A default soft memory usage limit is now used for compression
625           when -T0 is used and no explicit limit has been specified.
626           This soft limit is used to restrict the number of threads
627           but if the limit is exceeded with even one thread then xz
628           will continue with one thread using the multi-threaded
629           encoder and this limit is ignored. If the number of threads
630           is specified manually then no default limit will be used;
631           this affects only -T0.
633           This change helps on systems that have very many cores and
634           using all of them for xz makes no sense. Previously xz -T0
635           could run out of memory on such systems because it attempted
636           to reserve memory for too many threads.
638           This also helps with 32-bit builds which don't have a large
639           amount of address space that would be required for many
640           threads. The default limit is 1400 MiB on all 32-bit
641           platforms with -T0.
643           Now xz -T0 should just work. It might use too few threads
644           in some cases but at least it shouldn't easily run out of
645           memory. It's possible that this will be tweaked before 5.4.0.
647         - Changes to --memlimit-compress and --no-adjust:
649           In single-threaded mode, --memlimit-compress can make xz
650           scale down the LZMA2 dictionary size to meet the memory usage
651           limit. This obviously affects the compressed output. However,
652           if xz was in threaded mode, --memlimit-compress could make xz
653           reduce the number of threads but it wouldn't make xz switch
654           from multi-threaded mode to single-threaded mode or scale
655           down the LZMA2 dictionary size. This seemed illogical.
657           Now --memlimit-compress can make xz switch to single-threaded
658           mode if one thread in multi-threaded mode uses too much
659           memory. If memory usage is still too high, then the LZMA2
660           dictionary size can be scaled down too.
662           The option --no-adjust was also changed so that it no longer
663           prevents xz from scaling down the number of threads as that
664           doesn't affect compressed output (only performance). After
665           this commit --no-adjust only prevents adjustments that affect
666           compressed output, that is, with --no-adjust xz won't switch
667           from multithreaded mode to single-threaded mode and won't
668           scale down the LZMA2 dictionary size.
670         - Added a new option --memlimit-mt-decompress=LIMIT. This is
671           used to limit the number of decompressor threads (possibly
672           falling back to single-threaded mode) but it will never make
673           xz refuse to decompress a file. This has a system-specific
674           default value because without any limit xz could end up
675           allocating memory for the whole compressed input file, the
676           whole uncompressed output file, multiple thread-specific
677           decompressor instances and so on. Basically xz could
678           attempt to use an insane amount of memory even with fairly
679           common files.
681           The new option works together with the existing option
682           --memlimit-decompress=LIMIT. The old option sets a hard limit
683           that must not be exceeded (xz will refuse to decompress)
684           while the new option only restricts the number of threads.
685           If the limit set with --memlimit-mt-decompress is greater
686           than the limit set with --memlimit-compress, then the latter
687           value is used also for --memlimit-mt-decompress.
689     * Tests:
691         - Added a few more tests.
693         - Added tests/code_coverage.sh to create a code coverage report
694           of the tests.
696     * Build systems:
698         - Automake's parallel test harness is now used to make tests
699           finish faster.
701         - Added the CMake files to the distribution tarball. These were
702           supposed to be in 5.2.5 already.
704         - Added liblzma tests to the CMake build.
706         - Windows: Fix building of liblzma.dll with the included
707           Visual Studio project files.
710 5.3.2alpha (2021-10-28)
712     This release was made on short notice so that recent erofs-utils can
713     be built with LZMA support without needing a snapshot from xz.git.
714     Thus many pending things were not included, not even updated
715     translations (which would need to be updated for the new --list
716     strings anyway).
718     * All fixes from 5.2.5.
720     * xz:
722         - When copying metadata from the source file to the destination
723           file, don't try to set the group (GID) if it is already set
724           correctly. This avoids a failure on OpenBSD (and possibly on
725           a few other OSes) where files may get created so that their
726           group doesn't belong to the user, and fchown(2) can fail even
727           if it needs to do nothing.
729         - The --keep option now accepts symlinks, hardlinks, and
730           setuid, setgid, and sticky files. Previously this required
731           using --force.
733         - Split the long strings used in --list and --info-memory modes
734           to make them much easier for translators.
736         - If built with sandbox support and enabling the sandbox fails,
737           xz will now immediately exit with exit status of 1. Previously
738           it would only display a warning if -vv was used.
740         - Cap --memlimit-compress to 2000 MiB on MIPS32 because on
741           MIPS32 userspace processes are limited to 2 GiB of address
742           space.
744     * liblzma:
746         - Added lzma_microlzma_encoder() and lzma_microlzma_decoder().
747           The API is in lzma/container.h.
749           The MicroLZMA format is a raw LZMA stream (without end marker)
750           whose first byte (always 0x00) has been replaced with
751           bitwise-negation of the LZMA properties (lc/lp/pb). It was
752           created for use in EROFS but may be used in other contexts
753           as well where it is important to avoid wasting bytes for
754           stream headers or footers. The format is also supported by
755           XZ Embedded.
757           The MicroLZMA encoder API in liblzma can compress into a
758           fixed-sized output buffer so that as much data is compressed
759           as can be fit into the buffer while still creating a valid
760           MicroLZMA stream. This is needed for EROFS.
762         - Added fuzzing support.
764         - Support Intel Control-flow Enforcement Technology (CET) in
765           32-bit x86 assembly files.
767         - Visual Studio: Use non-standard _MSVC_LANG to detect C++
768           standard version in the lzma.h API header. It's used to
769           detect when "noexcept" can be used.
771     * Scripts:
773         - Fix exit status of xzdiff/xzcmp. Exit status could be 2 when
774           the correct value is 1.
776         - Fix exit status of xzgrep.
778         - Detect corrupt .bz2 files in xzgrep.
780         - Add zstd support to xzgrep and xzdiff/xzcmp.
782         - Fix less(1) version detection in xzless. It failed if the
783           version number from "less -V" contained a dot.
785     * Fix typos and technical issues in man pages.
787     * Build systems:
789         - Windows: Fix building of resource files when config.h isn't
790           used. CMake + Visual Studio can now build liblzma.dll.
792         - Various fixes to the CMake support. It might still need a few
793           more fixes even for liblzma-only builds.
796 5.3.1alpha (2018-04-29)
798     * All fixes from 5.2.4.
800     * Add lzma_file_info_decoder() into liblzma and use it in xz to
801       implement the --list feature.
803     * Capsicum sandbox support is enabled by default where available
804       (FreeBSD >= 10).
807 5.2.12 (2023-05-04)
809     * Fixed a build system bug that prevented building liblzma as a
810       shared library when configured with --disable-threads. This bug
811       affected releases 5.2.6 to 5.2.11 and 5.4.0 to 5.4.2.
813     * Include <intrin.h> for Windows intrinsic functions where they are
814       needed. This fixed a bug that prevented building liblzma using
815       clang-cl on Windows.
817     * Minor update to the Croatian translation. The small change
818       applies to a string in both 5.2 and 5.4 branches.
821 5.2.11 (2023-03-18)
823     * Removed all possible cases of null pointer + 0. It is undefined
824       behavior in C99 and C17. This was detected by a sanitizer and had
825       not caused any known issues.
827     * Build systems:
829         - Added a workaround for building with GCC on MicroBlaze Linux.
830           GCC 12 on MicroBlaze doesn't support the __symver__ attribute
831           even though __has_attribute(__symver__) returns true. The
832           build is now done without the extra RHEL/CentOS 7 symbols
833           that were added in XZ Utils 5.2.7. The workaround only
834           applies to the Autotools build (not CMake).
836         - CMake: Ensure that the C compiler language is set to C99 or
837           a newer standard.
839         - CMake changes from XZ Utils 5.4.1:
841             * Added a workaround for a build failure with
842               windres from GNU binutils.
844             * Included the Windows resource files in the xz
845               and xzdec build rules.
848 5.2.10 (2022-12-13)
850     * xz: Don't modify argv[] when parsing the --memlimit* and
851       --block-list command line options. This fixes confusing
852       arguments in process listing (like "ps auxf").
854     * GNU/Linux only: Use __has_attribute(__symver__) to detect if
855       that attribute is supported. This fixes build on Mandriva where
856       Clang is patched to define __GNUC__ to 11 by default (instead
857       of 4 as used by Clang upstream).
860 5.2.9 (2022-11-30)
862     * liblzma:
864         - Fixed an infinite loop in LZMA encoder initialization
865           if dict_size >= 2 GiB. (The encoder only supports up
866           to 1536 MiB.)
868         - Fixed two cases of invalid free() that can happen if
869           a tiny allocation fails in encoder re-initialization
870           or in lzma_filters_update(). These bugs had some
871           similarities with the bug fixed in 5.2.7.
873         - Fixed lzma_block_encoder() not allowing the use of
874           LZMA_SYNC_FLUSH with lzma_code() even though it was
875           documented to be supported. The sync-flush code in
876           the Block encoder was already used internally via
877           lzma_stream_encoder(), so this was just a missing flag
878           in the lzma_block_encoder() API function.
880         - GNU/Linux only: Don't put symbol versions into static
881           liblzma as it breaks things in some cases (and even if
882           it didn't break anything, symbol versions in static
883           libraries are useless anyway). The downside of the fix
884           is that if the configure options --with-pic or --without-pic
885           are used then it's not possible to build both shared and
886           static liblzma at the same time on GNU/Linux anymore;
887           with those options --disable-static or --disable-shared
888           must be used too.
890     * New email address for bug reports is <xz@tukaani.org> which
891       forwards messages to Lasse Collin and Jia Tan.
894 5.2.8 (2022-11-13)
896     * xz:
898         - If xz cannot remove an input file when it should, this
899           is now treated as a warning (exit status 2) instead of
900           an error (exit status 1). This matches GNU gzip and it
901           is more logical as at that point the output file has
902           already been successfully closed.
904         - Fix handling of .xz files with an unsupported check type.
905           Previously such printed a warning message but then xz
906           behaved as if an error had occurred (didn't decompress,
907           exit status 1). Now a warning is printed, decompression
908           is done anyway, and exit status is 2. This used to work
909           slightly before 5.0.0. In practice this bug matters only
910           if xz has been built with some check types disabled. As
911           instructed in PACKAGERS, such builds should be done in
912           special situations only.
914         - Fix "xz -dc --single-stream tests/files/good-0-empty.xz"
915           which failed with "Internal error (bug)". That is,
916           --single-stream was broken if the first .xz stream in
917           the input file didn't contain any uncompressed data.
919         - Fix displaying file sizes in the progress indicator when
920           working in passthru mode and there are multiple input files.
921           Just like "gzip -cdf", "xz -cdf" works like "cat" when the
922           input file isn't a supported compressed file format. In
923           this case the file size counters weren't reset between
924           files so with multiple input files the progress indicator
925           displayed an incorrect (too large) value.
927     * liblzma:
929         - API docs in lzma/container.h:
930             * Update the list of decoder flags in the decoder
931               function docs.
932             * Explain LZMA_CONCATENATED behavior with .lzma files
933               in lzma_auto_decoder() docs.
935         - OpenBSD: Use HW_NCPUONLINE to detect the number of
936           available hardware threads in lzma_physmem().
938         - Fix use of wrong macro to detect x86 SSE2 support.
939           __SSE2_MATH__ was used with GCC/Clang but the correct
940           one is __SSE2__. The first one means that SSE2 is used
941           for floating point math which is irrelevant here.
942           The affected SSE2 code isn't used on x86-64 so this affects
943           only 32-bit x86 builds that use -msse2 without -mfpmath=sse
944           (there is no runtime detection for SSE2). It improves LZMA
945           compression speed (not decompression).
947         - Fix the build with Intel C compiler 2021 (ICC, not ICX)
948           on Linux. It defines __GNUC__ to 10 but doesn't support
949           the __symver__ attribute introduced in GCC 10.
951     * Scripts: Ignore warnings from xz by using --quiet --no-warn.
952       This is needed if the input .xz files use an unsupported
953       check type.
955     * Translations:
957         - Updated Croatian and Turkish translations.
959         - One new translations wasn't included because it needed
960           technical fixes. It will be in upcoming 5.4.0. No new
961           translations will be added to the 5.2.x branch anymore.
963         - Renamed the French man page translation file from
964           fr_FR.po to fr.po and thus also its install directory
965           (like /usr/share/man/fr_FR -> .../fr).
967         - Man page translations for upcoming 5.4.0 are now handled
968           in the Translation Project.
970     * Update doc/faq.txt a little so it's less out-of-date.
973 5.2.7 (2022-09-30)
975     * liblzma:
977         - Made lzma_filters_copy() to never modify the destination
978           array if an error occurs. lzma_stream_encoder() and
979           lzma_stream_encoder_mt() already assumed this. Before this
980           change, if a tiny memory allocation in lzma_filters_copy()
981           failed it would lead to a crash (invalid free() or invalid
982           memory reads) in the cleanup paths of these two encoder
983           initialization functions.
985         - Added missing integer overflow check to lzma_index_append().
986           This affects xz --list and other applications that decode
987           the Index field from .xz files using lzma_index_decoder().
988           Normal decompression of .xz files doesn't call this code
989           and thus most applications using liblzma aren't affected
990           by this bug.
992         - Single-threaded .xz decoder (lzma_stream_decoder()): If
993           lzma_code() returns LZMA_MEMLIMIT_ERROR it is now possible
994           to use lzma_memlimit_set() to increase the limit and continue
995           decoding. This was supposed to work from the beginning
996           but there was a bug. With other decoders (.lzma or
997           threaded .xz decoder) this already worked correctly.
999         - Fixed accumulation of integrity check type statistics in
1000           lzma_index_cat(). This bug made lzma_index_checks() return
1001           only the type of the integrity check of the last Stream
1002           when multiple lzma_indexes were concatenated. Most
1003           applications don't use these APIs but in xz it made
1004           xz --list not list all check types from concatenated .xz
1005           files. In xz --list --verbose only the per-file "Check:"
1006           lines were affected and in xz --robot --list only the "file"
1007           line was affected.
1009         - Added ABI compatibility with executables that were linked
1010           against liblzma in RHEL/CentOS 7 or other liblzma builds
1011           that had copied the problematic patch from RHEL/CentOS 7
1012           (xz-5.2.2-compat-libs.patch). For the details, see the
1013           comment at the top of src/liblzma/validate_map.sh.
1015           WARNING: This uses __symver__ attribute with GCC >= 10.
1016           In other cases the traditional __asm__(".symver ...")
1017           is used. Using link-time optimization (LTO, -flto) with
1018           GCC versions older than 10 can silently result in
1019           broken liblzma.so.5 (incorrect symbol versions)! If you
1020           want to use -flto with GCC, you must use GCC >= 10.
1021           LTO with Clang seems to work even with the traditional
1022           __asm__(".symver ...") method.
1024     * xzgrep: Fixed compatibility with old shells that break if
1025       comments inside command substitutions have apostrophes (').
1026       This problem was introduced in 5.2.6.
1028     * Build systems:
1030         - New #define in config.h: HAVE_SYMBOL_VERSIONS_LINUX
1032         - Windows: Fixed liblzma.dll build with Visual Studio project
1033           files. It broke in 5.2.6 due to a change that was made to
1034           improve CMake support.
1036         - Windows: Building liblzma with UNICODE defined should now
1037           work.
1039         - CMake files are now actually included in the release tarball.
1040           They should have been in 5.2.5 already.
1042         - Minor CMake fixes and improvements.
1044     * Added a new translation: Turkish
1047 5.2.6 (2022-08-12)
1049     * xz:
1051         - The --keep option now accepts symlinks, hardlinks, and
1052           setuid, setgid, and sticky files. Previously this required
1053           using --force.
1055         - When copying metadata from the source file to the destination
1056           file, don't try to set the group (GID) if it is already set
1057           correctly. This avoids a failure on OpenBSD (and possibly on
1058           a few other OSes) where files may get created so that their
1059           group doesn't belong to the user, and fchown(2) can fail even
1060           if it needs to do nothing.
1062         - Cap --memlimit-compress to 2000 MiB instead of 4020 MiB on
1063           MIPS32 because on MIPS32 userspace processes are limited
1064           to 2 GiB of address space.
1066     * liblzma:
1068         - Fixed a missing error-check in the threaded encoder. If a
1069           small memory allocation fails, a .xz file with an invalid
1070           Index field would be created. Decompressing such a file would
1071           produce the correct output but result in an error at the end.
1072           Thus this is a "mild" data corruption bug. Note that while
1073           a failed memory allocation can trigger the bug, it cannot
1074           cause invalid memory access.
1076         - The decoder for .lzma files now supports files that have
1077           uncompressed size stored in the header and still use the
1078           end of payload marker (end of stream marker) at the end
1079           of the LZMA stream. Such files are rare but, according to
1080           the documentation in LZMA SDK, they are valid.
1081           doc/lzma-file-format.txt was updated too.
1083         - Improved 32-bit x86 assembly files:
1084             * Support Intel Control-flow Enforcement Technology (CET)
1085             * Use non-executable stack on FreeBSD.
1087         - Visual Studio: Use non-standard _MSVC_LANG to detect C++
1088           standard version in the lzma.h API header. It's used to
1089           detect when "noexcept" can be used.
1091     * xzgrep:
1093         - Fixed arbitrary command injection via a malicious filename
1094           (CVE-2022-1271, ZDI-CAN-16587). A standalone patch for
1095           this was released to the public on 2022-04-07. A slight
1096           robustness improvement has been made since then and, if
1097           using GNU or *BSD grep, a new faster method is now used
1098           that doesn't use the old sed-based construct at all. This
1099           also fixes bad output with GNU grep >= 3.5 (2020-09-27)
1100           when xzgrepping binary files.
1102           This vulnerability was discovered by:
1103           cleemy desu wayo working with Trend Micro Zero Day Initiative
1105         - Fixed detection of corrupt .bz2 files.
1107         - Improved error handling to fix exit status in some situations
1108           and to fix handling of signals: in some situations a signal
1109           didn't make xzgrep exit when it clearly should have. It's
1110           possible that the signal handling still isn't quite perfect
1111           but hopefully it's good enough.
1113         - Documented exit statuses on the man page.
1115         - xzegrep and xzfgrep now use "grep -E" and "grep -F" instead
1116           of the deprecated egrep and fgrep commands.
1118         - Fixed parsing of the options -E, -F, -G, -P, and -X. The
1119           problem occurred when multiple options were specified in
1120           a single argument, for example,
1122               echo foo | xzgrep -Fe foo
1124           treated foo as a filename because -Fe wasn't correctly
1125           split into -F -e.
1127         - Added zstd support.
1129     * xzdiff/xzcmp:
1131         - Fixed wrong exit status. Exit status could be 2 when the
1132           correct value is 1.
1134         - Documented on the man page that exit status of 2 is used
1135           for decompression errors.
1137         - Added zstd support.
1139     * xzless:
1141         - Fix less(1) version detection. It failed if the version number
1142           from "less -V" contained a dot.
1144     * Translations:
1146         - Added new translations: Catalan, Croatian, Esperanto,
1147           Korean, Portuguese, Romanian, Serbian, Spanish, Swedish,
1148           and Ukrainian
1150         - Updated the Brazilian Portuguese translation.
1152         - Added French man page translation. This and the existing
1153           German translation aren't complete anymore because the
1154           English man pages got a few updates and the translators
1155           weren't reached so that they could update their work.
1157     * Build systems:
1159         - Windows: Fix building of resource files when config.h isn't
1160           used. CMake + Visual Studio can now build liblzma.dll.
1162         - Various fixes to the CMake support. Building static or shared
1163           liblzma should work fine in most cases. In contrast, building
1164           the command line tools with CMake is still clearly incomplete
1165           and experimental and should be used for testing only.
1168 5.2.5 (2020-03-17)
1170     * liblzma:
1172         - Fixed several C99/C11 conformance bugs. Now the code is clean
1173           under gcc/clang -fsanitize=undefined. Some of these changes
1174           might have a negative effect on performance with old GCC
1175           versions or compilers other than GCC and Clang. The configure
1176           option --enable-unsafe-type-punning can be used to (mostly)
1177           restore the old behavior but it shouldn't normally be used.
1179         - Improved API documentation of lzma_properties_decode().
1181         - Added a very minor encoder speed optimization.
1183     * xz:
1185         - Fixed a crash in "xz -dcfv not_an_xz_file". All four options
1186           were required to trigger it. The crash occurred in the
1187           progress indicator code when xz was in passthru mode where
1188           xz works like "cat".
1190         - Fixed an integer overflow with 32-bit off_t. It could happen
1191           when decompressing a file that has a long run of zero bytes
1192           which xz would try to write as a sparse file. Since the build
1193           system enables large file support by default, off_t is
1194           normally 64-bit even on 32-bit systems.
1196         - Fixes for --flush-timeout:
1197             * Fix semi-busy-waiting.
1198             * Avoid unneeded flushes when no new input has arrived
1199               since the previous flush was completed.
1201         - Added a special case for 32-bit xz: If --memlimit-compress is
1202           used to specify a limit that exceeds 4020 MiB, the limit will
1203           be set to 4020 MiB. The values "0" and "max" aren't affected
1204           by this and neither is decompression. This hack can be
1205           helpful when a 32-bit xz has access to 4 GiB address space
1206           but the specified memlimit exceeds 4 GiB. This can happen
1207           e.g. with some scripts.
1209         - Capsicum sandbox is now enabled by default where available
1210           (FreeBSD >= 10). The sandbox debug messages (xz -vv) were
1211           removed since they seemed to be more annoying than useful.
1213         - DOS build now requires DJGPP 2.05 instead of 2.04beta.
1214           A workaround for a locale problem with DJGPP 2.05 was added.
1216     * xzgrep and other scripts:
1218         - Added a configure option --enable-path-for-scripts=PREFIX.
1219           It is disabled by default except on Solaris where the default
1220           is /usr/xpg4/bin. See INSTALL for details.
1222         - Added a workaround for a POSIX shell detection problem on
1223           Solaris.
1225     * Build systems:
1227         - Added preliminary build instructions for z/OS. See INSTALL
1228           section 1.2.9.
1230         - Experimental CMake support was added. It should work to build
1231           static liblzma on a few operating systems. It may or may not
1232           work to build shared liblzma. On some platforms it can build
1233           xz and xzdec too but those are only for testing. See the
1234           comment in the beginning of CMakeLists.txt for details.
1236         - Visual Studio project files were updated.
1237           WindowsTargetPlatformVersion was removed from VS2017 files
1238           and set to "10.0" in the added VS2019 files. In the future
1239           the VS project files will be removed when CMake support is
1240           good enough.
1242         - New #defines in config.h: HAVE___BUILTIN_ASSUME_ALIGNED,
1243           HAVE___BUILTIN_BSWAPXX, and TUKLIB_USE_UNSAFE_TYPE_PUNNING.
1245         - autogen.sh has a new optional dependency on po4a and a new
1246           option --no-po4a to skip that step. This matters only if one
1247           wants to remake the build files. po4a is used to update the
1248           translated man pages but as long as the man pages haven't
1249           been modified, there's nothing to update and one can use
1250           --no-po4a to avoid the dependency on po4a.
1252     * Translations:
1254         - XZ Utils translations are now handled by the Translation
1255           Project: https://translationproject.org/domain/xz.html
1257         - All man pages are now included in German too.
1259         - New xz translations: Brazilian Portuguese, Finnish,
1260           Hungarian, Chinese (simplified), Chinese (traditional),
1261           and Danish (partial translation)
1263         - Updated xz translations: French, German, Italian, and Polish
1265         - Unfortunately a few new xz translations weren't included due
1266           to technical problems like too long lines in --help output or
1267           misaligned column headings in tables. In the future, many of
1268           these strings will be split and e.g. the table column
1269           alignment will be handled in software. This should make the
1270           strings easier to translate.
1273 5.2.4 (2018-04-29)
1275     * liblzma:
1277         - Allow 0 as memory usage limit instead of returning
1278           LZMA_PROG_ERROR. Now 0 is treated as if 1 byte was specified,
1279           which effectively is the same as 0.
1281         - Use "noexcept" keyword instead of "throw()" in the public
1282           headers when a C++11 (or newer standard) compiler is used.
1284         - Added a portability fix for recent Intel C Compilers.
1286         - Microsoft Visual Studio build files have been moved under
1287           windows/vs2013 and windows/vs2017.
1289     * xz:
1291         - Fix "xz --list --robot missing_or_bad_file.xz" which would
1292           try to print an uninitialized string and thus produce garbage
1293           output. Since the exit status is non-zero, most uses of such
1294           a command won't try to interpret the garbage output.
1296         - "xz --list foo.xz" could print "Internal error (bug)" in a
1297           corner case where a specific memory usage limit had been set.
1300 5.2.3 (2016-12-30)
1302     * xz:
1304         - Always close a file before trying to delete it to avoid
1305           problems on some operating system and file system combinations.
1307         - Fixed copying of file timestamps on Windows.
1309         - Added experimental (disabled by default) sandbox support using
1310           Capsicum (FreeBSD >= 10). See --enable-sandbox in INSTALL.
1312     * C99/C11 conformance fixes to liblzma. The issues affected at least
1313       some builds using link-time optimizations.
1315     * Fixed bugs in the rarely-used function lzma_index_dup().
1317     * Use of external SHA-256 code is now disabled by default.
1318       It can still be enabled by passing --enable-external-sha256
1319       to configure. The reasons to disable it by default (see INSTALL
1320       for more details):
1322         - Some OS-specific SHA-256 implementations conflict with
1323           OpenSSL and cause problems in programs that link against both
1324           liblzma and libcrypto. At least FreeBSD 10 and MINIX 3.3.0
1325           are affected.
1327         - The internal SHA-256 is faster than the SHA-256 code in
1328           some operating systems.
1330     * Changed CPU core count detection to use sched_getaffinity() on
1331       GNU/Linux and GNU/kFreeBSD.
1333     * Fixes to the build-system and xz to make xz buildable even when
1334       encoders, decoders, or threading have been disabled from libilzma
1335       using configure options. These fixes added two new #defines to
1336       config.h: HAVE_ENCODERS and HAVE_DECODERS.
1339 5.2.2 (2015-09-29)
1341     * Fixed bugs in QNX-specific code.
1343     * Omitted the use of pipe2() even if it is available to avoid
1344       portability issues with some old Linux and glibc combinations.
1346     * Updated German translation.
1348     * Added project files to build static and shared liblzma (not the
1349       whole XZ Utils) with Visual Studio 2013 update 2 or later.
1351     * Documented that threaded decompression hasn't been implemented
1352       yet. A 5.2.0 NEWS entry describing multi-threading support had
1353       incorrectly said "decompression" when it should have said
1354       "compression".
1357 5.2.1 (2015-02-26)
1359     * Fixed a compression-ratio regression in fast mode of LZMA1 and
1360       LZMA2. The bug is present in 5.1.4beta and 5.2.0 releases.
1362     * Fixed a portability problem in xz that affected at least OpenBSD.
1364     * Fixed xzdiff to be compatible with FreeBSD's mktemp which differs
1365       from most other mktemp implementations.
1367     * Changed CPU core count detection to use cpuset_getaffinity() on
1368       FreeBSD.
1371 5.2.0 (2014-12-21)
1373     Since 5.1.4beta:
1375     * All fixes from 5.0.8
1377     * liblzma: Fixed lzma_stream_encoder_mt_memusage() when a preset
1378       was used.
1380     * xzdiff: If mktemp isn't installed, mkdir will be used as
1381       a fallback to create a temporary directory. Installing mktemp
1382       is still recommended.
1384     * Updated French, German, Italian, Polish, and Vietnamese
1385       translations.
1387     Summary of fixes and new features added in the 5.1.x development
1388     releases:
1390     * liblzma:
1392         - Added support for multi-threaded compression. See the
1393           lzma_mt structure, lzma_stream_encoder_mt(), and
1394           lzma_stream_encoder_mt_memusage() in <lzma/container.h>,
1395           lzma_get_progress() in <lzma/base.h>, and lzma_cputhreads()
1396           in <lzma/hardware.h> for details.
1398         - Made the uses of lzma_allocator const correct.
1400         - Added lzma_block_uncomp_encode() to create uncompressed
1401           .xz Blocks using LZMA2 uncompressed chunks.
1403         - Added support for LZMA_IGNORE_CHECK.
1405         - A few speed optimizations were made.
1407         - Added support for symbol versioning. It is enabled by default
1408           on GNU/Linux, other GNU-based systems, and FreeBSD.
1410         - liblzma (not the whole XZ Utils) should now be buildable
1411           with MSVC 2013 update 2 or later using windows/config.h.
1413     * xz:
1415         - Fixed a race condition in the signal handling. It was
1416           possible that e.g. the first SIGINT didn't make xz exit
1417           if reading or writing blocked and one had bad luck. The fix
1418           is non-trivial, so as of writing it is unknown if it will be
1419           backported to the v5.0 branch.
1421         - Multi-threaded compression can be enabled with the
1422           --threads (-T) option.
1423           [Fixed: This originally said "decompression".]
1425         - New command line options in xz: --single-stream,
1426           --block-size=SIZE, --block-list=SIZES,
1427           --flush-timeout=TIMEOUT, and --ignore-check.
1429         - xz -lvv now shows the minimum xz version that is required to
1430           decompress the file. Currently it is 5.0.0 for all supported
1431           .xz files except files with empty LZMA2 streams require 5.0.2.
1433     * xzdiff and xzgrep now support .lzo files if lzop is installed.
1434       The .tzo suffix is also recognized as a shorthand for .tar.lzo.
1437 5.1.4beta (2014-09-14)
1439     * All fixes from 5.0.6
1441     * liblzma: Fixed the use of presets in threaded encoder
1442       initialization.
1444     * xz --block-list and --block-size can now be used together
1445       in single-threaded mode. Previously the combination only
1446       worked in multi-threaded mode.
1448     * Added support for LZMA_IGNORE_CHECK to liblzma and made it
1449       available in xz as --ignore-check.
1451     * liblzma speed optimizations:
1453         - Initialization of a new LZMA1 or LZMA2 encoder has been
1454           optimized. (The speed of reinitializing an already-allocated
1455           encoder isn't affected.) This helps when compressing many
1456           small buffers with lzma_stream_buffer_encode() and other
1457           similar situations where an already-allocated encoder state
1458           isn't reused. This speed-up is visible in xz too if one
1459           compresses many small files one at a time instead running xz
1460           once and giving all files as command-line arguments.
1462         - Buffer comparisons are now much faster when unaligned access
1463           is allowed (configured with --enable-unaligned-access). This
1464           speeds up encoding significantly. There is arch-specific code
1465           for 32-bit and 64-bit x86 (32-bit needs SSE2 for the best
1466           results and there's no run-time CPU detection for now).
1467           For other archs there is only generic code which probably
1468           isn't as optimal as arch-specific solutions could be.
1470         - A few speed optimizations were made to the SHA-256 code.
1471           (Note that the builtin SHA-256 code isn't used on all
1472           operating systems.)
1474     * liblzma can now be built with MSVC 2013 update 2 or later
1475       using windows/config.h.
1477     * Vietnamese translation was added.
1480 5.1.3alpha (2013-10-26)
1482     * All fixes from 5.0.5
1484     * liblzma:
1486         - Fixed a deadlock in the threaded encoder.
1488         - Made the uses of lzma_allocator const correct.
1490         - Added lzma_block_uncomp_encode() to create uncompressed
1491           .xz Blocks using LZMA2 uncompressed chunks.
1493         - Added support for native threads on Windows and the ability
1494           to detect the number of CPU cores.
1496     * xz:
1498         - Fixed a race condition in the signal handling. It was
1499           possible that e.g. the first SIGINT didn't make xz exit
1500           if reading or writing blocked and one had bad luck. The fix
1501           is non-trivial, so as of writing it is unknown if it will be
1502           backported to the v5.0 branch.
1504         - Made the progress indicator work correctly in threaded mode.
1506         - Threaded encoder now works together with --block-list=SIZES.
1508         - Added preliminary support for --flush-timeout=TIMEOUT.
1509           It can be useful for (somewhat) real-time streaming. For
1510           now the decompression side has to be done with something
1511           else than the xz tool due to how xz does buffering, but this
1512           should be fixed.
1515 5.1.2alpha (2012-07-04)
1517     * All fixes from 5.0.3 and 5.0.4
1519     * liblzma:
1521         - Fixed a deadlock and an invalid free() in the threaded encoder.
1523         - Added support for symbol versioning. It is enabled by default
1524           on GNU/Linux, other GNU-based systems, and FreeBSD.
1526         - Use SHA-256 implementation from the operating system if one is
1527           available in libc, libmd, or libutil. liblzma won't use e.g.
1528           OpenSSL or libgcrypt to avoid introducing new dependencies.
1530         - Fixed liblzma.pc for static linking.
1532         - Fixed a few portability bugs.
1534     * xz --decompress --single-stream now fixes the input position after
1535       successful decompression. Now the following works:
1537           echo foo | xz > foo.xz
1538           echo bar | xz >> foo.xz
1539           ( xz -dc --single-stream ; xz -dc --single-stream ) < foo.xz
1541       Note that it doesn't work if the input is not seekable
1542       or if there is Stream Padding between the concatenated
1543       .xz Streams.
1545     * xz -lvv now shows the minimum xz version that is required to
1546       decompress the file. Currently it is 5.0.0 for all supported .xz
1547       files except files with empty LZMA2 streams require 5.0.2.
1549     * Added an *incomplete* implementation of --block-list=SIZES to xz.
1550       It only works correctly in single-threaded mode and when
1551       --block-size isn't used at the same time. --block-list allows
1552       specifying the sizes of Blocks which can be useful e.g. when
1553       creating files for random-access reading.
1556 5.1.1alpha (2011-04-12)
1558     * All fixes from 5.0.2
1560     * liblzma fixes that will also be included in 5.0.3:
1562         - A memory leak was fixed.
1564         - lzma_stream_buffer_encode() no longer creates an empty .xz
1565           Block if encoding an empty buffer. Such an empty Block with
1566           LZMA2 data would trigger a bug in 5.0.1 and older (see the
1567           first bullet point in 5.0.2 notes). When releasing 5.0.2,
1568           I thought that no encoder creates this kind of files but
1569           I was wrong.
1571         - Validate function arguments better in a few functions. Most
1572           importantly, specifying an unsupported integrity check to
1573           lzma_stream_buffer_encode() no longer creates a corrupt .xz
1574           file. Probably no application tries to do that, so this
1575           shouldn't be a big problem in practice.
1577         - Document that lzma_block_buffer_encode(),
1578           lzma_easy_buffer_encode(), lzma_stream_encoder(), and
1579           lzma_stream_buffer_encode() may return LZMA_UNSUPPORTED_CHECK.
1581         - The return values of the _memusage() functions are now
1582           documented better.
1584     * Support for multithreaded compression was added using the simplest
1585       method, which splits the input data into blocks and compresses
1586       them independently. Other methods will be added in the future.
1587       The current method has room for improvement, e.g. it is possible
1588       to reduce the memory usage.
1590     * Added the options --single-stream and --block-size=SIZE to xz.
1592     * xzdiff and xzgrep now support .lzo files if lzop is installed.
1593       The .tzo suffix is also recognized as a shorthand for .tar.lzo.
1595     * Support for short 8.3 filenames under DOS was added to xz. It is
1596       experimental and may change before it gets into a stable release.
1599 5.0.8 (2014-12-21)
1601     * Fixed an old bug in xzgrep that affected OpenBSD and probably
1602       a few other operating systems too.
1604     * Updated French and German translations.
1606     * Added support for detecting the amount of RAM on AmigaOS/AROS.
1608     * Minor build system updates.
1611 5.0.7 (2014-09-20)
1613     * Fix regressions introduced in 5.0.6:
1615         - Fix building with non-GNU make.
1617         - Fix invalid Libs.private value in liblzma.pc which broke
1618           static linking against liblzma if the linker flags were
1619           taken from pkg-config.
1622 5.0.6 (2014-09-14)
1624     * xzgrep now exits with status 0 if at least one file matched.
1626     * A few minor portability and build system fixes
1629 5.0.5 (2013-06-30)
1631     * lzmadec and liblzma's lzma_alone_decoder(): Support decompressing
1632       .lzma files that have less common settings in the headers
1633       (dictionary size other than 2^n or 2^n + 2^(n-1), or uncompressed
1634       size greater than 256 GiB). The limitations existed to avoid false
1635       positives when detecting .lzma files. The lc + lp <= 4 limitation
1636       still remains since liblzma's LZMA decoder has that limitation.
1638       NOTE: xz's .lzma support or liblzma's lzma_auto_decoder() are NOT
1639       affected by this change. They still consider uncommon .lzma headers
1640       as not being in the .lzma format. Changing this would give way too
1641       many false positives.
1643     * xz:
1645         - Interaction of preset and custom filter chain options was
1646           made less illogical. This affects only certain less typical
1647           uses cases so few people are expected to notice this change.
1649           Now when a custom filter chain option (e.g. --lzma2) is
1650           specified, all preset options (-0 ... -9, -e) earlier are on
1651           the command line are completely forgotten. Similarly, when
1652           a preset option is specified, all custom filter chain options
1653           earlier on the command line are completely forgotten.
1655           Example 1: "xz -9 --lzma2=preset=5 -e" is equivalent to "xz -e"
1656           which is equivalent to "xz -6e". Earlier -e didn't put xz back
1657           into preset mode and thus the example command was equivalent
1658           to "xz --lzma2=preset=5".
1660           Example 2: "xz -9e --lzma2=preset=5 -7" is equivalent to
1661           "xz -7". Earlier a custom filter chain option didn't make
1662           xz forget the -e option so the example was equivalent to
1663           "xz -7e".
1665         - Fixes and improvements to error handling.
1667         - Various fixes to the man page.
1669     * xzless: Fixed to work with "less" versions 448 and later.
1671     * xzgrep: Made -h an alias for --no-filename.
1673     * Include the previously missing debug/translation.bash which can
1674       be useful for translators.
1676     * Include a build script for Mac OS X. This has been in the Git
1677       repository since 2010 but due to a mistake in Makefile.am the
1678       script hasn't been included in a release tarball before.
1681 5.0.4 (2012-06-22)
1683     * liblzma:
1685         - Fix lzma_index_init(). It could crash if memory allocation
1686           failed.
1688         - Fix the possibility of an incorrect LZMA_BUF_ERROR when a BCJ
1689           filter is used and the application only provides exactly as
1690           much output space as is the uncompressed size of the file.
1692         - Fix a bug in doc/examples_old/xz_pipe_decompress.c. It didn't
1693           check if the last call to lzma_code() really returned
1694           LZMA_STREAM_END, which made the program think that truncated
1695           files are valid.
1697         - New example programs in doc/examples (old programs are now in
1698           doc/examples_old). These have more comments and more detailed
1699           error handling.
1701     * Fix "xz -lvv foo.xz". It could crash on some corrupted files.
1703     * Fix output of "xz --robot -lv" and "xz --robot -lvv" which
1704       incorrectly printed the filename also in the "foo (x/x)" format.
1706     * Fix exit status of "xzdiff foo.xz bar.xz".
1708     * Fix exit status of "xzgrep foo binary_file".
1710     * Fix portability to EBCDIC systems.
1712     * Fix a configure issue on AIX with the XL C compiler. See INSTALL
1713       for details.
1715     * Update French, German, Italian, and Polish translations.
1718 5.0.3 (2011-05-21)
1720     * liblzma fixes:
1722         - A memory leak was fixed.
1724         - lzma_stream_buffer_encode() no longer creates an empty .xz
1725           Block if encoding an empty buffer. Such an empty Block with
1726           LZMA2 data would trigger a bug in 5.0.1 and older (see the
1727           first bullet point in 5.0.2 notes). When releasing 5.0.2,
1728           I thought that no encoder creates this kind of files but
1729           I was wrong.
1731         - Validate function arguments better in a few functions. Most
1732           importantly, specifying an unsupported integrity check to
1733           lzma_stream_buffer_encode() no longer creates a corrupt .xz
1734           file. Probably no application tries to do that, so this
1735           shouldn't be a big problem in practice.
1737         - Document that lzma_block_buffer_encode(),
1738           lzma_easy_buffer_encode(), lzma_stream_encoder(), and
1739           lzma_stream_buffer_encode() may return LZMA_UNSUPPORTED_CHECK.
1741         - The return values of the _memusage() functions are now
1742           documented better.
1744     * Fix command name detection in xzgrep. xzegrep and xzfgrep now
1745       correctly use egrep and fgrep instead of grep.
1747     * French translation was added.
1750 5.0.2 (2011-04-01)
1752     * LZMA2 decompressor now correctly accepts LZMA2 streams with no
1753       uncompressed data. Previously it considered them corrupt. The
1754       bug can affect applications that use raw LZMA2 streams. It is
1755       very unlikely to affect .xz files because no compressor creates
1756       .xz files with empty LZMA2 streams. (Empty .xz files are a
1757       different thing than empty LZMA2 streams.)
1759     * "xz --suffix=.foo filename.foo" now refuses to compress the
1760       file due to it already having the suffix .foo. It was already
1761       documented on the man page, but the code lacked the test.
1763     * "xzgrep -l foo bar.xz" works now.
1765     * Polish translation was added.
1768 5.0.1 (2011-01-29)
1770     * xz --force now (de)compresses files that have setuid, setgid,
1771       or sticky bit set and files that have multiple hard links.
1772       The man page had it documented this way already, but the code
1773       had a bug.
1775     * gzip and bzip2 support in xzdiff was fixed.
1777     * Portability fixes
1779     * Minor fix to Czech translation
1782 5.0.0 (2010-10-23)
1784     Only the most important changes compared to 4.999.9beta are listed
1785     here. One change is especially important:
1787       * The memory usage limit is now disabled by default. Some scripts
1788         written before this change may have used --memory=max on xz command
1789         line or in XZ_OPT. THESE USES OF --memory=max SHOULD BE REMOVED
1790         NOW, because they interfere with user's ability to set the memory
1791         usage limit himself. If user-specified limit causes problems to
1792         your script, blame the user.
1794     Other significant changes:
1796       * Added support for XZ_DEFAULTS environment variable. This variable
1797         allows users to set default options for xz, e.g. default memory
1798         usage limit or default compression level. Scripts that use xz
1799         must never set or unset XZ_DEFAULTS. Scripts should use XZ_OPT
1800         instead if they need a way to pass options to xz via an
1801         environment variable.
1803       * The compression settings associated with the preset levels
1804         -0 ... -9 have been changed. --extreme was changed a little too.
1805         It is now less likely to make compression worse, but with some
1806         files the new --extreme may compress slightly worse than the old
1807         --extreme.
1809       * If a preset level (-0 ... -9) is specified after a custom filter
1810         chain options have been used (e.g. --lzma2), the custom filter
1811         chain will be forgotten. Earlier the preset options were
1812         completely ignored after custom filter chain options had been
1813         seen.
1815       * xz will create sparse files when decompressing if the uncompressed
1816         data contains long sequences of binary zeros. This is done even
1817         when writing to standard output that is connected to a regular
1818         file and certain additional conditions are met to make it safe.
1820       * Support for "xz --list" was added. Combine with --verbose or
1821         --verbose --verbose (-vv) for detailed output.
1823       * I had hoped that liblzma API would have been stable after
1824         4.999.9beta, but there have been a couple of changes in the
1825         advanced features, which don't affect most applications:
1827           - Index handling code was revised. If you were using the old
1828             API, you will get a compiler error (so it's easy to notice).
1830           - A subtle but important change was made to the Block handling
1831             API. lzma_block.version has to be initialized even for
1832             lzma_block_header_decode(). Code that doesn't do it will work
1833             for now, but might break in the future, which makes this API
1834             change easy to miss.
1836       * The major soname has been bumped to 5.0.0. liblzma API and ABI
1837         are now stable, so the need to recompile programs linking against
1838         liblzma shouldn't arise soon.