utf8.c: partially update to version 6.3
commitd813ab970db8b57b70bdd1b7e5feddec1c3fd84e
authorTorsten Bögershausen <tboegi@web.de>
Mon, 7 Apr 2014 19:39:41 +0000 (7 21:39 +0200)
committerJunio C Hamano <gitster@pobox.com>
Wed, 9 Apr 2014 17:14:05 +0000 (9 10:14 -0700)
treefb2799248ddaa65349f06183780e63eb9faad100
parent5f95c9f850b19b368c43ae399cc831b17a26a5ac
utf8.c: partially update to version 6.3

Unicode 6.3 defines more code points as combining or accents.  For
example, the character "ö" could be expressed as an "o" followed by
U+0308 COMBINING DIARESIS (aka umlaut, double-dot-above).  We should
consider that such a sequence of two codepoints occupies one display
column for the alignment purposes, and for that, git_wcwidth()
should return 0 for them.  Affected codepoints are:

    U+0358..U+035C
    U+0487
    U+05A2, U+05BA, U+05C5, U+05C7
    U+0604, U+0616..U+061A, U+0659..U+065F

Earlier unicode standards had defined these as "reserved".

Only the range 0..U+07FF has been checked to see which codepoints
need to be marked as 0-width while preparing for this commit; more
updates may be needed.

Signed-off-by: Torsten Bögershausen <tboegi@web.de>
Signed-off-by: Junio C Hamano <gitster@pobox.com>
utf8.c