Neues Skript zum Test der Trennmuster mit kombinierenden Zeichen.
commit0e62880c9d3721767cebfddb6d58674d6c335b94
authorGünter Milde <milde@users.sf.net>
Sat, 28 Oct 2023 22:37:06 +0000 (29 00:37 +0200)
committerGünter Milde <milde@users.sf.net>
Sat, 28 Oct 2023 22:37:06 +0000 (29 00:37 +0200)
tree4cf521ff53c085fc077c0f1d99025c5aa64aa7d8
parent32282f162a0fcb47cdcdf4ea71bbb82d8edfe4e1
Neues Skript zum Test der Trennmuster mit kombinierenden Zeichen.

Ca. 17 000 Wörter (3.4%) der Wortliste werden falsch oder nicht vollständig getrennt, wenn sie mit
kombinierenden Zeichen anstelle der vorgefertigten äöü geschrieben werden (Unicode Normalform D).

Neben der häufigen Nichterkennung von Trennstellen neben Umlaut kommt es auch zu Falschtrennungen.

Aufruf e.g.:
    skripte/lib/py_wortliste/hyphenate_NFD_words.py < wortliste > zusatzlisten/NFD-Differenzen
skripte/lib/py_wortliste/hyphenate_NFD_words.py [new file with mode: 0755]