From f5a6f7588802f7861c885a00804fa5d92bacc82a Mon Sep 17 00:00:00 2001 From: =?utf8?q?G=C3=BCnter=20Milde?= Date: Wed, 9 May 2018 09:47:43 +0200 Subject: [PATCH] Dokumentation und Kommentare --- dokumente/Trennstile.txt | 177 ++++++++++++++++++++++++++++++++++++----------- wortliste | 106 ++++++++++++++-------------- 2 files changed, 188 insertions(+), 95 deletions(-) diff --git a/dokumente/Trennstile.txt b/dokumente/Trennstile.txt index 0b3f9ef..b99f83a 100644 --- a/dokumente/Trennstile.txt +++ b/dokumente/Trennstile.txt @@ -1,12 +1,12 @@ Trennstile -========== +********** Notiz: Dies ist gegenwärtig eine Ideensammlung zu möglichen Erweiterungen und Anwendungsfällen. Einleitung ----------- +========== Mit „Trennstil“ soll in diesem Dokument ein Algorithmus zur Auswahl von einfachen Trennstellen bezeichnet werden: @@ -16,16 +16,15 @@ Ausgangswert: (Kategorie, Hierarchie, Wichtung, explizite Unterdrückung) Ergebnis: - Wort mit einfachen Trennstellen. - -Trennstile sind orthogonal zu Sprachvarianten (d.h. sie können separat zur -Sprache gewählt werden). Die Auswahl der Trennstellen erfolgt aus den in der -jeweiligen Sprachvariante zulässigen Trennstellen. + Wort mit ggf. veränderter Zahl und Position der Trennstellen. +Trennstile sind orthogonal zur Orthographie (d.h. sie können separat zur +Sprachvarietät gewählt werden). Die Auswahl der Trennstellen erfolgt aus den +in der jeweiligen Orthographie zulässigen Trennstellen. Dimensionen ------------ +=========== Bei der Wahl eines Trennstils gibt es verschiedene Dimensionen (Auswahlparameter/orthogonale Eigenschaften) die je nach Anwendungsfall @@ -37,103 +36,197 @@ Trennhäufigkeit (Permissivität) Notentext: Alle zulässigen Trennungen und (die nur in Notentexten zulässigen) Trennungen nach führendem Vokal. - + + Club-a-bend, Ur-in-stinkt, Ä-o-nen, The-a-ter, Bi-o-lo-gie, O-bo-e + Anwendung: Texte zum Notensatz - Bsp.: Club-a-bend, Ur-in-stinkt, Ä-o-nen, The-a-ter, Bi-o-lo-gie, O-bo-e alle: - Alle zulässigen Trennungen (außer Alternativtrennungen_), einschließlich + Alle zulässigen Trennungen (außer bei Alternativen_), einschließlich der explizit als ungünstig markierten: - - Anwendung: ? - Bsp.: Abend, Ur-in-stinkt, Äo-nen, The-a-ter, Bio-lo-gie + Abend, Ur-in-stinkt, Äo-nen, The-a-ter, Bio-lo-gie + + Anwendung: ? permissiv: Aussortieren sehr ungünstiger (mit „..“ markierter) Trennstellen. - - Anwendung: schmalspaltiger Blocksatz - Bsp.: Abend, Ur-instinkt, Bio-lo-gie, Atom-ar-se-nal + Abend, Ur-instinkt, The-a-ter, Bio-lo-gie, Atom-ar-se-nal + + Anwendung: schmalspaltiger Blocksatz standard: - Derzeitige Auswahl (Aussortieren von mit „.“ markierten Trennstellen) - + Derzeitige Auswahl + + * Aussortieren von mit „.“ markierten Trennstellen + * Vermeiden einvokalischer Silben + + Abend, Ur-instinkt, Thea-ter, Bio-lo-gie, Atom-arse-nal + Anwendung: Blocksatz, schmale bis mittlere Textspalten - Bsp.: Abend, Ur-instinkt, Bio-lo-gie, Atom-arse-nal +Haupt- und Suffixtrennstellen + Alle Trennstellen an Wortfugen, nach Präfix und vor Suffix. + + auf-fällig, Hanf-faser, höf-lich, affig, fällig + + Anwendung: Ligaturaufbruch Haupttrennstellen: Alle Trennstellen an Wortfugen und nach Präfix. - - Anwendung: Wortanalyse, Tests - + ab-seilen, Bio-logie, Treppen-ge-länder + Anwendung: Wortanalyse, Tests + Primärtrennstellen: Haupttrennstellen der höchsten Hierarchie. - Park-eisenbahn, Treppen-geländer, un-zuverlässig + Park-eisenbahn, Treppen-geländer, un-zuverlässig, zwei-und-fünfzig lesefreundlich: Keine Trennstellen "in der Nähe" von "besseren" Trennstellen. - - Anwendung: Flattersatz, Blocksatz in breiten Spalten, Web-Browser Abend-erzäh-lung, un-gemüt-lich + Anwendung: Flattersatz, Blocksatz in breiten Spalten, Web-Browser + Alternativen ------------ Mit der Reform 1996 (vereinzelt auch schon eher ↗K71, ↗K44) wurden Trennalternativen eingeführt, mit der Empfehlung, diese in einem Dokument -einheitlich zu handhaben. Dies betrifft +einheitlich zu handhaben. + +Fremdwortsilben +~~~~~~~~~~~~~~~ + +amtl. Regelwerk § 112 (vorher K86, K87) -Fremdwortsilben (amtl. Regelwerk § 112, vorher K86, K87) In Fremdwörtern können die Verbindungen aus Buchstaben für einen Konsonanten + l, n oder r entweder entsprechend § 110 getrennt werden, oder sie kommen ungetrennt auf die neue Zeile. no-b-le, Zy-k-lus, Ma-g-net, Fe-b-ru-ar, Hy-d-rant, Ar-th-ri-tis -verblasste Etymologie (§113) +verblasste Etymologie +~~~~~~~~~~~~~~~~~~~~~ + +amtl. Regelwerk §113 (vorher K71, K44) + Wörter, die sprachhistorisch oder von der Herkunftssprache her gesehen Zusammensetzungen oder Präfigierungen sind, aber nicht mehr als solche empfunden oder erkannt werden, kann man entweder nach § 108 oder nach § 109 bis § 112 trennen. - + hi-nes-sant, Li-nkeit Abts;Abts Abtsgmünd;Abts=gmünd # geogr.; Ort in Baden-Württemberg Abtsgmünder;Abts=gmün-der -Abtsteinach;Abt==stein=ach +Abtsteinach;Abt==stein=ach # geogr. Name abtue;ablich;neu=tes-ta-ment=>lich @@ -291151,7 +291151,7 @@ paranoid;pa-raschaft +Woiwodschaft;Woi-wod>schaft # < poln. Wojtyla;Woj-ty-la # poln. Name Wojtylas;Woj-ty-las wölbe;wöl-be -- 2.11.4.GIT