Dokumentation und Kommentare
[wortliste.git] / dokumente / Trennstile.txt
blobb99f83aa78ecf58ddaf73ae767fba641b542548c
1 Trennstile
2 **********
4 Notiz:
5   Dies ist gegenwärtig eine Ideensammlung zu möglichen Erweiterungen und
6   Anwendungsfällen.
8 Einleitung
9 ==========
11 Mit „Trennstil“ soll in diesem Dokument ein Algorithmus zur Auswahl von
12 einfachen Trennstellen bezeichnet werden:
14 Ausgangswert:
15    Wort aus der "wortliste" mit komplexen Trennstellenmarkierungen
16    (Kategorie, Hierarchie, Wichtung, explizite Unterdrückung)
18 Ergebnis:
19    Wort mit ggf. veränderter Zahl und Position der Trennstellen.
21 Trennstile sind orthogonal zur Orthographie (d.h. sie können separat zur
22 Sprachvarietät gewählt werden). Die Auswahl der Trennstellen erfolgt aus den
23 in der jeweiligen Orthographie zulässigen Trennstellen.
26 Dimensionen
27 ===========
29 Bei der Wahl eines Trennstils gibt es verschiedene Dimensionen
30 (Auswahlparameter/orthogonale Eigenschaften) die je nach Anwendungsfall
31 verschieden kombiniert werden können.
33 Trennhäufigkeit (Permissivität)
34 -------------------------------
36 Notentext:
37   Alle zulässigen Trennungen und (die nur in Notentexten zulässigen)
38   Trennungen nach führendem Vokal.
40     Club-a-bend, Ur-in-stinkt, Ä-o-nen, The-a-ter, Bi-o-lo-gie, O-bo-e
42   Anwendung: Texte zum Notensatz
45 alle:
46   Alle zulässigen Trennungen (außer bei Alternativen_), einschließlich
47   der explizit als ungünstig markierten:
49     Abend, Ur-in-stinkt, Äo-nen, The-a-ter, Bio-lo-gie
51   Anwendung: ?
53 permissiv:
54   Aussortieren sehr ungünstiger (mit „..“ markierter) Trennstellen.
56     Abend, Ur-instinkt, The-a-ter, Bio-lo-gie, Atom-ar-se-nal
58   Anwendung: schmalspaltiger Blocksatz
60 standard:
61   Derzeitige Auswahl
63   * Aussortieren von mit „.“ markierten Trennstellen
64   * Vermeiden einvokalischer Silben
66     Abend, Ur-instinkt, Thea-ter, Bio-lo-gie, Atom-arse-nal
68   Anwendung: Blocksatz, schmale bis mittlere Textspalten
70 Haupt- und Suffixtrennstellen
71   Alle Trennstellen an Wortfugen, nach Präfix und vor Suffix.
73     auf-fällig, Hanf-faser, höf-lich, affig, fällig
74     
75   Anwendung: Ligaturaufbruch
77 Haupttrennstellen:
78   Alle Trennstellen an Wortfugen und nach Präfix.
80     ab-seilen, Bio-logie, Treppen-ge-länder
82   Anwendung: Wortanalyse, Tests
84 Primärtrennstellen:
85   Haupttrennstellen der höchsten Hierarchie.
87     Park-eisenbahn, Treppen-geländer, un-zuverlässig, zwei-und-fünfzig
89 lesefreundlich:
90   Keine Trennstellen "in der Nähe" von "besseren" Trennstellen.
92     Abend-erzäh-lung, un-gemüt-lich
94   Anwendung: Flattersatz, Blocksatz in breiten Spalten, Web-Browser
96 Alternativen
97 ------------
99 Mit der Reform 1996 (vereinzelt auch schon eher ↗K71, ↗K44) wurden
100 Trennalternativen eingeführt, mit der Empfehlung, diese in einem Dokument
101 einheitlich zu handhaben.
103 Fremdwortsilben
104 ~~~~~~~~~~~~~~~
106 amtl. Regelwerk § 112 (vorher K86, K87)
108   In Fremdwörtern können die Verbindungen aus Buchstaben für einen
109   Konsonanten + l, n oder r entweder entsprechend § 110 getrennt werden,
110   oder sie kommen ungetrennt auf die neue Zeile.
112     no-b-le, Zy-k-lus, Ma-g-net, Fe-b-ru-ar, Hy-d-rant, Ar-th-ri-tis
114 verblasste Etymologie
115 ~~~~~~~~~~~~~~~~~~~~~
117 amtl. Regelwerk §113 (vorher K71, K44)
119   Wörter, die sprachhistorisch oder von der Herkunftssprache her
120   gesehen Zusammensetzungen oder Präfigierungen sind, aber nicht
121   mehr als solche empfunden oder erkannt werden, kann man entweder
122   nach § 108 oder nach § 109 bis § 112 trennen.
124   hi-n<auf, he-r<an, da-r<um, Chry-s<an-the-me, Hek-t<ar, Heliko<p-ter,
125   in-te-r>es-sant, Li-n<oleum, Pä-d<ago-gik
128 Im Duden kommt es dann zu „Trennclustern“ (Pä|d|i|a|t|rie).
129 Für die einheitliche Handhabung wählt ein Trennstil aus diesen
130 Alternativtrennstellen aus:
132 etymologisch:
133   Wie in den Regeln von 1901 (bzw. in der Fassung von 1979):
135   Zwei Konsonanten am Beginn einiger Silben in Fremdwörtern und
136   Trennung nach Etymologie auch bei „verblassten“ Fällen:
138     Ma-gnet, Kon-tra,         aber Bert-ram, Wand-rer
139     He-li-ko-pter, her-an
140   
141 modern:
142   Bevorzugung der formalen Sprechsilbentrennung.
144   Auch bei Fremdwörtern nur ein Konsonant am Silbenanfang,
145   keine Beachtung der „verblassten“ Etymologie:
147     Mag-net, Kont-ra,         wie Bert-ram, Wand-rer
148     He-li-kop-ter, he-ran
150 flatterhaft:
151   Beide Alternativen zulassen:
153     Ma-g-net, Kon-t-ra,
154     He-li-ko-p-ter, he-r-an
156 Duden:
157   Trennung nach den Empfehlungen der Dudenredaktion.
159   Nicht implementiert, da die Auswahlkriterien und Einzelfallbetrachtungen
160   der Dudenredaktion nicht einfach reproduziert werden können.
164 Einbuchstabige Silben
165 =====================
167 Traditionell enthalten die TeX-Trennmuster keine Trennstellen deren Abstand
168 zur Nachbartrennstelle einen Buchstaben beträgt. Dies ist eine *ästhetische*
169 Entscheidung um „Flatterbuchstaben“ zu vermeiden.
171 Bis 2017 war dieser Grundsatz auf der Auszeichnungsebene realisiert:
173 * Bei einvokalischen Silben wurde regelmäßig nur die zweite Trennstelle
174   ausgezeichnet (Opern=thea-ter).
176 * Bei Alternativtrennungen wurde nur die etymologisch begründete
177   (traditionelle) ausgezeichnet.
179 Mit Stand 2018-05-09 gibt es vier Anlässe für die Auszeichnung von
180 Trennstellen mit Abstand eins. (Die angegebenen „Filter“ sind Funktionen in
181 ``skripte/python/edit_tools/wortliste.py``.)
184 1. einvokalische Silben im Wortinneren
186    Weitgehend einheitlich in de-1901 und de1996.
188    Müssen für Notentext in der "wortliste" ausgezeichnet sein.
190    Zum Teil Nottrennungen (me-ri-di-.o-nal)
192    Zum Teil von der bisherigen Praxis (nimm stets die 2.) abweichende
193    Vorzugstrennung (La-sal-le-a-.ner, Athe-i-.sten (AR)).
196 2. einvokalische Silben am Wortanfang und Ende (auch in Komposita)
198    Einheitlich in de-1901 und de-1996: nicht zulässig außer in Notentext
200    Ausnahme: in de-1996 als Alternative zu verblassten Wortfugen (siehe 4.)
202    Können für Notentext über "Trennstilfilter" erzeugt werden.
203    Ausnahmen benötigen evt. einen eigenen Marker.
204    
205    Filter: scoretext()
207 3. Alternativtrennungen bei Fremdwortsilben nach § 112, z.B. Ma-g-net
209     etymologisch: Ma-gnet
210     Sprechsilben: Mag-net
212    Zwei alternative Nebentrennstellen (im einfachen oder suffigierten Wort).
214    Zwischen den Trennungen stehen nur Konsonanten.
215    Es können auch mehrere Buchstaben sein.
217    In Notentext immer nur eine der Alternativtrennungen.
218    
219    Filter: fremdwortsilben()
222 4. Alternativtrennungen an "verblassten" Wortfugen nach § 113,
223    z.B. he-r<ab, Ab<i-tur, He-li-ko<p-ter
225    Alternative zwischen Haupt- und Nebentrennstelle.
227    Zwischen den Trennungen stehen nur Konsonanten oder Vokale.
228    (Im "Trennstilfilter" zur Zeit nur ein Buchstabe beachtet.)
230    Im Notentext bei Vokalen zwei Trennungen, bei Konsonanten nur eine.
231    
232    Filter: verblasst()