From 55869575d9aea5a3e3197bda235a4546349b8b65 Mon Sep 17 00:00:00 2001 From: Werner Lemberg Date: Tue, 18 Mar 2014 06:25:53 +0100 Subject: [PATCH] Revidiere `README.wortliste'. --- dokumente/README.wortliste | 155 +++++++++++++++++++++++++-------------------- 1 file changed, 87 insertions(+), 68 deletions(-) diff --git a/dokumente/README.wortliste b/dokumente/README.wortliste index ac0a7bd..8279d56 100644 --- a/dokumente/README.wortliste +++ b/dokumente/README.wortliste @@ -9,22 +9,22 @@ Bedeutung der Felder anderenfalls leer 3 falls Feld 2 leer, Trennung nach traditioneller Rechtschreibung 4 falls Feld 2 leer, Trennung nach reformierter Rechtschreibung (2006) - 5 falls Feld 2 leer, Trennung für Wortform, die entweder in - der Schweiz oder mit Großbuchstaben oder Kapitälchen benutzt wird - und für traditionelle und reformierte Rechtschreibung identisch ist - 6 falls Feld 5 leer, Trennung für Wortform, die entweder in - der Schweiz oder mit Großbuchstaben oder Kapitälchen benutzt wird, + 5 falls Feld 2 leer, Trennung für Wortform, die entweder in der + Schweiz oder mit Großbuchstaben oder Kapitälchen benutzt wird und + für traditionelle und reformierte Rechtschreibung identisch ist + 6 falls Feld 5 leer, Trennung für Wortform, die entweder in der + Schweiz oder mit Großbuchstaben oder Kapitälchen benutzt wird, traditionelle Rechtschreibung - 7 falls Feld 5 leer, Trennung für Wortform, die entweder in - der Schweiz oder mit Großbuchstaben oder Kapitälchen benutzt wird, + 7 falls Feld 5 leer, Trennung für Wortform, die entweder in der + Schweiz oder mit Großbuchstaben oder Kapitälchen benutzt wird, reformierte Rechtschreibung (2006) 8 falls Feld 5 leer und nicht identisch mit Feld 6, Trennung nach - (deutsch)schweizerischer, traditioneller Rechtschreibung; insbesondere - Wörter mit `sss' gefolgt von einem Vokal, die wie andere - Dreifachkonsonanten gehandhabt wurden (also anders, als der Duden früher - vorgeschrieben hat), z.B. `süssauer' + (deutsch)schweizerischer, traditioneller Rechtschreibung; + insbesondere Wörter mit „sss“ gefolgt von einem Vokal, die wie + andere Dreifachkonsonanten gehandhabt wurden (also anders, als der + Duden früher vorgeschrieben hat), z.B. „süssauer“ -Leere Felder sind mit `-x-' markiert (`x' ist die Feldnummer); Felder 3 +Leere Felder sind mit „-x-“ markiert („x“ ist die Feldnummer); Felder 3 und 4 als auch Felder 6, 7 und 8 treten immer simultan auf, um die Lesbarkeit zu erhöhen. @@ -38,15 +38,16 @@ Feldnummer haben Priorität. Sortierung ========== -Die Sortierung erfolgt nach Dudensortierung. Die genauen Regeln sind in der -Datei `skripte/sort.py' beschrieben, welche auch zur maschinellen Sortierung -der Liste verwendet werden kann. +Die Sortierung erfolgt nach Dudensortierung. Die genauen Regeln sind in +der Datei „skripte/sort.py“ beschrieben, welche auch zur maschinellen +Sortierung der Liste verwendet werden kann. Kennzeichnung der Trennstellen ============================== -Die Charakterisierung und Wichtung der Trennstellen ist nicht vollständig. +Die Charakterisierung und Wichtung der Trennstellen ist nicht +vollständig. Kategorisierung --------------- @@ -64,29 +65,29 @@ speziell gekennzeichnet: Motivation: * Die Trennung an sinnbildenden Einheiten fördert den Lesefluss und ist - daher zu bevorzugen + daher zu bevorzugen. * Die Markierung von Morphemgrenzen hilft bei der regelbasierten Entscheidung über den Aufbruch typographischer Ligaturen und die - Schreibung des S-Lautes in Frakturschrift (Rund-S `s' vs. Lang-S `ſ'). + Schreibung des S-Lautes in Frakturschrift (Rund-S „s“ vs. Lang-S „ſ“). Anmerkungen: -* Die Kategorisierung der Trennstellen ist nicht abgeschlossen. - Zur Zeit sind einige Trennstellen nach Präfix oder Verbalpartikel und - viele Trennstellen vor Suffixen noch mit `-' bezeichnet. +* Die Kategorisierung der Trennstellen ist nicht abgeschlossen. Zur + Zeit sind einige Trennstellen nach Präfix oder Verbalpartikel und + viele Trennstellen vor Suffixen noch mit „-“ bezeichnet. * Die Unterscheidung, ob ein Wortbestandteil ein Präfix, Suffix oder ein Grundmorphem ist, ist oft nicht eindeutig: - em-por Suffixgrenze mittlere Bindung + < Präfixgrenze mittlere Bindung + > Suffixgrenze mittlere Bindung - - Sprechsilben starke Bindung + - Sprechsilben starke Bindung Beispiele: - Auschen Abend + (lüft + chen) + Auschen Abend + (lüft + chen) -Präfixe sind `rechtsbindend': +Präfixe sind „rechtsbindend“: - unlo-sig>keit (Acht + losig) + keit + Acht>lo-sig>keit (Acht + losig) + keit Eine schwächere Bindung an Trennstellen kann durch Doppelung des Trennzeichens markiert werden: - Alp=horn==trio (Alp + horn) + trio - Berg===fünf=fin-ger==kraut Berg + ((fünf + (fin-ger)) + kraut) + Alp=horn==trio (Alp + horn) + trio + Berg===fünf=fin-ger==kraut Berg + ((fünf + (fin-ger)) + kraut) Trennstellen gleicher Kategorie ohne Doppelung bezeichnen entweder gleichwertige Wortbestandteile, Zerlegungsalternativen oder sind (noch) nicht gewichtet: - Abend=brot=zeit (Abend + brot) + zeit oder Abend + (brot + zeit) + Abend=brot=zeit (Abend + brot) + zeit + oder + Abend + (brot + zeit) -Das gemischte Trennzeichen `<=' kennzeichnet die Bindungsverhältnisse, +Das gemischte Trennzeichen „<=“ kennzeichnet die Bindungsverhältnisse, wenn sich ein Präfix auf mehrere Teile eines Kompositums bezieht: - un<=wahr=schein-lich un + (wahr+scheinlich) - Ober<=be' kennzeichnet die Bindungsverhältnisse, wenn -sich ein Suffix auf das vorhergehende Kompositum bezieht +Das gemischte Trennzeichen „=>“ kennzeichnet die Bindungsverhältnisse, +wenn sich ein Suffix auf das vorhergehende Kompositum bezieht: - an-dert=halb=>fach ((an+dert) + halb) + fach - zwei==ein=halb==>fa-che (zwei + (ein+halb)) + fache - Vorbar>keit (((Vor+her) + sag) + bar) + keit + an-dert=halb=>fach (andert + halb) + fach + zwei==ein=halb==>fa-che (zwei + (ein + halb)) + fache + Vorbar>keit (((Vor + her) + sag) + bar) + keit -Die Bindungsstärke ist umgekehrt zur `Güte' (oder dem `Gewicht') einer -Trennstelle:¹ +Sortiert man die Trennzeichen nach der Bindungsstärke, ergeben sich +folgende Relationsketten: + + - > = => == ==> === ... + - < = <= == <== === ... + +Im weiteren ist die Bindungsstärke umgekehrt proportional zur „Güte“ +(oder dem „Gewicht“) einer Trennstelle:¹ schwache Bindung -> Vorzugstrennungen mittlere Bindung -> mittlere Trenngüte @@ -163,23 +172,30 @@ Trennstelle:¹ Beispiel: - Aus- Auswahl- Auswahllis- - wahlliste liste te + schwach: Auswahl- + liste -¹ In eine genauere `Gütebestimmung' geht auch der Abstand zu anderen - Trennstellen und die Position im Wort ein.) + mittel: Aus- + wahlliste + stark: Auswahllis- + te Ebenso wie die Kategorisierung ist die Markierung der Bindungsstärke unvollständig. +¹ In eine genauere „Gütebestimmung“ geht auch der Abstand zu anderen + Trennstellen und die Position im Wort ein. + + Ungünstige Trennungen --------------------- -Ungünstige (irreführende oder sinnentstellende) Trennstellen sind mit einem -Punkt markiert. Der Punkt ersetzt das Trennzeichen für nicht kategorisierte -Trennstellen oder folgt auf Trennzeichen zur Kategorisierung: +Ungünstige (irreführende oder sinnentstellende) Trennstellen sind mit +einem Punkt markiert. Der Punkt ersetzt das Trennzeichen für nicht +kategorisierte Trennstellen oder folgt auf Trennzeichen zur +Kategorisierung: An·den.ken, Ost=en-.de @@ -191,8 +207,8 @@ gekennzeichnet sein. ... äußerst ungünstig: An