From 9bc073b712f9f3cd89aca9f41f44e5b2a13af565 Mon Sep 17 00:00:00 2001 From: Guenter Milde Date: Thu, 27 Feb 2014 12:33:14 +0100 Subject: [PATCH] Beschreibung der Trennzeichen --- dokumente/README.wortliste | 111 +++++++++++++++++++++++++++++++-------------- 1 file changed, 76 insertions(+), 35 deletions(-) diff --git a/dokumente/README.wortliste b/dokumente/README.wortliste index 8c58f78..a84a712 100644 --- a/dokumente/README.wortliste +++ b/dokumente/README.wortliste @@ -47,26 +47,42 @@ Kennzeichnung der Trennstellen ============================== Die Charakterisierung und Wichtung der Trennstellen ist nicht vollständig. -Sie soll künftig die Nutzung der Wortliste für die Bestimmung der Güte -einer Trennstelle und für die regelbasierte Entscheidung über den Aufbruch -typographischer Ligaturen und die Schreibung des S-Lautes (rund-s vs. -lang-s) ermöglichen. -Folgende Zeichen kennzeichnen Trennstellen: +Kategorisierung +--------------- - · nicht kategorisiert +Trennstellen an der Grenze sinnbildender Einheiten (Morpheme) werden +speziell gekennzeichnet: = an Wortfugen (zwischen Grundmorphemen): Wort=fu-ge - | nach Präfix oder Verbalpartikel: Vor|sil-be, auf|zäh-len - - innerhalb eines Morphems oder vor einem Suffix: in-nen, frag-lich + < nach Präfix oder Verbalpartikel: Vor vor Wortbildungssuffix: Gleich>heit, Freund>schaf-ten -* Die Unterscheidung, ob ein Wortbestandteil ein Präfix oder ein Grundmorphem - ist, ist oft nicht eindeutig: + - innerhalb eines Morphems: ge-hen + · nicht kategorisiert: acker·bau·trei·ben·de - drauf=los oder drauf|los? +Motivation: -* `Etymologische' Präfixe, die im heutigen Sprachverständnis nicht mehr als - Präfixe wahrgenommen werden, sind nicht speziell markiert: +* Die Trennung an sinnbildenden Einheiten fördert den Lesefluss und ist + daher zu bevorzugen + +* Die Markierung von Morphemgrenzen hilft bei der regelbasierten + Entscheidung über den Aufbruch typographischer Ligaturen und die + Schreibung des S-Lautes in Frakturschrift (Rund-S `s' vs. Lang-S `ſ'). + +Anmerkungen: + +* Die Kategorisierung der Trennstellen ist nicht abgeschlossen. + Zur Zeit sind einige Trennstellen nach Präfix oder Verbalpartikel und + viele Trennstellen vor Suffixen noch mit `-' bezeichnet. + +* Die Unterscheidung, ob ein Wortbestandteil ein Präfix, Suffix oder ein + Grundmorphem ist, ist oft nicht eindeutig: + + em-porord-nung An + ordn + ung + + +Wichtung +-------- Für die Bindungsstärke B von Trennstellen verschiedener Kategorien gilt -B(-) > B(|) > B(=): - Aus|wahl=lis-te (Aus + wahl) + (lis-te) - fern=ab|ge|le-gen fern + (ab + (ge + (le-gen))) + B(`-') > B(`<') = B(`>') > B(`=') + +das heißt: + + Auschen Abend + (lüft + chen) Präfixe sind `rechtsbindend': - un|voll|stän-dig un + (voll + ständig) - un|aus|ge|go-ren un + (aus + (ge + (go-ren))) + unlo-sig>keit (Acht + losig) + keit + +Die unterschiedliche Bindungsstärke von Trennungen der Kategorie `-' und `=' kann durch Doppellung des Trennzeichens markiert werden: - drei--fa-che Wortbildungssuffix -fa-che Alp=horn==trio (Alp + horn) + trio Berg===fünf=fin-ger==kraut Berg + ((fünf + (fin-ger)) + kraut) @@ -103,16 +133,15 @@ entweder gleichwertige Wortbestandteile, Zerlegungsalternativen oder sind Abend=brot=zeit (Abend + brot) + zeit oder Abend + (brot + zeit) -Das gemischte Trennzeichen »|=« kennzeichnet die Bindungverhältnisse, +Das gemischte Trennzeichen `<=' kennzeichnet die Bindungverhältnisse, wenn sich ein echter Präfix auf das gesamte folgende Kompositum bezieht: - un|=wahr=schein-lich un + (wahr + scheinlich) + un<=wahr=schein-lich un + (wahr + scheinlich) -Das gemischte Trennzeichen »-=« kennzeichnet die Bindungsverhältnisse, -wenn sich beispielsweise ein Suffix auf das gesamte vorhergehende -Kompositum bezieht +Das gemischte Trennzeichen `>=' kennzeichnet die Bindungsverhältnisse, wenn +sich ein Suffix auf das gesamte vorhergehende Kompositum bezieht - an-dert=halb-=fach ((an+dert) + halb) + fach + an-dert=halb>=fach ((an+dert) + halb) + fach Das erste Zeichen eines gemischten Trennzeichens kennzeichnet die Kategorie der Trennstelle. @@ -121,6 +150,9 @@ Ebenso wie die Charakterisierung ist die Markierung der Bindungstärke unvollständig. +Ungünstige Trennungen +--------------------- + Ungünstige (irreführende oder sinnentstellende) Trennstellen sind mit einem Punkt markiert. Der Punkt ersetzt das Trennzeichen für nicht kategorisierte Trennstellen oder folgt auf Trennzeichen zur Kategorisierung: @@ -130,9 +162,9 @@ Trennstellen oder folgt auf Trennzeichen zur Kategorisierung: Besonders ungünstige Trennstellen können mit mehreren Punkten gekennzeichnet sein. - . ungünstig: An·den.ken, Ost=en.de, Re|im|.port + . ungünstig: An·den.ken, Ost=en.de, Re