Trennstile: Update und Dokumentation, trenne_gn().
[wortliste.git] / dehyph-exptl / dehyph-exptl.tex
blob1da6427e15757235e7da5489bb0c75be1ddf68f4
1 %%% Artikelklasse mit:
2 %%% * Grundschriftgröße 11 Punkt,
3 %%% * klassischem Satzspiegel,
4 %%% * flachem Inhaltsverzeichnis,
5 %%% * Tabellenüberschriften.
6 \documentclass[11pt,
7 DIV=9,
8 toc=flat,
9 captions=tableheading,
10 abstract=on]{scrartcl}
12 %%% Eingabekodierung ist UTF-8.
13 \usepackage[utf8]{inputenc}
15 %%% Schrifteinstellung:
16 %%% * Grundschrift Palatino,
17 %%% * Akzidenzschrift Bera Sans,
18 %%% * Schreibmaschinenschrift Latin Modern Typewriter.
19 \usepackage[T1]{fontenc}
20 \usepackage[osf]{mathpazo}
21 \usepackage[scaled=0.85]{berasans}
22 \renewcommand*{\ttdefault}{lmtt}
23 \usepackage{textcomp}
25 \linespread{1.1}
26 \usepackage[expansion=true,
27 letterspace=80]{microtype}
29 %%% Lade einige Pakete.
30 \usepackage{ifthen}
31 \usepackage{calc}
32 \usepackage{multicol}
33 \usepackage{paralist}
34 \usepackage{fncylab}
35 \usepackage{tabularx}
36 \usepackage{booktabs}
37 \usepackage{ragged2e}
38 \usepackage{hologo}
39 \usepackage[defaultlines=4,
40 all]{nowidow}
42 \newcolumntype{L}{>{\raggedright\arraybackslash}X}
44 \usepackage{listings}
45 \lstloadlanguages{[LaTeX]TeX, sh}
46 \lstset{
47 basicstyle=\ttfamily,
48 keywordstyle={},
49 commentstyle={},
50 columns=flexible,
51 showspaces=false,
52 showstringspaces=false,
53 % aboveskip=12pt,
54 % belowskip=12pt,
55 % frame=tb,
56 % framesep=8pt,
57 % framerule=2pt,
58 xleftmargin=6pt,
59 xrightmargin=6pt,
60 % framexleftmargin=6pt,
61 % framexrightmargin=6pt,
62 inputencoding=utf8,
63 extendedchars=true,
64 literate={ä}{{\"a}}1 {ö}{{\"o}}1 {ü}{{\"u}}1,
66 \lstdefinestyle{LaTeX}{
67 language=[LaTeX]TeX,
68 basicstyle=\ttfamily,
69 keywordstyle={},
70 commentstyle={\itshape}
72 \lstdefinestyle{shell}{
73 language=sh,
74 basicstyle=\ttfamily,
75 keywordstyle={},
76 commentstyle={\itshape},
77 upquote=true % Gravis korrekt anzeigen
79 \lstdefinestyle{Text}{
80 language=,
81 basicstyle=\ttfamily,
82 keywordstyle={},
83 commentstyle={}
86 \usepackage{needspace}
88 %%% Literaturverweise in runden Klammern mit Semikolon als Trenner.
89 % \usepackage[round,semicolon]{natbib}
90 % \renewcommand*{\bibnumfmt}[1]{(#1)}
92 %%% Literaturverzeichnis mit Sprachunterstützung.
93 \usepackage[fixlanguage]{babelbib}
94 \bibliographystyle{babalpha}
95 %%% Babelbib fordert trotz fixlanguage zuviele Sprachen an.
96 \usepackage[english,
97 german,
98 ngerman]{babel}
100 %%% Einstellungen für interaktive PDF-Dokumente.
101 \usepackage[rgb,x11names]{xcolor}
102 \usepackage[hyperref]{zref}
103 \usepackage{hyperref}
104 \hypersetup{
105 pdftitle={dehyph-exptl},
106 pdfauthor={Die deutschsprachige Trennmustermannschaft},
107 pdfkeywords={TeX,
108 deutsche Rechtschreibung,
109 Trennmuster,
110 computergestützte Worttrennung}
112 \hypersetup{
113 ngerman,% Für \autoref.
114 pdfstartview={XYZ null null null},% Viewer bestimmt Zoomfaktor.
115 colorlinks,
116 linkcolor=RoyalBlue3,
117 urlcolor=Chocolate4,
118 citecolor=DeepPink2
120 \newcommand*{\regelref}[1]{%
121 \begingroup
122 \renewcommand*{\Itemautorefname}{Regel}%
123 \autoref{#1}%
124 \endgroup%
127 %%% Schriftfestlegungen.
128 \setkomafont{title}{\normalcolor\normalfont}
129 \setkomafont{sectioning}{\normalcolor\normalfont}
130 \setkomafont{section}{\Large}
131 \setkomafont{subsection}{\Large\itshape}
132 \setkomafont{descriptionlabel}{\normalfont\itshape}
134 %%% Einige Makros für logische Auszeichnungen definieren.
135 \newcommand*{\Abk}[1]{\mbox{\textsc{\lsstyle#1}}}
136 \newcommand*{\Paket}[1]{\textsf{#1}}
137 \newcommand*{\Programm}[1]{\lstinline[style=shell]{#1}}
138 \newcommand*{\Datei}[1]{\texttt{#1}}
140 \colorlet{falschcol}{red!80!black}
141 \colorlet{tradcol}{green!50!black}
142 \colorlet{reformcol}{green!75!black}
143 \colorlet{unerwcol}{red!60!black}
145 \newcolumntype{T}{>{\color{tradcol}}l}
146 \newcolumntype{R}{>{\color{reformcol}}l}
147 \newcolumntype{U}{>{\color{unerwcol}}l}
149 \newcommand*{\trennung}[2]{%
150 \makebox[0pt][l]{%
151 \color{#1}%
152 \smash{\rule[-3.5pt]{\widthof{#2}}{.7pt}}% Schriftabhängig.
156 \newcommand*{\ftr}[1]{\trennung{falschcol}{#1}}% Falsche Trennung.
158 %%% Satzspiegel erneut berechnen.
159 \typearea{last}
162 %%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
164 \begin{document}
166 %%% Trennausnahmen definieren.
167 \hyphenation{
168 Back-end
169 hyph-subst
170 Ent-wick-ler-re-po-si-to-ri-um
171 Wort-her-kunft
172 Not-tren-nung
173 Trenn-al-go-rith-mus
174 um-bruch-in-kom-pa-tib-le
177 %%% Protokollierung der Trennungen für findhyph.
178 %\tracingparagraphs=1
180 %%% Dokumenttitel.
181 \author{Die deutschsprachige Trennmustermannschaft}
182 \title{\Paket{dehyph-exptl}\thanks{This document describes the
183 \Paket{dehyph-exptl} package v0.5.}}
184 \subtitle{Experimentelle Trennmuster für die deutsche Sprache}
185 \maketitle
187 %%% Zweisprachige Zusammenfassung.
188 \selectlanguage{english}
189 \begin{abstract}
190 This document describes the experimental hyphenation patterns for
191 the German language, covering traditional and reformed orthography
192 for several varieties of Standard German. When using
193 \hologo{XeTeX}/\hologo{LuaTeX}, these patterns are used
194 automatically. In other cases, they have to be loaded explicitly.
195 More information can be found in the Trennmuster-Wiki%
196 \footnote{\url{http://projekte.dante.de/Trennmuster}} (in German).
197 \end{abstract}
199 \selectlanguage{ngerman}
200 \begin{abstract}
201 Dieses Dokument beschreibt die experimentellen Trennmuster für die
202 deutsche Sprache, die das in Deutschland, Österreich und der Schweiz
203 gebräuchliche Standarddeutsch in der traditionellen und reformierten
204 Rechtschreibung abdecken. Bei Nutzung von
205 \hologo{XeTeX}/\hologo{LuaTeX} werden diese Muster automatisch
206 verwendet; in anderen Fällen müssen sie i.\,d.\,R. ausdrücklich
207 geladen werden.
208 \end{abstract}
210 \vfill
211 \begingroup
212 \em\large
214 \begin{center}
215 Warnung!
216 \end{center}
218 Diese Trennmuster befinden sich im experimentellen Status. Sie können
219 auf dem \Abk{ctan} und in den \hologo{TeX}"=Verteilungen jederzeit
220 durch umbruchinkompatible aktualisierte Versionen ersetzt werden. Für
221 Anwendungen, die einen dauerhaft stabilen Umbruch erfordern, sind sie
222 nur geeignet, falls manuell eine feste Version installiert wird.
223 \endgroup \vfill
225 \clearpage
226 %%% Zweispaltiges Inhaltsverzeichnis.
227 \begin{multicols}{2}
228 \RaggedRight
229 \small
230 \selectlanguage{ngerman}
231 \tableofcontents
232 \end{multicols}
235 \section{Einleitung}
236 \label{sec:einleitung}
238 Der in \hologo{TeX} implementierte Trennalgorithmus arbeitet
239 musterbasiert~\cite{liang:1983}. Prinzipiell können mit einem solchen
240 Algorithmus nicht alle möglichen Wörter korrekt getrennt werden. Die
241 Qualität der Worttrennung einer Sprache wird jedoch maßgeblich von der
242 Qualität der Wortliste beeinflusst, aus der die verwendeten
243 Trennmuster berechnet wurden.
245 Obwohl die herkömmlichen Trennmuster für die deutsche Sprache bei der
246 Worttrennung in gewöhnlichen Texten eine akzeptable Fehlerrate
247 erreichen, enthalten sie doch eine Reihe von Schwächen:%
248 \footnote{Diese Liste bezieht sich auf die Trennmusterdateien
249 \Datei{dehypht.tex}, Version~3.2a vom 3.\,3.\,1999, und
250 \Datei{dehyphn.tex}, Version~31 vom 7.\,5.\,2001.}
252 \bigskip\smallskip
253 \needspace{4\baselineskip}
254 \noindent\textit{traditionelle und reformierte Rechtschreibung}
256 \begin{itemize}
257 \item In zusammengesetzten Wörtern treten häufig Trennfehler an
258 Wortfugen auf.
260 \item Fremdwörter mit akzentuierten Buchstaben werden mangelhaft
261 getrennt: ">C\ftr{af}é"<, ">Ci-tr\ftr{}n"<, ">F\ftr{}on"<,
262 ">vo\ftr{il}à"<.
264 \item Die Trennmusterdateien enthalten eine Mischung aus \Abk{t1}-
265 sowie unvollständigen \Abk{ot1}-kodierten Mustern. Mit Erscheinen
266 von 16-Bit"=fähigen \hologo{TeX}"=Varianten werden sauber
267 \Abk{utf-8}"=kodierte Trennmuster nötig~\cite{miklavec:2008}.
268 \end{itemize}
270 \bigskip
271 \needspace{4\baselineskip}
272 \noindent\textit{traditionelle Rechtschreibung}
274 \begin{itemize}
275 \item Die herkömmlichen Trennmuster für die traditionelle deutsche
276 Rechtschreibung können mit \Programm{patgen} nicht reproduziert
277 werden, da die zugrundeliegende Wortliste verschollen ist. Die
278 Pflege der Trennmuster ist daher schwierig bis unmöglich. Für freie
279 Software ist dies kein zufriedenstellender Zustand.
281 \item Umfang und Qualität der ursprünglichen Wortliste lassen sich
282 nicht mehr einschätzen. Für die Trennmuster in traditioneller
283 Rechtschreibung existiert jedoch inzwischen eine Ausnahmeliste mit
284 über 3500 korrigierten Trennungen einfacher Wörter
285 \cite{lemberg:2003, lemberg:2005}.%
286 \footnote{\url{http://mirrors.ctan.org/language/hyphenation/dehyph/dehyphtex.tex}}
288 \item Wird in der traditionellen Rechtschreibung \emph{ß} durch
289 \emph{ss/SS} oder \emph{sz/SZ} ersetzt, so bleibt die Trennung davon
290 unberührt. Die herkömmlichen Trennmuster berücksichtigen diese
291 Regel nicht und trennen häufig den Ersatz:
292 \textls{">GR\ftr{ÖS"~S}E"<}, \textls{">GR\ftr{ÜS"~S}E"<},
293 \textls{">M\ftr{AS"~S}ES"<}.%
294 \footnote{Die Trennung der herkömmlichen Muster entspricht den
295 Regeln der deutschen Standardsprache in der Schweiz, obwohl diese
296 Sprachvarietät vom Paket \Paket{Babel} bis 2013 nicht offiziell
297 unterstützt wurde. \Paket{Babel} versucht den Mangel mit Hilfe
298 des Kürzels \lstinline[style=LaTeX]+\"S+ zu kompensieren.}
300 \item Abweichende Schreibweisen, die in der traditionellen
301 Rechtschreibung in Österreich und der Schweiz verwendet werden,
302 werden mangelhaft getrennt: ">Gro\ftr{s"~so}n-kel"<,
303 ">Ku\ftr{s"~sh}and"<, ">Ma\ftr{ssn}ah-me"<, ">mi\ftr{s"~sa}ch-ten"<
304 (nur Schweiz) und ">Ex-pre\ftr{ssz}ug"<, ">Fit-ne\ftr{s"~sc}en-ter"<,
305 ">Fit-ne\ftr{sst}rai-ner"<.
306 \end{itemize}
308 \bigskip
309 \needspace{4\baselineskip}
310 \noindent\textit{reformierte Rechtschreibung}
312 \begin{itemize}
313 \item Die Trennmuster für die reformierte deutsche Rechtschreibung
314 wurden nicht mit \Programm{patgen} aus einer Wortliste erstellt.
315 Stattdessen wurden die Trennmuster für die traditionelle
316 Rechtschreibung von Hand an die reformierten Regeln
317 angepasst~\cite{schmidt:1998}. Aus diesem Grund ist die
318 Worttrennung mit den Trennmustern für die reformierte
319 Rechtschreibung etwas schlechter als mit den Trennmustern für die
320 traditionelle Rechtschreibung.
321 \end{itemize}
323 Das Projekt \emph{Freie Wortlisten und Trennmuster für die deutsche
324 Sprache} hat sich das Ziel gesetzt, neue Trennmuster hoher Qualität
325 für die deutsche Sprache zu erstellen, die die genannten Probleme
326 ausräumen.
328 Den experimentellen Trennmustern dieses Pakets liegt eine Wortliste
329 mit den etwa fünfhunderttausend häufigsten Wörtern der deutschen
330 Sprache zugrunde. Vermutlich ist diese Liste erheblich umfangreicher
331 als die ursprüngliche Wortliste, in der Worthäufigkeiten
332 wahrscheinlich überhaupt nicht berücksichtigt wurden. Die verwendete
333 Wortliste deckt das in Deutschland, Österreich und der Schweiz
334 gebräuchliche Standarddeutsch ab.
336 Mit den vorliegenden Trennmustern sollte für nicht"=fachsprachliche
337 Wörter eine sehr gute Trennqualität erreicht werden. Insbesondere
338 sollte sich die Trennung häufig auftretender zusammengesetzter Wörter
339 verbessern.
342 \section{Verwenden der Trennmuster}
343 \label{sec:verwenden}
345 Die experimentellen Trennmuster werden durch zwei verschiedene
346 \hologo{TeX}"=Pakete zur Verfügung gestellt, die beide in einer
347 vollständigen Installation einer aktuellen \hologo{TeX}"=Distribution
348 enthalten sein sollten.
350 Das Paket \Paket{hyph-utf8} enthält Trennmuster für alle von
351 \hologo{TeX} unterstützten Sprachen. Für die deutsche Sprache sind
352 die experimentellen Muster enthalten. Diese werden standardmäßig nur
353 von \hologo{XeTeX}, \hologo{LuaTeX} und p\TeX\footnote{Eine in Japan
354 populäre \TeX-Variante.} sowie von allen \hologo{TeX}"=Varianten für
355 die Schweizer Varietät der deutschen Sprache in traditioneller
356 Rechtschreibung\footnote{Diese Varietät wird erst seit dem Jahr 2013
357 unterstützt, sodass keine Abwärtskompatibilität erforderlich ist.}
358 benutzt. In den übrigen Fällen wird dagegen auf die herkömmlichen
359 Trennmuster zurückgegriffen.
361 Das Paket \Paket{dehyph-exptl} enthält die experimentellen
362 Trennmuster für die deutsche Sprache. Es hat den Zweck, diese den
363 Nutzern der älteren \hologo{TeX}"=Varianten wie \hologo{pdfTeX}
364 zugänglich zu machen. Die hierfür nötigen Vorkehrungen werden unten
365 beschrieben.
367 Siehe \autoref{sec:fragen} für Hinweise, wie die Version der in beiden
368 Paketen enthaltenen Muster ermittelt werden kann.
370 Zur manuellen Installation einer bestimmten Version der
371 experimentellen Trennmuster siehe \autoref{sec:installation}.
373 Beachte, in den folgenden Abschnitten ist \verb+<datum>+ durch das bei
374 der Installation angegebene Datum in \Abk{iso}"=Notation
375 (\verb+JJJJ-MM-TT+) oder die Zeichenkette \verb+latest+ zu ersetzen.
378 \subsection{Sprachvarietät und Rechtschreibung}
379 \label{sec:varietaeten}
381 Experimentelle Trennmuster stehen für die Worttrennung der deutschen
382 Sprache in der traditionellen und der reformierten Rechtschreibung zur
383 Verfügung. Die Trennmuster unterstützen die drei in Deutschland,
384 Österreich und der Schweiz gebräuchlichen Hauptvarietäten der
385 deutschen Standardsprache. \autoref{tab:varietaeten} zeigt die
386 Trennmuster, die abhängig von gewünschter Varietät und Rechtschreibung
387 in einem Dokument zu aktivieren sind.
389 \begin{table}
390 \centering
391 \caption{Die unterstützten Varietäten und Rechtschreibungen}
392 \label{tab:varietaeten}
393 \begin{tabular}{l>{\ttfamily}l}
394 \normalfont Sprachvarietät
395 & Trennmusterbezeichner\\
396 \addlinespace\toprule\addlinespace
397 \hspace*{-\tabcolsep}\normalfont\emph{traditionelle Rechtschreibung}\\
398 Deutschland, Österreich
399 & german-x-<datum>\\
400 Schweiz
401 & gswiss-x-<datum>\\\addlinespace
402 \hspace*{-\tabcolsep}\normalfont\emph{reformierte Rechtschreibung}\\
403 Deutschland, Österreich, Schweiz
404 & ngerman-x-<datum>\\
405 \end{tabular}
406 \end{table}
408 Varietäten, die sich nur in der Verwendung und Schreibung einzelner
409 Wörter voneinander unterscheiden, können durch gemeinsame Trennmuster
410 unterstützt werden.
411 % Die Eingabewortliste für \Programm{patgen} ist dann eine Vereinigung
412 % der den Varietäten entsprechenden Wortlisten.
413 Zum Beispiel werden Besonderheiten der österreichischen
414 Standardsprache in den Trennmustern für die Standardsprache
415 Deutschlands berücksichtigt. Österreichische und deutsche Anwender
416 können daher dieselben Trennmuster verwenden (wie das auch schon bei
417 den herkömmlichen Trennmustern der Fall war).
419 Aufgrund unvereinbarer Trennregeln in der traditionellen
420 Rechtschreibung der Standardsprachen Deutschlands/""Österreichs und
421 der Schweiz werden für die letztere Varietät eigene Trennmuster
422 bereitgestellt.
424 Mit der Rechtschreibreform 1996 wurden die Trennregeln aller drei
425 Standardsprachen so weit angeglichen, dass für die reformierte
426 Rechtschreibung einheitliche Trennmuster für alle drei unterstützten
427 Sprachvarietäten bereitgestellt werden können.
429 \subsection{Aktivieren der Trennmuster}
430 \label{sec:aktivieren}
432 Im Folgenden wird dargestellt, wie die experimentellen Trennmuster bei
433 Verwendung unterschiedlicher \hologo{TeX}"=Varianten geladen werden
434 können.
436 Das Ergebnis für die traditionelle und reformierte Rechtschreibung mit
437 herkömmlichen und experimentellen Trennmustern ist in
438 \autoref{tab:trennvarianten} zusammengefasst. Ob die experimentellen
439 Trennmuster korrekt aktiviert werden, kann mit dem folgenden kleinen
440 Dokument getestet werden, dessen Ausgabe in der \texttt{log}"=Datei
441 erscheint.
443 \begin{lstlisting}[style=LaTeX]
444 \begin{document}
445 \showhyphens{löste Fassade modernste Abendstern Mordopfer}
446 \end{document}
447 \end{lstlisting}
449 %\suppressfloats[t]
450 \begin{table*}
451 \centering
452 \caption{Trennvarianten}
453 \label{tab:trennvarianten}
454 \begin{tabular}{llll}
455 \multicolumn{2}{c}{\itshape traditionelle Rechtschreibung} &
456 \multicolumn{2}{c}{\itshape reformierte Rechtschreibung}\\
457 herkömmlich & experimentell & herkömmlich & experimentell\\
458 \addlinespace\toprule\addlinespace
459 l\ftr{ös-t}e & lö-ste & lös-te & lös-te\\
460 Fas-sa-de & Fas-sa-de & Fa\ftr{ss}a-de & Fas-sa-de\\
461 mo-\ftr{d-e}rn-ste & mo-dern-ste & mo-\ftr{d-e}rns-te & mo-derns-te\\
462 Abend-stern & Abend-stern & Aben\ftr{ds-t}ern & Abend-stern\\
463 Mo\ftr{r-do}p-fer & Mord-op-fer & Mo\ftr{r-do}p-fer & Mord-op-fer\\
464 \end{tabular}
465 \end{table*}
467 \subsubsection{Plain-\TeX}
468 \label{subsubsec:PlainTeX}
470 Bei Verwendung eines \hologo{eTeX}"=basierten Compilers
471 (\Programm{etex}, \Programm{pdftex}, \Programm{xetex} oder
472 \Programm{luatex}) steht der Befehl \verb+\uselanguage+ zum Laden von
473 Trennmustern zur Verfügung. Er akzeptiert neben anderen die Argumente
474 \texttt{german}, \texttt{ngerman} und \texttt{swissgerman} (nicht
475 jedoch \texttt{austrian}, \texttt{naustrian} und
476 \texttt{nswissgerman}).\footnote{Die zulässigen Sprachbezeichnungen
477 finden sich in der Datei \Datei{language.def} der
478 \hologo{TeX}"=Installation.} Um die Silbentrennung gemäß
479 reformierter deutscher Rechtschreibung zu aktivieren, ist also
480 folgender Befehl ausreichend:
482 \begin{lstlisting}[style=LaTeX]
483 \uselanguage{ngerman}
484 \end{lstlisting}
486 Die Compiler \Programm{xetex} und \Programm{luatex} verwenden für alle
487 definierten Varietäten der deutschen Sprache die experimentellen
488 Trennmuster, die mit dem Paket \Paket{hyph-utf8} installiert sind;
489 \Programm{etex} und \Programm{pdftex} tun dies nur für
490 \texttt{swissgerman}.
492 Für die Varietäten \texttt{german} und \texttt{ngerman} laden
493 \Programm{etex} und \Programm{pdftex} hingegen aus Gründen der
494 Abwärtskompatibilität die herkömmlichen Trennmuster. Die
495 experimentellen Trennmuster können am einfachsten aktiviert werden,
496 indem etwa \lstinline[style=LaTeX]+\uselanguage{ngerman}+ durch den
497 folgenden Befehl ersetzt wird:
499 \begin{lstlisting}[style=LaTeX]
500 \uselanguage{ngerman-x-latest}
501 \end{lstlisting}
503 Auf entsprechende Weise ist es mit allen Compilern möglich, eine
504 alternative, manuell installierte Trennmusterversion zu verwenden:
506 \begin{lstlisting}[style=LaTeX]
507 \uselanguage{ngerman-x-<datum>}
508 \end{lstlisting}
510 Vorausgesetzt ist dabei, dass ein entsprechender Eintrag in der
511 Konfigurationsdatei \Datei{language.def} oder einer lokalen Version
512 derselben existiert.
514 Soll der \verb+\uselanguage+-Befehl seine gewohnte Form behalten, ist
515 zum Laden alternativer Trennmuster auch folgendes Vorgehen mit Hilfe
516 des Pakets \Paket{hyphsubst} möglich:
518 \begin{lstlisting}[style=LaTeX]
519 \input hyphsubst.sty
520 \HyphSubstLet{ngerman}{ngerman-x-<datum>}
521 \uselanguage{ngerman}
522 \end{lstlisting}
524 Zu beachten ist, dass in Plain-\hologo{TeX} unabhängig vom verwendeten
525 Compiler Wörter mit Umlauten, \emph{ß} oder Akzentbuchstaben an vielen
526 Trennstellen nicht automatisiert getrennt werden können.
528 \subsubsection{\LaTeX{} mit dem Sprachenpaket \Paket{Babel}}
529 \label{subsubsec:LaTeX+Babel}
531 Das Paket \Paket{Babel} kennt für die traditionelle Rechtschreibung
532 die Sprachbezeichnungen \texttt{german}, \texttt{austrian} und
533 \texttt{swissgerman}, für die reformierte Rechtschreibung
534 \texttt{ngerman}, \texttt{naustrian} und \texttt{nswissgerman}, wobei
535 diese sechs Varietäten durch drei Trennmustersätze abgedeckt werden
536 können (\autoref{tab:varietaeten}).
538 Die Compiler \Programm{xelatex} und \Programm{lualatex} verwenden für
539 alle definierten Varietäten der deutschen Sprache die experimentellen
540 Trennmuster, die mit dem Paket \Paket{hyph-utf8} installiert sind;
541 \Programm{latex} und \Programm{pdflatex} tun dies nur für
542 \texttt{swissgerman}.
544 Für die übrigen fünf Varietäten laden \Programm{latex} und
545 \Programm{pdflatex} hingegen aus Gründen der Abwärtskompatibilität
546 standardmäßig die herkömmlichen Trennmuster. Um stattdessen die
547 experimentellen Trennmuster zu aktivieren, sind für die reformierte
548 Rechtschreibung folgende Zeilen in die Präambel des Dokuments
549 aufzunehmen. Die Trennmusterbezeichner, die vom Paket \Paket{Babel}
550 verwendet werden, werden dazu mit Hilfe des Pakets \Paket{hyphsubst}
551 aus dem \Paket{Oberdiek}-Bündel so geändert, dass sie auf die
552 experimentellen Trennmuster verweisen:
554 \begin{lstlisting}[style=LaTeX]
555 \usepackage[T1]{fontenc}
556 \usepackage[ngerman]{babel}
557 \usepackage[ngerman=ngerman-x-latest]{hyphsubst}
558 \end{lstlisting}
560 Für die österreichische Varietät:
562 \begin{lstlisting}[style=LaTeX]
563 \usepackage[T1]{fontenc}
564 \usepackage[naustrian]{babel}
565 \usepackage[naustrian=ngerman-x-latest]{hyphsubst}
566 \end{lstlisting}
568 Auf entsprechende Weise ist es mit allen \hologo{LaTeX}"=Compilern
569 möglich, eine alternative, manuell installierte Trennmusterversion zu
570 aktivieren:
572 \begin{lstlisting}[style=LaTeX]
573 \usepackage[ngerman]{babel}
574 \usepackage[ngerman=ngerman-x-<datum>]{hyphsubst}
575 \end{lstlisting}
577 Das Paket \Paket{hyphsubst} erlaubt auch das mehrfache Umschalten der
578 Trennmuster innerhalb des Dokuments. Hinweise hierzu können der
579 Paketanleitung entnommen
580 werden.\footnote{\url{https://ctan.org/pkg/hyphsubst}}
582 \subsubsection{\hologo{XeLaTeX}/\hologo{LuaLaTeX} mit dem
583 Sprachenpaket \Paket{Polyglossia}}
585 Für \hologo{XeLaTeX} und \hologo{LuaLaTeX} steht als Alternative zu
586 \Paket{Babel} das Paket
587 \Paket{Polyglossia}\footnote{\url{https://ctan.org/pkg/polyglossia}}
588 zur Verfügung. Mit den Zeilen
590 \begin{lstlisting}[style=LaTeX]
591 \usepackage{polyglossia}
592 \setmainlanguage{german}
593 \end{lstlisting}
595 \noindent in der Präambel werden die mit dem Paket \Paket{hyph-utf8}
596 installierten Trennmuster für die \emph{reformierte} Rechtschreibung
597 geladen. Mit den Optionen \texttt{variant=""austrian},
598 \texttt{variant=""swiss} und \texttt{spelling=""old} können wahlweise
599 die österreichische Varietät, die Schweizer Varietät sowie die
600 traditionelle Rechtschreibung gewählt werden, beispielsweise:
602 \begin{lstlisting}[style=LaTeX]
603 \usepackage{polyglossia}
604 \setmainlanguage[variant=swiss, spelling=old]{german}
605 \end{lstlisting}
607 Um Trennhilfen wie \verb+""+, \verb+"ff+ oder \verb+"ck+ verwenden zu
608 können, muss zusätzlich die Option \texttt{babelshorthands=""true}
609 gesetzt werden.
611 Mit \hologo{XeLaTeX} ist es außerdem möglich, manuell installierte
612 statt der voreingestellten Trennmuster zu verwenden. Hierzu kommt das
613 Paket \Paket{hyphsubst} wie folgt zum Einsatz. Für die reformierte
614 Rechtschreibung:
616 \begin{lstlisting}[style=LaTeX]
617 \usepackage{polyglossia}
618 \setmainlanguage{german} % ggf. variant=austrian/swiss
619 \usepackage[ngerman=ngerman-x-<datum>]{hyphsubst}
620 \end{lstlisting}
622 Für die traditionelle Rechtschreibung in Deutschland und Österreich:
624 \begin{lstlisting}[style=LaTeX]
625 \usepackage{polyglossia}
626 \setmainlanguage[spelling=old]{german} % ggf. variant=austrian
627 \usepackage[german=german-x-<datum>]{hyphsubst}
628 \end{lstlisting}
630 Für die traditionelle Rechtschreibung in der Schweiz:
632 \begin{lstlisting}[style=LaTeX]
633 \usepackage{polyglossia}
634 \setmainlanguage[variant=swiss, spelling=old]{german}
635 \usepackage[swissgerman=gswiss-x-<datum>]{hyphsubst}
636 \end{lstlisting}
638 Mit \hologo{LuaLaTeX} in Verbindung mit \Paket{Polyglossia} ist das
639 Ersetzen der Trennmuster auf diese Weise nicht möglich.
641 \subsubsection{p\TeX/up\TeX}
643 Die in Japan gebräuchlichen \hologo{TeX}"=Varianten p\TeX{} und
644 up\TeX{} verwenden für deutschsprachige Texte die experimentellen
645 Trennmuster, die mit dem Paket \Paket{hyph-utf8} installiert sind.
647 \subsubsection{\hologo{ConTeXt}}
649 \hologo{ConTeXt} besitzt eigene Trennmusterdateien. Die Trennmuster
650 werden aus dem Paket \Paket{hyph-utf8} übernommen, jedoch
651 zeitverzögert, sodass sie in \hologo{ConTeXt} im Allgemeinen in einer
652 älteren Version vorliegen. Die Trennmuster für die traditionelle
653 deutsche Rechtschreibung in der Schweiz fehlen zur Zeit.
655 Siehe \autoref{sec:fragen} für Hinweise, wie die Version der
656 \hologo{ConTeXt}-Trennmuster bestimmt werden kann.
658 \section{Trennregeln und Konventionen}
659 \label{sec:trennregeln}
661 Die Trennmuster für die traditionelle Rechtschreibung in Deutschland
662 und Österreich orientieren sich an den verbindlichen Regeln des Dudens
663 in der Fassung von 1991~\cite{duden:1991}. Dasselbe gilt für die
664 Trennmuster für die traditionelle Rechtschreibung in der Schweiz,
665 jedoch mit einer unten beschriebenen Abweichung. Die Trennmuster für
666 die reformierte Rechtschreibung orientieren sich an den amtlichen
667 Regeln für die Rechtschreibung der deutschen Sprache in der Fassung
668 von 2006~\cite{amtlRegeln:2006, amtlRegeln:2006:duden}.
670 Die Regeln lassen gewisse Freiheiten bei der Schreibung und Trennung
671 von Wörtern zu. Da sich solche Freiheiten nicht ohne weiteres auf die
672 maschinelle Worttrennung übertragen lassen, wurden die im folgenden
673 beschriebenen Konventionen getroffen. Hauptsächlich betreffen diese
674 die reformierte Rechtschreibung, die zusätzliche Freiheiten eingeführt
675 hat.\footnote{%
676 Im Ergebnis weicht in reformierter Rechtschreibung die Trennung zum
677 Beispiel des Dudens (nach Sprechsilben) von der Trennung mit diesen
678 Trennmustern (bevorzugt etymologisch) ab, siehe auch
679 \regelref{enum:reformEtymo} und \regelref{enum:reformClusterLR}
680 sowie \autoref{sec:fragen}.} Beziehen sich die Konventionen für die
681 reformierte Rechtschreibung auf die traditionelle Rechtschreibung, so
682 werden die entsprechenden Regeln etwas ausführlicher dargestellt. Die
683 folgenden Abschnitte enthalten jedoch keine vollständige Aufstellung
684 der Silbentrennregeln. Diese sind den entsprechenden Regelwerken zu
685 entnehmen. Es folgen zunächst einige allgemeine Hinweise:
687 \begin{itemize}
689 \item In Liangs Trennalgorithmus werden Groß- und Kleinschreibung
690 nicht unterschieden~\cite{liang:1983}. Die Schreibweisen
691 \emph{Nachtritt} und \emph{nachtritt} werden aus Sicht des
692 Trennalgorithmus gleich behandelt (siehe auch
693 \regelref{enum:tradDoppeld} und \regelref{enum:reformDoppeld}).
695 \item Die von einem Programm aus diesen Mustern abgeleiteten möglichen
696 Trennstellen können (u.\,a. durch Programmfehler) durchaus von denen
697 der zugrundeliegenden Wortliste abweichen. So führt zum Beispiel
698 die Eingabe \lstinline[style=LaTeX]+Meta"llegierung+
699 (Dreikonsonantenregel in der traditionellen Rechtschreibung) mit dem
700 Paket \Paket{Babel} zu den in \autoref{tab:trennung-dreik} gezeigten
701 Trennmöglichkeiten.
703 \begin{table}
704 \centering
705 \caption{Unterschiedlich ermittelte Trennmöglichkeiten.}
706 \label{tab:trennung-dreik}
707 \begin{tabular}{ll}
708 Quelle & Trennmöglichkeiten\\
709 \addlinespace
710 \toprule
711 \addlinespace
712 \hologo{pdfLaTeX} mit \Paket{Babel}~3.8 & Me-tall(-l)egierung\\
713 \hologo{pdfLaTeX} mit \Paket{Babel}~3.9 & Me-tall(-l)e-gie-rung\\
714 erwünscht \emph{(vgl. \regelref{enum:tradnstd})} & Me-tall(-l)egie-rung\\
715 \end{tabular}
716 \end{table}
718 \item Die von \hologo{TeX} gewählte Trennung kann in Einzelfällen mit
719 den \hologo{TeX}- und \Paket{Babel}"=Kürzeln
720 \lstinline[style=LaTeX]+\-+ und \lstinline[style=LaTeX]+"-+ geändert
721 werden. Für dokumentweite Änderungen der Trennung eignet sich das
722 Kommando \lstinline[style=LaTeX]+\hyphenation+.
724 \item Die Datei \Datei{CHANGES} beschreibt bekannte, systematische
725 Fehler der Trennmuster.
727 \item In den Beispielen zeigt die linke (grüne) Spalte jeweils die
728 Trennung mit den experimentellen Trennmustern, die rechten (roten)
729 Spalten zeigen alternative oder unerwünschte Trennungen.
731 \end{itemize}
733 \subsection{Traditionelle Rechtschreibung in Deutschland und
734 Österreich}
735 \label{sec:tradRS}
737 \begin{enumerate}[\hspace{1em}\itshape{T}1]
738 \labelformat{enumi}{\textit{T#1}}
740 \item\label{enum:tradhyphenmin} Die minimale unterstützte Silbenlänge
741 am Wortanfang und "~ende beträgt zwei Buchstaben
742 \cite[R~178]{duden:1991}.
744 Siehe \autoref{sec:fragen} für Hinweise, wie sich diese Länge
745 abweichend einstellen lässt. Wird die Mindestlänge auf weniger als
746 zwei Buchstaben verringert, so können fehlerhafte Trennungen
747 auftreten.
749 \item\label{enum:tradSinn} Sinnentstellende und irreführende
750 Trennungen werden möglichst vermieden \cite[R~181]{duden:1991}
751 (siehe auch \regelref{enum:tradnstd}):
753 \begin{tabular}[t]{TU}
754 An-alpha-bet & Anal-phabet\\
755 Kaf-ka-kenner & Kafkaken-ner\\
756 Tal-entwäs-se-rung & Talent-wässerung\\
757 \end{tabular}
759 Beachte, dass derzeit die Unterdrückung von solchen Trennstellen bis
760 zu einem gewissen Grade willkürlich und subjektiv ist. Außerdem ist
761 die Erfassung weit davon entfernt, vollständig zu sein. Um diesen
762 Problemen abzuhelfen, ist für zukünftige Versionen der Trennmuster
763 ein anderer, automatisierter Ansatz geplant, welcher die Anzahl
764 manuell zu erfassender Fälle sehr stark reduzieren wird.
766 \item\label{enum:tradDoppeld} In mehrdeutigen Wörtern werden
767 Trennungen nur an übereinstimmenden Trennstellen zugelassen.
769 \begin{tabular}[t]{TUU}
770 nachtritt & nach-tritt & Nacht-ritt\\
771 Wachstu-be & Wach-stube & Wachs-tube\\
772 Druckerzeug-nis & Druck-erzeugnis & Drucker-zeugnis\\
773 Mu-sikerle-ben & Musik-erleben & Musi-ker-leben\\
774 Fuß-balleh-re & Fußball-ehre & Fußball-lehre\\
775 \end{tabular}
777 Beachte, die Trennstellen ">Drucker-zeugnis"< und ">Musiker-leben"<
778 sind in den Interpretationen \emph{Druck-Erzeugnis} und
779 \emph{Musik-Erleben} irreführend. Sie entfallen nach
780 \regelref{enum:tradSinn} und sind nicht als übereinstimmende
781 Trennstellen anzusehen. Zur Spezialtrennung ">Fußball-lehre"< siehe
782 auch \regelref{enum:tradnstd}.
784 Für diese Regel gelten die folgenden Einschränkungen:
786 \begin{itemize}
788 \item Bei mehrdeutigen Wörtern endend auf \emph{"~ende},
789 \emph{"~enden}, \emph{"~endes} wird stets die Trennung der
790 Partizipform des Verbs verwendet.
792 \begin{tabular}[t]{TUU}
793 fu-ßen-de & Fuß-ende & fußende\\
794 spie-len-de & Spiel-ende & spielende
795 \end{tabular}
797 \item Mehrdeutigkeiten, die durch die Ersatzschreibweise von Wörtern
798 mit~\emph{ß} auftreten, werden nicht berücksichtigt (vergleiche
799 \regelref{enum:tradEszett}).
801 \begin{tabular}[t]{TUU}
802 Mas-se & \textls{M\kern-.4ptA-SSE} & \textls{M\kern-.4ptA\kern-.6ptSSE}
803 \end{tabular}
805 \end{itemize}
807 \item\label{enum:tradEszett} Wird der Buchstabe~\emph{ß} durch
808 \emph{ss/SS} ersetzt, so bleibt die Trennung davon unberührt
809 \cite[R~179]{duden:1991}:
811 \begin{tabular}[t]{T}
812 \textls{GRÖSS-TE}\\
813 \textls{GRÜ-SSE}\\
814 \textls{M\kern-.4ptA\kern-.4pt-SSES}\\
815 \end{tabular}
817 Für diese Regel gilt die folgende Einschränkung:
818 \begin{itemize}
820 \item Wenn durch den Ersatz von~\emph{ß} an dieser Stelle keine
821 eindeutige Trennung möglich ist, so wird zugunsten der Bedeutung
822 des Wortes in der normalen Schreibweise getrennt (siehe auch
823 \regelref{enum:tradDoppeld}).
825 \begin{tabular}[t]{TTU}
826 \textls{FLÖS-SE} & (wegen flös-se) & \textls{FLÖ-SSE}\\
827 \textls{MAS-SE} & (wegen Mas-se) & \textls{MA-SSE}\\
828 \end{tabular}
830 Beachte:
831 \begin{itemize}
833 \item Wird \emph{ß} mit \lstinline[style=LaTeX]+\MakeUppercase+
834 durch~\emph{SS} ersetzt, so bleibt \emph{SS} stets ungetrennt.
835 Die Trennung richtet sich dann nach der Schreibweise
836 mit~\emph{ß} im Quelldokument.
838 \item Existiert ein Wort in verschiedenen Varietäten in der
839 Schreibweise mit~\emph{ß} und mit~\emph{ss}, so wird aufgrund
840 dieser Einschränkung \emph{s-s} stets getrennt:
842 \begin{tabular}[t]{TTUU}
843 Ge-scho-ße & (AT)\\
844 Ge-schos-se & (D) & \textls{GESCHO-SSE} & (AT)\\
845 \end{tabular}
847 \item Wenn durch den Ersatz des~\emph{ß} an entfernten Stellen
848 keine eindeutige Trennung möglich wird, zum Beispiel an
849 Wortfugen, so werden die betroffenen Trennungen gemäß
850 \regelref{enum:tradDoppeld} unterdrückt. In der Folge wird
851 gegebenenfalls auch die Trennung von \emph{ss/SS} unterdrückt.
853 \begin{tabular}[t]{TU}
854 \textls{BAHN-HOFSTRASSE} & \textls{BAHNHOF-STRA-SSE}\\
855 & \textls{BAHNHOFS-TRAS-SE}\\
856 \end{tabular}
858 \end{itemize}
860 \end{itemize}
862 \item\label{enum:tradOW} In Ableitungen von Namen auf \emph{"~ow} wird
863 die Nottrennung der Ableitungssilben \emph{"~er}, \emph{"~ern},
864 \emph{"~ers} unterdrückt \cite[R~180]{duden:1991}:
866 \begin{tabular}[t]{TU}
867 Tel-tower & Teltow-er\\
868 Trep-towern & Treptow-ern\\
869 Pan-kowers & Pankow-ers\\
870 \end{tabular}
872 \item\label{enum:tradnstd} Spezialtrennungen (\emph{engl.:}
873 non-standard hyphenation), die nach Regeln erfolgen, die über das
874 bloße Einfügen eines Trennstrichs hinausgehen, wie die \emph{ck}"~
875 oder die Dreikonsonantenregel, kann \hologo{TeX} nicht automatisch
876 behandeln. Aus diesem Grund sind solche Trennstellen in diesen
877 Trennmustern nicht berücksichtigt.
879 \begin{tabular}[t]{lTUU}
880 \lstinline[style=LaTeX]+drucken+ & drucken & druk-ken\\
881 \lstinline[style=LaTeX]+Zuckerbäcker+ & Zucker-bäcker & Zuk-kerbäk-ker\\
882 \lstinline[style=LaTeX]+Brennessel+ & Brennes-sel & Brenn-nessel\\
883 \lstinline[style=LaTeX]+Stoffetzen+ & Stoffet-zen & Stoff-fetzen\\
884 \end{tabular}
886 Die Dreikonsonantenregel birgt aufgrund des ausgefallenen
887 Konsonanten die Gefahr irreführender und sinnentstellender
888 Trennungen (siehe auch \regelref{enum:tradSinn}). Trennstellen, die
889 in einem Abstand von zwei Lauten auf eine Wortfuge mit Anwendung der
890 Dreikonsonantenregel folgen, werden daher grundsätzlich unterdrückt.
892 \begin{tabular}[t]{lTUU}
893 \lstinline[style=LaTeX]+Metallegierung+ & Me-tallegie-rung & Metall-legierung & Metalle-gierung\\
894 \lstinline[style=LaTeX]+schnellebige+ & schnellebi-ge & schnell-lebige & schnelle-bige\\
895 \lstinline[style=LaTeX]+Stilleben+ & Stilleben & Still-leben & Stille-ben\\
896 \end{tabular}
897 \par\nobreak
898 \textit{auch:}
900 \begin{tabular}[t]{lTUU}
901 \lstinline[style=LaTeX]+Abfallager+ & Ab-fallager & Abfall-lager & Abfalla-ger\\
902 \lstinline[style=LaTeX]+Zellstoffabrik+ & Zell-stoffabrik & Zellstoff-fabrik & Zellstoffa-brik\\
903 \end{tabular}
905 Das Paket \Paket{Babel} stellt verschiedene Kürzel zur Verfügung,
906 u.\,a. \lstinline[style=LaTeX]+"ck+%
907 \footnote{Spezialtrennungen werden in \hologo{TeX} mit Hilfe des
908 Kommandos \lstinline[style=LaTeX]+\\discretionary+ kodiert. So
909 wird zum Beispiel das \Paket{Babel}-Kürzel
910 \lstinline[style=LaTeX]+\"ck+ in der Eingabe während der
911 Kompilation durch
912 \lstinline[style=LaTeX]+\\discretionary\{k-\}\{k\}\{ck\}+ ersetzt,
913 wodurch \emph{k-k}-Trennungen möglich werden.}
915 oder \lstinline[style=LaTeX]+"ff+ \emph{etc.}, mit denen
916 Spezialtrennungen im Quelldokument ausgezeichnet werden können
917 (siehe auch \autoref{tab:trennung-dreik}). Das Alternativpaket
918 \Paket{Polyglossia} stellt diese Kürzel ebenfalls zur Verfügung,
919 falls beim Laden der deutschen Sprache (in der Regel mit dem Befehl
920 \lstinline[style=LaTeX]+\setmainlanguage+) die Option
921 \lstinline[style=LaTeX]+babelshorthands=true+ angegeben wird.
923 \hologo{LuaTeX}%
924 \footnote{\url{http://www.luatex.org/}}
926 soll in einer zukünftigen Version Mechanismen zur automatischen
927 Behandlung von Spezialtrennungen bereitstellen. Eine physische
928 Auszeichnung im Quelltext ist dann nicht mehr erforderlich. Die
929 entsprechenden Spezialtrennmuster für die deutsche Sprache werden
930 ebenfalls im Rahmen dieses Projekts erstellt.
932 \end{enumerate}
934 \subsection{Traditionelle Rechtschreibung in der Schweiz}
935 \label{sec:tradchRS}
937 Die Trennmuster für die traditionelle Rechtschreibung in der Schweiz
938 folgen weitgehend den Konventionen für die traditionelle
939 Rechtschreibung in Deutschland (siehe \autoref{sec:tradRS}). Die
940 folgende Liste enthält daher nur Fälle, in denen davon abgewichen wird
941 oder deren Beschreibung aus anderen Gründen sinnvoll erscheint.
943 \begin{enumerate}[\hspace{1em}\itshape{TS}1]
944 \labelformat{enumi}{\textit{TS#1}}
946 \item\label{enum:tradchEszett} Wörter mit \emph{ß} werden gemäß den
947 Regeln für die traditionelle Rechtschreibung in Deutschland
948 getrennt.
950 \item\label{enum:tradchSS} Abweichend von \regelref{enum:tradEszett}
951 wird \emph{ss/SS} immer als Doppelkonsonant behandelt und
952 gegebenenfalls getrennt:
954 \begin{tabular}[t]{T}
955 grös-ste\\
956 Grüs-se\\
957 Mas-ses\\
958 \end{tabular}
960 Beachte, wird \emph{ß} jedoch mit
961 \lstinline[style=LaTeX]+\MakeUppercase+ durch~\emph{SS} ersetzt, so
962 bleibt~\emph{SS} stets ungetrennt. Die Trennung richtet sich dann
963 nach der Schreibweise mit~\emph{ß} im Quelldokument (siehe
964 \regelref{enum:tradchEszett}).
966 \end{enumerate}
968 \subsection{Reformierte Rechtschreibung}
969 \label{sec:reformRS}
971 \begin{enumerate}[\hspace{1em}\itshape{R}1]
972 \labelformat{enumi}{\textit{R#1}}
974 \item\label{enum:reformhyphenmin} Die minimale unterstützte Silbenlänge
975 am Wortanfang und "~ende beträgt zwei Buchstaben
976 \cite[\S~107]{amtlRegeln:2006, amtlRegeln:2006:duden}.
978 Siehe \autoref{sec:fragen} für Hinweise, wie sich diese Länge
979 abweichend einstellen lässt. Wird die Mindestlänge auf weniger als
980 zwei Buchstaben verringert, so können fehlerhafte Trennungen
981 auftreten.
983 \item\label{enum:reformEtymo} Falls die Trennung nach Sprechsilben und
984 die etymologische (sprachgeschichtliche) Trennung kollidieren, wird
985 weitgehend die etymologische Trennung gewählt
986 \cite[\S~113]{amtlRegeln:2006, amtlRegeln:2006:duden}:
988 \begin{tabular}[t]{RUU}
989 % Heli-ko-pter & Helikop-ter\\
990 % in-ter-view-en & intervie-wen\\
991 in-ter-es-sant & inte-ressant\\
992 Lin-ole-um & Li-noleum & Lino-leum\\
993 Päd-ago-ge & Pä-dagoge & Päda-goge\\
994 \end{tabular}
996 \item\label{enum:reformClusterLR} In Fremdwörtern bleiben die
997 Buchstabengruppen \emph{bl}, \emph{pl}, \emph{fl}, \emph{gl},
998 \emph{cl}, \emph{kl}, \emph{phl}; \emph{br}, \emph{pr}, \emph{dr},
999 \emph{tr}, \emph{fr}, \emph{vr}, \emph{gr}, \emph{cr}, \emph{kr},
1000 \emph{phr}, \emph{thr}; \emph{chth}; \emph{gn}, \emph{kn} im
1001 allgemeinen ungetrennt, nicht jedoch \emph{str}
1002 \cite[\S~112]{amtlRegeln:2006, amtlRegeln:2006:duden}
1003 i.\,V.\,m.~\cite[R~179]{duden:1991}:
1005 \begin{tabular}[t]{RU}
1006 Ar-thri-tis & Arth-ritis\\
1007 % Co-gnac & Cog-nac\\
1008 Di-plom & Dip-lom\\
1009 % Fe-bru-ar & Feb-ruar\\
1010 igno-rie-re & ig-noriere\\
1011 In-te-gral & Integ-ral\\
1012 \end{tabular}
1013 \par\nobreak
1014 \textit{aber:}
1016 \begin{tabular}[t]{RUU}
1017 In-dus-trie & Indu-strie & Indust-rie\\
1018 % Ma-gis-tra-le & Magi-strale\\
1019 de-struk-tiv\\
1020 sub-lim\\
1021 \end{tabular}
1023 \item\label{enum:reformSinn} Sinnentstellende und irreführende
1024 Trennungen werden möglichst vermieden \cite[\S~107]{amtlRegeln:2006,
1025 amtlRegeln:2006:duden}:
1027 \begin{tabular}[t]{RU}
1028 An-alpha-bet & Anal-phabet\\
1029 Kaf-ka-kenner & Kafkaken-ner\\
1030 Tal-entwäs-se-rung & Talent-wässerung\\
1031 \end{tabular}
1033 \item\label{enum:reformDoppeld} In mehrdeutigen Wörtern werden
1034 Trennungen nur an übereinstimmenden Trennstellen zugelassen:
1036 \begin{tabular}[t]{RUUU}
1037 Druckerzeug-nis & Dru-ckerzeugnis & Druck-erzeugnis &
1038 Drucker-zeugnis\\
1039 Mu-sikerle-ben & Musi-kerleben & Musik-erleben & Musiker-leben\\
1040 nachtritt & nach-tritt & Nacht-ritt\\
1041 Wachstu-be & Wach-stube & Wachs-tube\\
1042 \end{tabular}
1044 Beachte, die Trennstellen ">Drucker-zeugnis"< und ">Musiker-leben"<
1045 sind in den Interpretationen \emph{Druck-Erzeugnis} und
1046 \emph{Musik-Erleben} irreführend. Sie entfallen nach
1047 \regelref{enum:reformSinn} und sind nicht als übereinstimmende
1048 Trennstellen anzusehen.
1050 Für diese Regel gilt die folgende Einschränkung:
1052 \begin{itemize}
1054 \item Bei mehrdeutigen Wörtern endend auf \emph{"~ende},
1055 \emph{"~enden}, \emph{"~endes} wird stets die Trennung der
1056 Partizipform des Verbs verwendet.
1058 \begin{tabular}[t]{RUU}
1059 fu-ßen-de & Fuß-ende & fußende\\
1060 spie-len-de & Spiel-ende & spielende
1061 \end{tabular}
1063 \end{itemize}
1065 \item\label{enum:reformEszett} Wird der Buchstabe~\emph{ß} durch
1066 \emph{ss/SS} ersetzt, so wird \emph{s"~s} getrennt \cite[\S\S~25~E3,
1067 110]{amtlRegeln:2006, amtlRegeln:2006:duden}:
1069 \begin{tabular}[t]{R}
1070 \textls{GRÖS-STE}\\
1071 \textls{GRÜS-SE}\\
1072 \textls{M\kern-.4ptA\kern-.6ptS-SES}\\
1073 \end{tabular}
1075 Wird~\emph{ß} mit \lstinline[style=LaTeX]+\MakeUppercase+ oder in
1076 Kapitälchen in~\emph{SS} gewandelt, so bleibt~\emph{SS} ungetrennt.
1077 Dies ist kein Fehler in den Trennmustern, sondern im
1078 \hologo{LaTeX}-Kern fest implementiert.
1080 % \item\label{enum:reformOW} In Ableitungen von Namen auf \emph{"~ow}
1081 % bleibt \emph{"~ow} ungetrennt, wenn es den Laut [o\,:] bezeichnet.
1082 % Die Nottrennung der Ableitungssilben \emph{"~er}, \emph{"~ern},
1083 % \emph{"~ers} wird unterdrückt \cite[\S~113]{amtlRegeln:2006,
1084 % amtlRegeln:2006:duden}
1085 % i.\,V.\,m.~\cite[R~180]{duden:1991}:
1087 % \begin{tabular}[t]{RUU}
1088 % Tel-tower & Telto-wer & Teltow-er\\
1089 % Trep-towern & Trepto-wern & Treptow-ern\\
1090 % Pan-kowers & Panko-wers & Pankow-ers\\
1091 % \end{tabular}
1093 \end{enumerate}
1096 \section{Trennfehler}
1097 \label{sec:trennfehler}
1099 Mit den vorliegenden Trennmustern können sämtliche Wörter der
1100 zugrundeliegenden Wortliste fehlerfrei getrennt werden. Technisch
1101 gesprochen endet der letzte \Programm{patgen}-Lauf mit der Meldung
1103 \begin{lstlisting}[style=shell]
1104 1266082 good, 0 bad, 0 missed
1105 100.00 %, 0.00 %, 0.00 %
1106 \end{lstlisting}
1108 \noindent (der Wert vor \lstinline[style=shell]+good+ ist vom
1109 Listenumfang abhängig). Trotz des großen Umfangs der Wortliste lassen
1110 sich Trennfehler in Wörtern, die nicht in der Liste enthalten sind,
1111 nicht vermeiden. Der Umfang der Wortliste kann allerdings nicht
1112 beliebig erweitert werden.%
1113 \footnote{Liangs Schema sieht nur einen begrenzten Bereich für die
1114 Trennstellenbewertungen vor (0--9). Die derzeitigen Trennmuster
1115 vewenden bereits Bewertungen der Höhe~8.}
1117 In den folgenden Fällen sollten fehlerhafte Trennungen der Trennmuster
1118 jedoch gemeldet werden:
1120 \begin{enumerate}[\hspace{1em}A.]
1122 \item\label{enum:kritWLfehlerhaft} Das Wort ist bereits in der
1123 Wortliste enthalten. Der Eintrag ist jedoch fehlerhaft.
1125 \end{enumerate}
1127 Falls das Wort nicht in der Wortliste enthalten ist, bestehen sehr
1128 gute Chancen, dass es aufgenommen wird, wenn eines der folgenden
1129 Kriterien erfüllt ist:
1131 \begin{enumerate}[\hspace{1em}A.]
1132 \refstepcounter{enumi}% Fortsetzung der obigen Aufzählung.
1134 \item\label{enum:kritHerkTM} Das betreffende Wort wird mit den
1135 \emph{herkömmlichen} Trennmustern für die traditionelle oder
1136 reformierte Rechtschreibung korrekt getrennt. Korrekt bedeutet
1137 hier: Nicht alle möglichen Trennstellen müssen erkannt werden; es
1138 werden jedoch in keinem Fall falsche Trennstellen ermittelt. Zum
1139 Testen kann in \TeX\ der folgende Aufruf verwendet werden (die
1140 Ausgabe erfolgt in der \texttt{log}-Datei):
1142 \begin{lstlisting}[style=LaTeX]
1143 \showhyphens{durch Leerzeichen getrennte Wörter}
1144 \end{lstlisting}
1146 \item\label{enum:kritSinn} Es handelt es sich um eine orthographisch
1147 richtige, aber sinnentstellende oder irreführende Trennung.
1148 Berücksichtigt werden allerdings nur Wörter, die aus höchstens zwei
1149 (gegebenenfalls prä- und suffigierten) Wörtern zusammengesetzt sind,
1150 zum Beispiel ">Talent-wässerung"<. Nicht berücksichtigt wird
1151 hingegen die ">Talent-wässerungsanlage"<.
1153 \end{enumerate}
1155 Einige bekannte Fehler in den Trennmustern sind in der Datei
1156 \Datei{CHANGES} verzeichnet. Noch nicht bekannte falsche, fehlende
1157 und unerwünschte Worttrennungen können an die E-Mail-Adresse
1158 \href{mailto:trennmuster@dante.de}{trennmuster@dante.de} gerichtet
1159 werden.
1161 Trennfehler, die in den Trennmustern nicht korrigiert werden können,
1162 können mit Hilfe einer privaten Ausnahmeliste behandelt werden:
1164 \begin{lstlisting}[style=LaTeX]
1165 \hyphenation{Tal-entwäs-se-rungs-an-la-ge Kaf-ka-kenner-klub}
1166 \end{lstlisting}
1168 Die aktuelle und ältere Ausgaben der Trennmuster sind im Dateibereich
1169 des Trennmuster-Wikis erhältlich.%
1170 \footnote{\url{http://projekte.dante.de/Trennmuster}}
1172 Im Entwicklerrepositorium\footnote{%
1173 siehe \url{http://projekte.dante.de/Trennmuster/Entwickler}}
1174 befindet sich ein Makefile, mit dem jederzeit neue Trennmuster erzeugt
1175 werden können.
1177 \nobreak
1178 \noindent\parbox{\linewidth}{%
1179 \vspace*{\baselineskip}
1180 \raggedright
1181 \itshape
1182 Happy \TeX ing!\newline
1183 Die deutschsprachige Trennmustermannschaft
1187 \begingroup
1188 \RaggedRight
1189 \bibliography{dehyph-exptl}
1190 \endgroup
1193 \appendix
1194 \section{Dateien und Installation}
1195 \label{sec:installation}
1197 Die eigentlichen Trennmusterdateien liegen in \Abk{utf-8}"=Kodierung
1198 vor (siehe \autoref{tab:dateien}, Endung \texttt{pat}). Sie werden
1199 von \hologo{TeX} nicht direkt geladen, sondern durch Manteldateien,
1200 die ebenfalls Teil des Pakets sind (Endung \texttt{tex}). Wird eine
1201 8-Bit-fähige \hologo{TeX}"=Variante erkannt, übernehmen diese
1202 Manteldateien die Konvertierung der Trennmuster in die
1203 \Abk{t1}-Kodierung.
1205 \begin{table}
1206 \centering
1207 \caption{Trennmuster- und Manteldateien}
1208 \label{tab:dateien}
1209 \begin{tabular}{>{\ttfamily}l>{\ttfamily}l}
1210 \normalfont Trennmusterdatei & \normalfont Manteldatei\\
1211 \addlinespace\toprule\addlinespace
1212 dehypht-x-<datum>.pat & dehypht-x-<datum>.tex\\
1213 dehyphts-x-<datum>.pat & dehyphts-x-<datum>.tex\\
1214 dehyphn-x-<datum>.pat & dehyphn-x-<datum>.tex\\
1215 \end{tabular}
1216 \end{table}
1218 Bei der Installation werden die Manteldateien an die in
1219 \autoref{tab:varietaeten} gezeigten Trennmusterbezeichner gebunden.
1220 Diese Schritte werden für verschiedene \hologo{TeX}"=Verteilungen in
1221 der Datei \Datei{INSTALL} beschrieben. Nach der Installation können
1222 die experimentellen Trennmuster wie in \autoref{sec:aktivieren}
1223 gezeigt verwendet werden.
1226 \section{Fragen \& Antworten}
1227 \label{sec:fragen}
1229 \newcommand*{\fragefont}{\itshape}
1230 \newcommand*{\themenfont}{\large\normalfont}
1231 \newcounter{cntfrage}% Zaehler fuer Fragen.
1232 \newcounter{thema}% Zaehler fuer Themenueberschriften.
1233 \renewcommand*{\thethema}{\Roman{thema}.}
1234 \newcounter{frage}% Zaehler fuer Fragen.
1235 \renewcommand*{\thefrage}{\arabic{frage}.}
1236 \newboolean{nextfrage}
1238 \makeatletter
1240 %%% Neue zref-Liste frage = (type, text, anchor).
1241 \zref@newlist{frage}
1242 \zref@newprop{type}{f}
1243 \zref@newprop{text}{??}
1244 \zref@addprop{frage}{type}
1245 \zref@addprop{frage}{text}
1246 \zref@addprop{frage}{anchor}
1248 %%% Fuegt eine neue Themenueberschrift ein.
1249 \newcommand*{\fragenthema}[1]{%
1250 \par
1251 \pagebreak[1]
1252 \vspace{.25\baselineskip plus .1\baselineskip minus .1\baselineskip}
1253 \refstepcounter{cntfrage}
1254 \stepcounter{thema}
1255 \zref@setcurrent{type}{t}
1256 \zref@setcurrent{text}{\thethema~#1}
1257 \zref@labelbylist{frage:\thecntfrage}{frage}
1258 \noindent{\themenfont\thethema~#1\par}
1261 %%% Umgebung fuer eine Frage mit Antwort.
1262 \newenvironment{frageantwort}[1]{%
1263 \par
1264 \vspace{.25\baselineskip plus .1\baselineskip minus .1\baselineskip}
1265 \refstepcounter{cntfrage}
1266 \stepcounter{frage}
1267 \zref@setcurrent{type}{f}
1268 \zref@setcurrent{text}{\thefrage~#1}
1269 \zref@labelbylist{frage:\thecntfrage}{frage}
1270 \noindent{\fragefont\thefrage~#1\par}
1271 \nobreak\noindent\ignorespaces
1273 \vspace{.25\baselineskip plus .1\baselineskip minus .1\baselineskip}
1276 %%% Zeige alle Fragen in sortierter Reihenfolge.
1277 \newcommand{\zeigefragen}{%
1278 \par
1279 \zref@refused{frage:1}
1280 \setcounter{cntfrage}{1}
1281 \setboolean{nextfrage}{true}
1282 \whiledo{\boolean{nextfrage}}{
1283 \vspace{.25\baselineskip plus .1\baselineskip minus .1\baselineskip}
1284 \ifthenelse{\equal{\zref@extract{frage:\thecntfrage}{type}}{f}}{% Frage
1285 \noindent%
1286 \begingroup%
1287 \fragefont%
1288 \hyperlink{\zref@extract{frage:\thecntfrage}{anchor}}{%
1289 \zref@extract{frage:\thecntfrage}{text}%
1291 \par
1292 \endgroup
1293 }{% Themenueberschrift
1294 \noindent%
1295 \begingroup%
1296 \themenfont%
1297 \zref@extract{frage:\thecntfrage}{text}%
1298 \par
1299 \endgroup
1300 \nobreak
1302 \stepcounter{cntfrage}
1303 \zref@ifrefundefined{frage:\thecntfrage}{\setboolean{nextfrage}{false}}{}
1305 \vspace{.5\baselineskip plus .1\baselineskip minus .1\baselineskip}
1306 \setcounter{cntfrage}{0}
1307 \setcounter{frage}{0}
1311 \zeigefragen
1314 \fragenthema{Verwenden der Trennmuster}
1316 \begin{frageantwort}{Wie kann für die experimentellen Trennmuster aus
1317 dem Paket \Paket{dehyph-exptl} das Datum ermittelt werden, das
1318 Teil des Trennmusterbezeichners ist, wie in
1319 \autoref{sec:verwenden} erwähnt?}
1321 Die Trennmusterbezeichner werden in der Datei \Datei{language.dat}
1322 definiert, wo auch die Verbindung zu den Manteldateien hergestellt
1323 wird. Da ein Teil der Trennmusterbezeichner bereits bekannt ist,
1324 \verb+german-x+, vgl. \autoref{tab:varietaeten}, kann die Datei
1325 \Datei{language.dat} danach durchsucht werden. Zunächst muss der
1326 Ort der Datei mit Hilfe des Kommandos \Programm{kpsewhich} ermittelt
1327 werden. Es folgen die vollständigen Kommandos für unixähnliche
1328 Shells und die Windows-Kommandozeile \Datei{cmd.exe} (einzugeben
1329 ohne Zeilenumbruch). Achtung, bei den einfachen Anführungszeichen
1330 handelt es sich um Gravis (">Backquotes"<).
1332 \begin{lstlisting}[style=shell, caption=Shell]
1333 grep -i german-x `kpsewhich language.dat`
1334 \end{lstlisting}
1336 \begin{lstlisting}[style=shell, caption=\Datei{cmd.exe}]
1337 for /F "usebackq" %f in (`kpsewhich language.dat`)
1338 do find /i "german-x" "%f"
1339 \end{lstlisting}
1341 Die Ausgabe dieser Kommandos sieht etwa wie folgt aus (das Datum
1342 kann abweichen):
1344 \begin{lstlisting}
1345 german-x-2009-06-19 dehypht-x-2009-06-19.tex
1346 =german-x-latest
1347 ngerman-x-2009-06-19 dehyphn-x-2009-06-19.tex
1348 =ngerman-x-latest
1349 \end{lstlisting}
1351 Die gesuchten Trennmusterbezeichner befinden sich in der ersten
1352 Spalte und lauten in diesem Beispiel
1353 \lstinline[style=LaTeX]{german-x-2009-06-19} und
1354 \lstinline[style=LaTeX]{ngerman-x-2009-06-19}. In der zweiten
1355 Spalte kann man die Namen der Manteldateien erkennen
1356 (vgl. \autoref{tab:dateien}). Die mit einem Gleichheitszeichen
1357 beginnenden Zeilen definieren ein Synonym für den
1358 Trennmusterbezeichner der unmittelbar vorangehenden Zeile in der
1359 Datei \Datei{language.dat}.
1360 \end{frageantwort}
1363 \begin{frageantwort}{Wie kann die Version der experimentellen Muster
1364 ermittelt werden, die im Paket \Paket{hyph-utf8} enthalten sind?}
1366 Das Vorgehen ähnelt dem der vorherigen Antwort. Zunächst wird der
1367 Ort einer bestimmten Datei ermittelt. Diese wird dann nach einer
1368 hilfreichen Zeichenkette durchsucht.
1370 \begin{lstlisting}[style=shell, caption=Shell]
1371 grep dehyph `kpsewhich hyph-de-1901.lic.txt`
1372 \end{lstlisting}
1374 \begin{lstlisting}[style=shell, caption=\Datei{cmd.exe}]
1375 for /F "usebackq" %f in (`kpsewhich hyph-de-1901.lic.txt`)
1376 do find "dehyph" "%f"
1377 \end{lstlisting}
1379 Die Ausgabe dieser Kommandos sieht etwa wie folgt aus (das Datum
1380 kann abweichen):
1382 \begin{lstlisting}
1383 % dehypht-x-2011-06-01.pat
1384 \message{German Hyphenation Patterns (Traditional Orthography)
1385 `dehypht-x' 2011-06-01 (WL)}
1386 \end{lstlisting}
1387 \end{frageantwort}
1389 \begin{frageantwort}{Wie kann die Version der experimentellen Muster
1390 ermittelt werden, die von \hologo{ConTeXt} verwendet werden?}
1392 Das Vorgehen ähnelt dem der vorherigen Antwort. Zunächst wird der
1393 Ort einer bestimmten Datei ermittelt. Diese wird dann nach einer
1394 hilfreichen Zeichenkette durchsucht.
1396 \begin{lstlisting}[style=shell, caption=Shell]
1397 grep dehyph `kpsewhich lang-de.rme`
1398 \end{lstlisting}
1400 \begin{lstlisting}[style=shell, caption=\Datei{cmd.exe}]
1401 for /F "usebackq" %f in (`kpsewhich lang-de.rme`)
1402 do find "dehyph" "%f"
1403 \end{lstlisting}
1405 Die Ausgabe dieser Kommandos sieht etwa wie folgt aus (das Datum
1406 kann abweichen):
1408 \begin{lstlisting}
1409 % dehyphn-x-2014-05-21.pat
1410 \message{German Hyphenation Patterns (Reformed Orthography, 2006)
1411 `dehyphn-x' 2014-05-21 (WL)}
1412 \end{lstlisting}
1413 \end{frageantwort}
1416 \fragenthema{Rechtschreibung}
1418 \begin{frageantwort}{Verlag, Prüfer o.\,ä. bemängeln die Trennung der
1419 Trennmuster für die reformierte Rechtschreibung. Zum Beispiel
1420 wird ">In-dus-trie"< getrennt, der Duden trennt jedoch
1421 ">In-dust-rie"<.}
1423 Die amtlichen Regeln für die Rechtschreibung der deutschen Sprache
1424 lassen für viele Wörter mehrere Trennvarianten zu. Die Trennmuster
1425 und ebenso Wörterverzeichnisse legen sich aus praktischen Gründen
1426 auf eine Trennvariante fest. Sie können daher unterschiedliche
1427 Trennungen verwenden, ohne dass eine von beiden falsch ist. Aus
1428 diesem Grund sind Wörterverzeichnisse nicht geeignet, eine bestimmte
1429 Trennung auf Richtigkeit zu prüfen. Verbindlich sind einzig die
1430 amtlichen Regeln für die Rechtschreibung der deutschen
1431 Sprache~\cite{amtlRegeln:2006}. Häufig sind diese im Anhang eines
1432 Wörterbuchs abgedruckt. Die von den Trennmustern befolgten
1433 Konventionen können \autoref{sec:trennregeln} entnommen werden.
1435 Wenn Unsicherheit darüber herrscht, wie die Rechtschreibung geprüft
1436 wird, sollte dies frühzeitig geklärt werden. Nicht jedem Redakteur
1437 oder Prüfer ist bewusst, dass der Duden seine normative Stellung mit
1438 der Rechtschreibreform~1996 eingebüßt hat.
1439 \end{frageantwort}
1442 \begin{frageantwort}{Gibt es dudenkonforme Trennmuster für die
1443 reformierte Rechtschreibung?}
1445 Zur Zeit nicht, es ist auch nicht geplant. Dieses Projekt ist
1446 jedoch offen für Vorschläge und Mitarbeit.
1447 \end{frageantwort}
1450 \begin{frageantwort}{Weshalb werden noch Trennmuster für die
1451 traditionelle Rechtschreibung bereitgestellt?}
1453 Die amtlichen Regeln für die Rechtschreibung der deutschen Sprache
1454 in der Fassung von 2006 sind nur für öffentliche Einrichtungen und
1455 Behörden verbindlich. Im privaten Schriftverkehr kann man wahlweise
1456 die traditionelle oder die reformierte Rechtschreibung verwenden.%
1457 \footnote{Oder auch keine von beiden.}
1459 Daher erfreut sich die traditionelle Rechtschreibung weiterhin
1460 großer Beliebtheit.
1462 Für Texte in gebrochener Schrift ist die traditionelle
1463 Rechtschreibung sogar vorzuziehen.
1464 \end{frageantwort}
1466 \begin{frageantwort}{In der Voreinstellung für die deutsche Sprache
1467 beträgt die Mindestlänge abgetrennter Silben zwei Buchstaben. Wie
1468 kann diese Mindestlänge verändert werden?}
1470 Nehmen wir an, am Wortanfang sollen nicht weniger als drei und am
1471 Wortende nicht weniger als vier Buchstaben abgetrennt werden. Dann
1472 sind folgende Befehle nötig:
1474 \begin{itemize}
1475 \item Mit Plain-\hologo{TeX}:
1477 \begin{lstlisting}[style=LaTeX]
1478 \uselanguage{<sprache>}
1479 \lefthyphenmin=3
1480 \righthyphenmin=4
1481 \end{lstlisting}
1483 Ersetze dabei \texttt{<sprache>} durch eine der in
1484 \autoref{subsubsec:PlainTeX} erwähnten Trennmusterbezeichnungen,
1485 beispielsweise \texttt{ngerman}.
1487 \item Mit \hologo{LaTeX} und \Paket{Babel}:
1489 \begin{lstlisting}[style=LaTeX]
1490 \usepackage[<sprache>]{babel}
1491 \renewcommand*{\<sprache>hyphenmins}{34}
1492 \end{lstlisting}
1494 Ersetze dabei \texttt{<sprache>} durch eine der in
1495 \autoref{subsubsec:LaTeX+Babel} erwähnten
1496 \Paket{Babel}-Sprachbezeichnungen, beispielsweise
1497 \texttt{ngerman}.
1499 \item Mit \hologo{XeLaTeX}/\hologo{LuaLaTeX} und
1500 \Paket{Polyglossia}:
1502 \begin{lstlisting}[style=LaTeX]
1503 \usepackage{polyglossia}
1504 \setmainlanguage{german}
1505 \renewcommand*{\germanhyphenmins}{34}
1506 \end{lstlisting}
1507 \end{itemize}
1508 \end{frageantwort}
1510 \begin{frageantwort}{Können Trennungen mit einer Silbenlänge von nur
1511 einem Buchstaben ermöglicht werden, zum Beispiel für den Satz in
1512 schmalen Kolumnen?}
1514 Mit diesen Trennmustern ist das nicht möglich, da die
1515 zugrundeliegende Wortliste solche Trennungen nicht enthält. Die
1516 Abtrennung einzelner Vokale, zum Beispiel ">A-bend"<, war nur
1517 kurzzeitig zulässig; die entsprechende Regelung von 1996 wurde mit
1518 der Rechtschreibreform 2006 wieder zurückgenommen. Wird die
1519 Silbenmindestlänge für die Worttrennung auf eins verringert, können
1520 falsche Trennungen auftreten.
1521 \end{frageantwort}
1524 \fragenthema{Mitarbeit}
1526 \begin{frageantwort}{Wie kann ich mich über dieses Projekt
1527 informieren?}
1529 Zentrale Anlaufstelle ist das Trennmuster-Wiki, welches sich
1530 momentan jedoch noch im Aufbau befindet.%
1531 \footnote{\url{http://projekte.dante.de/Trennmuster}}
1533 Für Fragen und Hinweise kann nach Anmeldung die Mailingliste;%
1535 \footnote{\href{mailto:trennmuster@dante.de}{trennmuster@dante.de}}
1537 oder alternativ die Usenetgruppe \Datei{de.comp.text.tex} genutzt
1538 werden. Die folgenden Dateien enthalten weitergehende
1539 Informationen:
1541 \begin{itemize}
1543 \item Neben der Dokumentation zu den Trennmustern enthält dieses
1544 Paket eine Projektbeschreibung (\Datei{projektbeschreibung.pdf}).
1546 \item Die Datei \Datei{CHANGES} enthält bekannte, systematische
1547 Fehler der Trennmuster.
1549 \item Das Entwicklerrepositorium enthält in der Datei
1550 \Datei{README.wortliste} eine Beschreibung des Formats der
1551 Wortliste.
1553 \end{itemize}
1554 \end{frageantwort}
1557 \begin{frageantwort}{Wie kann ich helfen?}
1559 Die deutschsprachige Trennmustermannschaft ist eine offene Gruppe
1560 und benötigt dringend weitere Mithilfe. Interessenten sind daher
1561 hoch willkommen! Zum Mitmachen gibt es mehrere Möglichkeiten:
1563 \begin{itemize}
1564 \item Die einfachste ist, die experimentellen Trennmuster ausgiebig
1565 zu testen und Fehler zu melden (siehe \autoref{sec:trennfehler}).
1567 \item Besonders hilfreich wäre Mitarbeit am Projekt. Als Einstieg
1568 kann die (grobe) Aufgabenliste in der Projektbeschreibung dienen.
1570 Obwohl schon experimentelle Trennmuster veröffentlicht wurden,
1571 steht dieses Projekt noch ziemlich am Anfang. Ziel ist, die
1572 verwendete Wortliste von möglichst vielen Menschen in verteilter
1573 Arbeit auf Richtigkeit zu prüfen. Bis dahin bleibt jedoch noch
1574 viel zu tun.
1576 \item Mittelfristig -- nach Fertigstellung der Prüfmaske~-- kann
1577 auch durch systematische Durchsicht eines Teils der Wortliste
1578 geholfen werden.
1580 \item Fragen, Hinweise und Ideen sind auf der Mailingliste immer
1581 willkommen!
1582 \end{itemize}
1583 \end{frageantwort}
1586 \begin{frageantwort}{Sollten Trennfehler einzeln oder gesammelt
1587 eingereicht werden?}
1589 Das ist egal. Es sollten allerdings die folgenden Hinweise beim
1590 Einreichen von Fehlern beachtet werden:
1592 \begin{description}
1593 \setkomafont{descriptionlabel}{\normalfont\itshape}
1595 \item[Aktualität] Wenn ältere Trennmusterdateien verwenden werden,
1596 bitte zuerst prüfen, ob der Fehler auch mit aktuellen Trennmustern
1597 auftritt. Die aktuellen Trennmuster sind im \Abk{ctan} im Paket
1598 \Paket{dehyph-exptl} oder im Dateibereich unter der
1599 Projekt-\Abk{url} erhältlich. Im Repositorium befindet sich auch
1600 ein Makefile, mit dem jederzeit neue Trennmuster aus der aktuellen
1601 Wortliste erzeugt werden können.
1603 \item[Informationen] In einem Fehlerbericht sollte für das
1604 betreffende Wort die richtige und bei einzelnen Worteinreichungen
1605 auch die falsche Trennung angegeben werden. Außerdem die genaue
1606 Version der verwendeten Trennmuster (traditionelle oder
1607 reformierte Rechtschreibung, Datum der Trennmusterdatei).
1609 \item[Listenformat] Es erleichtert die Korrektur, wenn
1610 Berichtigungsvorschläge in Form einer Liste eingereicht werden,
1611 die automatisch mit Skripten bearbeitet werden kann. Die
1612 folgenden Konventionen sollten dabei eingehalten werden:
1614 \begin{itemize}
1615 \item Die Spalten werden mit einem Semikolon \verb+;+ getrennt.
1616 \item Die erste Spalte enthält das betreffende Wort in
1617 ungetrennter Form.
1618 \item Die zweite Spalte enthält das Wort in der Trennvariante nach
1619 traditioneller Rechtschreibung.
1620 \item Falls die Trennung nach reformierter Rechtschreibung davon
1621 abweicht, steht diese in der dritten Spalte.
1622 \item Ab der vierten Spalte \emph{können} weitere Trennvarianten
1623 folgen, etwa die falsche Trennung. Eine kurze Erklärung sollte
1624 dann darauf eingehen.
1625 \item Unerwünschte Trennungen werden mit einem Punkt \verb+.+
1626 markiert.
1627 \item Anfang und Ende der Liste sollten klar erkennbar sein.
1628 \end{itemize}
1630 Eine Liste könnte beispielhaft so aussehen:
1632 \begin{lstlisting}[style=Text]
1633 sonnendurchfluteten;son-nen-durch-flu-te-ten
1634 Talentwässerung;Tal-ent.wäs-se-rung
1635 Fensterplatz;Fen-ster-platz;Fens-ter-platz
1636 \end{lstlisting}
1638 Dieses Format ist auch für einzeln eingereichte Korrekturen
1639 sinnvoll.
1641 \item[Betreff] Der Betreff einer Fehlermeldung sollte aussagekräftig
1642 sein. Daher sollten mehrere Trennfehler, sofern möglich,
1643 thematisch zusammengefasst werden. Außerdem kann zur einfacheren
1644 Zuordnung das entsprechende Kriterium aus
1645 \autoref{sec:trennfehler} dem Betreff der E-Mail in eckigen
1646 Klammern vorangestellt werden, zum Beispiel:
1648 \begin{lstlisting}[style=Text]
1649 Betreff: [A] sonnendurchfluteten
1650 \end{lstlisting}
1652 \noindent für einen Trennfehler im Wortes
1653 \emph{sonnendurchfluteten}, der durch einen Fehler in der
1654 Wortliste hervorgerufen wird.
1655 \end{description}
1656 \end{frageantwort}
1659 \end{document}
1661 %%% Local Variables:
1662 %%% mode: latex
1663 %%% TeX-engine: default
1664 %%% TeX-PDF-mode: t
1665 %%% TeX-master: t
1666 %%% coding: utf-8
1667 %%% End: