Korrigiere "schlaffesten".
[wortliste.git] / dehyph-exptl / dehyph-exptl.tex
blobe6309cca135369aa5ee3809118b83782d64db7e9
1 %%% Artikelklasse mit:
2 %%% * Grundschriftgröße 11 Punkt,
3 %%% * klassischem Satzspiegel,
4 %%% * flachem Inhaltsverzeichnis,
5 %%% * Tabellenüberschriften.
6 \documentclass[11pt,
7 DIV=9,
8 toc=flat,
9 captions=tableheading,
10 abstract=on]{scrartcl}
12 \emergencystretch 1em
14 %%% Eingabekodierung ist UTF-8.
15 \usepackage[utf8]{inputenc}
17 %%% Schrifteinstellung:
18 %%% * Grundschrift Palatino,
19 %%% * Akzidenzschrift Bera Sans,
20 %%% * Schreibmaschinenschrift Latin Modern Typewriter.
21 \usepackage[T1]{fontenc}
22 \usepackage[osf]{mathpazo}
23 \usepackage[scaled=0.85]{berasans}
24 \renewcommand*{\ttdefault}{lmtt}
25 \usepackage{textcomp}
27 \linespread{1.1}
28 \usepackage[expansion=true,
29 letterspace=80]{microtype}
31 %%% Lade einige Pakete.
32 \usepackage{ifthen}
33 \usepackage{calc}
34 \usepackage{multicol}
35 \usepackage{paralist}
36 \usepackage{fncylab}
37 \usepackage{tabularx}
38 \usepackage{booktabs}
39 \usepackage{ragged2e}
40 \usepackage{hologo}
41 \usepackage[defaultlines=4,
42 all]{nowidow}
44 \newcolumntype{L}{>{\raggedright\arraybackslash}X}
46 \usepackage{listings}
47 \lstloadlanguages{[LaTeX]TeX, sh}
48 \lstset{
49 basicstyle=\ttfamily,
50 keywordstyle={},
51 commentstyle={},
52 columns=flexible,
53 showspaces=false,
54 showstringspaces=false,
55 % frame=tb,
56 % framesep=8pt,
57 % framerule=2pt,
58 xleftmargin=6pt,
59 xrightmargin=6pt,
60 % framexleftmargin=6pt,
61 % framexrightmargin=6pt,
62 inputencoding=utf8,
63 extendedchars=true,
64 literate={ä}{{\"a}}1 {ö}{{\"o}}1 {ü}{{\"u}}1,
66 \lstdefinestyle{LaTeX}{
67 language=[LaTeX]TeX,
68 basicstyle=\ttfamily,
69 keywordstyle={},
70 commentstyle={\itshape}
72 \lstdefinestyle{shell}{
73 language=sh,
74 basicstyle=\ttfamily,
75 keywordstyle={},
76 commentstyle={\itshape},
77 upquote=true % Gravis korrekt anzeigen
79 \lstdefinestyle{Text}{
80 language=,
81 basicstyle=\ttfamily,
82 keywordstyle={},
83 commentstyle={}
86 \usepackage{needspace}
88 %%% Literaturverweise in runden Klammern mit Semikolon als Trenner.
89 % \usepackage[round,semicolon]{natbib}
90 % \renewcommand*{\bibnumfmt}[1]{(#1)}
92 %%% Literaturverzeichnis mit Sprachunterstützung.
93 \usepackage[fixlanguage]{babelbib}
94 \bibliographystyle{babalpha}
95 %%% Babelbib fordert trotz fixlanguage zuviele Sprachen an.
96 \usepackage[english,
97 german,
98 ngerman]{babel}
99 \usepackage[ngerman=ngerman-x-latest]{hyphsubst}
101 %%% Einstellungen für interaktive PDF-Dokumente.
102 \usepackage[rgb,x11names]{xcolor}
103 \usepackage[hyperref]{zref}
104 \usepackage{hyperref}
105 \hypersetup{
106 pdftitle={dehyph-exptl},
107 pdfauthor={Die deutschsprachige Trennmustermannschaft},
108 pdfkeywords={TeX,
109 deutsche Rechtschreibung,
110 Trennmuster,
111 computergestützte Worttrennung}
113 \hypersetup{
114 ngerman,% Für \autoref.
115 pdfstartview={XYZ null null null},% Viewer bestimmt Zoomfaktor.
116 colorlinks,
117 linkcolor=RoyalBlue3,
118 urlcolor=Chocolate4,
119 citecolor=DeepPink2
121 \newcommand*{\regelref}[1]{%
122 \begingroup
123 \renewcommand*{\Itemautorefname}{Regel}%
124 \autoref{#1}%
125 \endgroup%
128 %%% Schriftfestlegungen.
129 \setkomafont{title}{\normalcolor\normalfont}
130 \setkomafont{sectioning}{\normalcolor\normalfont}
131 \setkomafont{section}{\Large}
132 \setkomafont{subsection}{\Large\itshape}
133 \setkomafont{descriptionlabel}{\normalfont\itshape}
135 %%% Einige Makros für logische Auszeichnungen definieren.
136 \newcommand*{\Abk}[1]{\mbox{\textsc{\lsstyle#1}}}
137 \newcommand*{\Paket}[1]{\textsf{#1}}
138 \newcommand*{\Programm}[1]{\lstinline[style=shell]{#1}}
139 \newcommand*{\Datei}[1]{\texttt{#1}}
141 \colorlet{falschcol}{red!80!black}
142 \colorlet{tradcol}{green!50!black}
143 \colorlet{reformcol}{green!75!black}
144 \colorlet{unerwcol}{red!60!black}
146 \newcolumntype{T}{>{\color{tradcol}}l}
147 \newcolumntype{R}{>{\color{reformcol}}l}
148 \newcolumntype{U}{>{\color{unerwcol}}l}
150 \newcommand*{\trennung}[2]{%
151 \makebox[0pt][l]{%
152 \color{#1}%
153 \smash{\rule[-3.5pt]{\widthof{#2}}{.7pt}}% Schriftabhängig.
157 \newcommand*{\ftr}[1]{\trennung{falschcol}{#1}}% Falsche Trennung.
159 %%% Satzspiegel erneut berechnen.
160 \typearea{last}
163 %%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
165 \begin{document}
167 %%% Trennausnahmen definieren.
168 \hyphenation{
169 Back-end
170 hyph-subst
171 Ent-wick-ler-re-po-si-to-ri-um
172 Wort-her-kunft
173 Not-tren-nung
174 Trenn-al-go-rith-mus
175 um-bruch-in-kom-pa-tib-le
178 %%% Protokollierung der Trennungen für findhyph.
179 %\tracingparagraphs=1
181 %%% Dokumenttitel.
182 \author{Die deutschsprachige Trennmustermannschaft}
183 \title{\Paket{dehyph-exptl}\thanks{This document describes the
184 \Paket{dehyph-exptl} package v1.0.}}
185 \subtitle{Experimentelle Trennmuster für die deutsche Sprache}
186 \maketitle
188 %%% Zweisprachige Zusammenfassung.
189 \selectlanguage{english}
190 \begin{abstract}
191 This document describes the experimental hyphenation patterns for
192 the German language, covering traditional and reformed orthography
193 for several varieties of Standard German. When using
194 \hologo{XeTeX}/\hologo{LuaTeX}, these patterns are used
195 automatically. In other cases, they have to be loaded explicitly.
196 More information can be found in the Trennmuster-Wiki%
197 \footnote{\url{https://wiki.dante.de/doku.php?id=trennmuster:trennmuster}}
198 (in German).
199 \end{abstract}
201 \selectlanguage{ngerman}
202 \begin{abstract}
203 Dieses Dokument beschreibt die experimentellen Trennmuster für die
204 deutsche Sprache, die das in Deutschland, Österreich und der Schweiz
205 gebräuchliche Standarddeutsch in der traditionellen und reformierten
206 Rechtschreibung abdecken. Bei Nutzung von
207 \hologo{XeTeX}/\hologo{LuaTeX} werden diese Muster automatisch
208 verwendet; in anderen Fällen müssen sie i.\,d.\,R. ausdrücklich
209 geladen werden.
210 \end{abstract}
212 \vfill
213 \begingroup
214 \em\large
216 \begin{center}
217 Warnung!
218 \end{center}
220 Diese Trennmuster befinden sich im experimentellen Status. Sie können
221 auf \Abk{ctan} und in den \hologo{TeX}"=Verteilungen jederzeit
222 durch umbruchinkompatible aktualisierte Versionen ersetzt werden. Für
223 Anwendungen, die einen dauerhaft stabilen Umbruch erfordern, sind sie
224 nur geeignet, falls manuell eine feste Version installiert wird.
225 \endgroup \vfill
227 \clearpage
228 %%% Zweispaltiges Inhaltsverzeichnis.
229 \begin{multicols}{2}
230 \RaggedRight
231 \small
232 \selectlanguage{ngerman}
233 \tableofcontents
234 \end{multicols}
237 \section{Einleitung}
238 \label{sec:einleitung}
240 Der in \hologo{TeX} implementierte Trennalgorithmus arbeitet
241 musterbasiert~\cite{liang:1983}. Prinzipiell können mit einem solchen
242 Algorithmus nicht alle möglichen Wörter korrekt getrennt werden. Die
243 Qualität der Worttrennung einer Sprache wird jedoch maßgeblich von der
244 Qualität der Wortliste beeinflusst, aus der die verwendeten
245 Trennmuster berechnet wurden.
247 Obwohl die herkömmlichen Trennmuster für die deutsche Sprache bei der
248 Worttrennung in gewöhnlichen Texten eine akzeptable Fehlerrate
249 erreichen, enthalten sie doch eine Reihe von Schwächen:%
250 \footnote{Diese Liste bezieht sich auf die Trennmusterdateien
251 \Datei{dehypht.tex}, Version~3.2a vom 3.\,3.\,1999, und
252 \Datei{dehyphn.tex}, Version~31 vom 7.\,5.\,2001.}
254 \bigskip\smallskip
255 \needspace{4\baselineskip}
256 \noindent\textit{traditionelle und reformierte Rechtschreibung}
258 \begin{itemize}
259 \item In zusammengesetzten Wörtern treten häufig Trennfehler an
260 Wortfugen auf.
262 \item Fremdwörter mit akzentuierten Buchstaben werden mangelhaft
263 getrennt: »C\ftr{af}é«, »Ci-tr\ftr{}n«, »F\ftr{}on«,
264 »vo\ftr{il}à«.
266 \item Die Trennmusterdateien enthalten eine Mischung aus \Abk{t1}-
267 sowie unvollständigen \Abk{ot1}-kodierten Mustern. Mit Erscheinen
268 von 16-Bit"=fähigen \hologo{TeX}"=Varianten werden sauber
269 \Abk{utf-8}"=kodierte Trennmuster nötig~\cite{miklavec:2008}.
270 \end{itemize}
272 \bigskip
273 \needspace{4\baselineskip}
274 \noindent\textit{traditionelle Rechtschreibung}
276 \begin{itemize}
277 \item Die herkömmlichen Trennmuster für die traditionelle deutsche
278 Rechtschreibung können mit \Programm{patgen} nicht reproduziert
279 werden, da die zugrundeliegende Wortliste verschollen ist. Die
280 Pflege der Trennmuster ist daher schwierig bis unmöglich. Für freie
281 Software ist dies kein zufriedenstellender Zustand.
283 \item Umfang und Qualität der ursprünglichen Wortliste lassen sich
284 nicht mehr einschätzen. Für die Trennmuster in traditioneller
285 Rechtschreibung existiert jedoch inzwischen eine Ausnahmeliste mit
286 über 3500 korrigierten Trennungen einfacher Wörter
287 \cite{lemberg:2003, lemberg:2005}.%
288 \footnote{\url{https://mirrors.ctan.org/language/hyphenation/dehyph/dehyphtex.tex}}
290 \item Wird in der traditionellen Rechtschreibung \emph{ß} durch
291 \emph{ss/SS} oder \emph{sz/SZ} ersetzt, so bleibt die Trennung davon
292 unberührt. Die herkömmlichen Trennmuster berücksichtigen diese
293 Regel nicht und trennen häufig den Ersatz:
294 \textls{»GR\ftr{ÖS"~S}}, \textls{»GR\ftr{ÜS"~S}},
295 \textls{»M\ftr{AS"~S}ES«}.%
296 \footnote{Die Trennung der herkömmlichen Muster entspricht den
297 Regeln der deutschen Standardsprache in der Schweiz, obwohl diese
298 Sprachvarietät vom Paket \Paket{Babel} bis 2013 nicht offiziell
299 unterstützt wurde. \Paket{Babel} versucht den Mangel mit Hilfe
300 des Kürzels \lstinline[style=LaTeX]+\"S+ zu kompensieren.}
302 \item Abweichende Schreibweisen, die in der traditionellen
303 Rechtschreibung in Österreich und der Schweiz verwendet werden,
304 werden mangelhaft getrennt: »Gro\ftr{s"~so}n-kel«,
305 »Ku\ftr{s"~sh}and«, »Ma\ftr{ssn}ah-me«, »mi\ftr{s"~sa}ch-ten«
306 (nur Schweiz) und »Ex-pre\ftr{ssz}ug«, »Fit-ne\ftr{s"~sc}en-ter«,
307 »Fit-ne\ftr{sst}rai-ner«.
308 \end{itemize}
310 \bigskip
311 \needspace{4\baselineskip}
312 \noindent\textit{reformierte Rechtschreibung}
314 \begin{itemize}
315 \item Die Trennmuster für die reformierte deutsche Rechtschreibung
316 wurden nicht mit \Programm{patgen} aus einer Wortliste erstellt.
317 Stattdessen wurden die Trennmuster für die traditionelle
318 Rechtschreibung von Hand an die reformierten Regeln
319 angepasst~\cite{schmidt:1998}. Aus diesem Grund ist die
320 Worttrennung mit den Trennmustern für die reformierte
321 Rechtschreibung etwas schlechter als mit den Trennmustern für die
322 traditionelle Rechtschreibung.
323 \end{itemize}
325 Das Projekt \emph{Freie Wortlisten und Trennmuster für die deutsche
326 Sprache} hat sich das Ziel gesetzt, neue Trennmuster hoher Qualität
327 für die deutsche Sprache zu erstellen, die die genannten Probleme
328 ausräumen.
330 Den experimentellen Trennmustern dieses Pakets liegt eine Wortliste
331 mit den etwa fünfhunderttausend häufigsten Wörtern der deutschen
332 Sprache zugrunde. Vermutlich ist diese Liste erheblich umfangreicher
333 als die ursprüngliche Wortliste, in der Worthäufigkeiten
334 wahrscheinlich überhaupt nicht berücksichtigt wurden. Die verwendete
335 Wortliste deckt das in Deutschland, Österreich und der Schweiz
336 gebräuchliche Standarddeutsch ab.
338 Mit den vorliegenden Trennmustern sollte für nicht"=fachsprachliche
339 Wörter eine sehr gute Trennqualität erreicht werden. Insbesondere
340 sollte sich die Trennung häufig auftretender zusammengesetzter Wörter
341 verbessern.
344 \section{Verwenden der Trennmuster}
345 \label{sec:verwenden}
347 Die experimentellen Trennmuster werden durch zwei verschiedene
348 \hologo{TeX}"=Pakete zur Verfügung gestellt, die beide in einer
349 vollständigen Installation einer aktuellen \hologo{TeX}"=Distribution
350 enthalten sein sollten.
352 Das Paket \Paket{hyph-utf8} enthält Trennmuster für alle von
353 \hologo{TeX} unterstützten Sprachen. Für die deutsche Sprache sind
354 die experimentellen Muster enthalten. Diese werden standardmäßig nur
355 von \hologo{XeTeX}, \hologo{LuaTeX} und p\TeX\footnote{Eine in Japan
356 populäre \TeX-Variante.} sowie von allen \hologo{TeX}"=Varianten für
357 die Schweizer Varietät der deutschen Sprache in traditioneller
358 Rechtschreibung\footnote{Diese Varietät wird erst seit dem Jahr 2013
359 unterstützt, sodass keine Abwärtskompatibilität erforderlich ist.}
360 benutzt. In den übrigen Fällen wird dagegen auf die herkömmlichen
361 Trennmuster zurückgegriffen.
363 Das Paket \Paket{dehyph-exptl} enthält die experimentellen
364 Trennmuster für die deutsche Sprache. Es hat den Zweck, diese den
365 Nutzern der älteren \hologo{TeX}"=Varianten wie \hologo{pdfTeX}
366 zugänglich zu machen. Die hierfür nötigen Vorkehrungen werden unten
367 beschrieben.
369 Siehe \autoref{sec:fragen} für Hinweise, wie die Version der in beiden
370 Paketen enthaltenen Muster ermittelt werden kann.
372 Zur manuellen Installation einer bestimmten Version der
373 experimentellen Trennmuster siehe \autoref{sec:installation}.
375 Beachte, in den folgenden Abschnitten ist \verb+<datum>+ durch das bei
376 der Installation angegebene Datum in \Abk{iso}"=Notation
377 (\verb+JJJJ-MM-TT+) oder die Zeichenkette \verb+latest+ zu ersetzen.
380 \subsection{Sprachvarietät und Rechtschreibung}
381 \label{sec:varietaeten}
383 Experimentelle Trennmuster stehen für die Worttrennung der deutschen
384 Sprache in der traditionellen und der reformierten Rechtschreibung zur
385 Verfügung. Die Trennmuster unterstützen die drei in Deutschland,
386 Österreich und der Schweiz gebräuchlichen Hauptvarietäten der
387 deutschen Standardsprache. \autoref{tab:varietaeten} zeigt die
388 Trennmuster, die abhängig von gewünschter Varietät und Rechtschreibung
389 in einem Dokument zu aktivieren sind.
391 \begin{table}
392 \centering
393 \caption{Die unterstützten Varietäten und Rechtschreibungen}
394 \label{tab:varietaeten}
395 \begin{tabular}{l>{\ttfamily}l}
396 \normalfont Sprachvarietät
397 & Trennmusterbezeichner\\
398 \addlinespace\toprule\addlinespace
399 \hspace*{-\tabcolsep}\normalfont\emph{traditionelle Rechtschreibung}\\
400 Deutschland, Österreich
401 & german-x-<datum>\\
402 Schweiz
403 & gswiss-x-<datum>\\\addlinespace
404 \hspace*{-\tabcolsep}\normalfont\emph{reformierte Rechtschreibung}\\
405 Deutschland, Österreich, Schweiz
406 & ngerman-x-<datum>\\
407 \end{tabular}
408 \end{table}
410 Varietäten, die sich nur in der Verwendung und Schreibung einzelner
411 Wörter voneinander unterscheiden, können durch gemeinsame Trennmuster
412 unterstützt werden.
413 % Die Eingabewortliste für \Programm{patgen} ist dann eine Vereinigung
414 % der den Varietäten entsprechenden Wortlisten.
415 Zum Beispiel werden Besonderheiten der österreichischen
416 Standardsprache in den Trennmustern für die Standardsprache
417 Deutschlands berücksichtigt. Österreichische und deutsche Anwender
418 können daher dieselben Trennmuster verwenden (wie das auch schon bei
419 den herkömmlichen Trennmustern der Fall war).
421 Aufgrund unvereinbarer Trennregeln in der traditionellen
422 Rechtschreibung der Standardsprachen Deutschlands/""Österreichs und
423 der Schweiz werden für die letztere Varietät eigene Trennmuster
424 bereitgestellt.
426 Mit der Rechtschreibreform 1996 wurden die Trennregeln aller drei
427 Standardsprachen so weit angeglichen, dass für die reformierte
428 Rechtschreibung einheitliche Trennmuster für alle drei unterstützten
429 Sprachvarietäten bereitgestellt werden können.
431 \subsection{Aktivieren der Trennmuster}
432 \label{sec:aktivieren}
434 Im Folgenden wird dargestellt, wie die experimentellen Trennmuster bei
435 Verwendung unterschiedlicher \hologo{TeX}"=Varianten geladen werden
436 können.
438 Das Ergebnis für die traditionelle und reformierte Rechtschreibung mit
439 herkömmlichen und experimentellen Trennmustern ist in
440 \autoref{tab:trennvarianten} zusammengefasst. Ob die experimentellen
441 Trennmuster korrekt aktiviert werden, kann mit dem folgenden kleinen
442 Dokument getestet werden, dessen Ausgabe in der \texttt{log}"=Datei
443 erscheint.
445 \begin{lstlisting}[style=LaTeX]
446 \begin{document}
447 \showhyphens{löste Fassade modernste Abendstern Mordopfer}
448 \end{document}
449 \end{lstlisting}
451 %\suppressfloats[t]
452 \begin{table*}
453 \centering
454 \caption{Trennvarianten}
455 \label{tab:trennvarianten}
456 \begin{tabular}{llll}
457 \multicolumn{2}{c}{\itshape traditionelle Rechtschreibung} &
458 \multicolumn{2}{c}{\itshape reformierte Rechtschreibung}\\
459 herkömmlich & experimentell & herkömmlich & experimentell\\
460 \addlinespace\toprule\addlinespace
461 l\ftr{ös-t}e & lö-ste & lös-te & lös-te\\
462 Fas-sa-de & Fas-sa-de & Fa\ftr{ss}a-de & Fas-sa-de\\
463 mo-\ftr{d-e}rn-ste & mo-dern-ste & mo-\ftr{d-e}rns-te & mo-derns-te\\
464 Abend-stern & Abend-stern & Aben\ftr{ds-t}ern & Abend-stern\\
465 Mo\ftr{r-do}p-fer & Mord-op-fer & Mo\ftr{r-do}p-fer & Mord-op-fer\\
466 \end{tabular}
467 \end{table*}
469 \subsubsection{Plain-\TeX}
470 \label{subsubsec:PlainTeX}
472 Bei Verwendung eines \hologo{eTeX}"=basierten Compilers
473 (\Programm{etex}, \Programm{pdftex}, \Programm{xetex} oder
474 \Programm{luatex}) steht der Befehl \verb+\uselanguage+ zum Laden von
475 Trennmustern zur Verfügung. Er akzeptiert neben anderen die Argumente
476 \texttt{german}, \texttt{ngerman} und \texttt{swissgerman} (nicht
477 jedoch \texttt{austrian}, \texttt{naustrian} und
478 \texttt{nswissgerman}).\footnote{Die zulässigen Sprachbezeichnungen
479 finden sich in der Datei \Datei{language.def} der
480 \hologo{TeX}"=Installation.} Um die Silbentrennung gemäß
481 reformierter deutscher Rechtschreibung zu aktivieren, ist also
482 folgender Befehl ausreichend:
484 \begin{lstlisting}[style=LaTeX]
485 \uselanguage{ngerman}
486 \end{lstlisting}
488 Die Compiler \Programm{xetex} und \Programm{luatex} verwenden für alle
489 definierten Varietäten der deutschen Sprache die experimentellen
490 Trennmuster, die mit dem Paket \Paket{hyph-utf8} installiert sind;
491 \Programm{etex} und \Programm{pdftex} tun dies nur für
492 \texttt{swissgerman}.
494 Für die Varietäten \texttt{german} und \texttt{ngerman} laden
495 \Programm{etex} und \Programm{pdftex} hingegen aus Gründen der
496 Abwärtskompatibilität die herkömmlichen Trennmuster. Die
497 experimentellen Trennmuster können am einfachsten aktiviert werden,
498 indem etwa \lstinline[style=LaTeX]+\uselanguage{ngerman}+ durch den
499 folgenden Befehl ersetzt wird:
501 \begin{lstlisting}[style=LaTeX]
502 \uselanguage{ngerman-x-latest}
503 \end{lstlisting}
505 Auf entsprechende Weise ist es mit allen Compilern möglich, eine
506 alternative, manuell installierte Trennmusterversion zu verwenden:
508 \begin{lstlisting}[style=LaTeX]
509 \uselanguage{ngerman-x-<datum>}
510 \end{lstlisting}
512 Vorausgesetzt ist dabei, dass ein entsprechender Eintrag in der
513 Konfigurationsdatei \Datei{language.def} oder einer lokalen Version
514 derselben existiert.
516 Soll der \verb+\uselanguage+-Befehl seine gewohnte Form behalten, ist
517 zum Laden alternativer Trennmuster auch folgendes Vorgehen mit Hilfe
518 des Pakets \Paket{hyphsubst} möglich:
520 \begin{lstlisting}[style=LaTeX]
521 \input hyphsubst.sty
522 \HyphSubstLet{ngerman}{ngerman-x-<datum>}
523 \uselanguage{ngerman}
524 \end{lstlisting}
526 Zu beachten ist, dass in Plain-\hologo{TeX} unabhängig vom verwendeten
527 Compiler Wörter mit Umlauten, \emph{ß} oder Akzentbuchstaben an vielen
528 Trennstellen nicht automatisiert getrennt werden können.
530 \subsubsection{\LaTeX{} mit dem Sprachenpaket \Paket{Babel}}
531 \label{subsubsec:LaTeX+Babel}
533 Das Paket \Paket{Babel} kennt für die traditionelle Rechtschreibung
534 die Sprachbezeichnungen \texttt{german}, \texttt{austrian} und
535 \texttt{swissgerman}, für die reformierte Rechtschreibung
536 \texttt{ngerman}, \texttt{naustrian} und \texttt{nswissgerman}, wobei
537 diese sechs Varietäten durch drei Trennmustersätze abgedeckt werden
538 können (\autoref{tab:varietaeten}).
540 Die Compiler \Programm{xelatex} und \Programm{lualatex} verwenden für
541 alle definierten Varietäten der deutschen Sprache die experimentellen
542 Trennmuster, die mit dem Paket \Paket{hyph-utf8} installiert sind;
543 \Programm{latex} und \Programm{pdflatex} tun dies nur für
544 \texttt{swissgerman}.
546 Für die übrigen fünf Varietäten laden \Programm{latex} und
547 \Programm{pdflatex} hingegen aus Gründen der Abwärtskompatibilität
548 standardmäßig die herkömmlichen Trennmuster. Um stattdessen die
549 experimentellen Trennmuster zu aktivieren, sind für die reformierte
550 Rechtschreibung folgende Zeilen in die Präambel des Dokuments
551 aufzunehmen.
553 \begin{lstlisting}[style=LaTeX]
554 \usepackage[T1]{fontenc}
555 \usepackage[ngerman]{babel}
556 \babelprovide[hyphenrules=ngerman-x-latest]{ngerman}
557 \end{lstlisting}
559 Für die österreichische Varietät:
561 \begin{lstlisting}[style=LaTeX]
562 \usepackage[T1]{fontenc}
563 \usepackage[naustrian]{babel}
564 \babelprovide[hyphenrules=ngerman-x-latest]{naustrian}
565 \end{lstlisting}
567 Auf entsprechende Weise ist es mit allen \hologo{LaTeX}"=Compilern
568 möglich, eine alternative, manuell installierte Trennmusterversion zu
569 aktivieren:
571 \begin{lstlisting}[style=LaTeX]
572 \usepackage[T1]{fontenc}
573 \usepackage[ngerman]{babel}
574 \babelprovide[hyphenrules=ngerman-x-<datum>]{ngerman}
575 \end{lstlisting}
577 Der Befehl \verb+\babelprovide+ erlaubt auch innerhalb eines Dokuments
578 das mehrfache Umschalten der Trennmuster.
580 \subsubsection{\hologo{XeLaTeX}/\hologo{LuaLaTeX} mit dem
581 Sprachenpaket \Paket{Polyglossia}}
582 \label{subsubsec:LaTeX+PolyGlossia}
584 Für \hologo{XeLaTeX} und \hologo{LuaLaTeX} steht als Alternative zu
585 \Paket{Babel} das Paket
586 \Paket{Polyglossia}\footnote{\url{https://ctan.org/pkg/polyglossia}}
587 zur Verfügung. Mit den Zeilen
589 \begin{lstlisting}[style=LaTeX]
590 \usepackage{polyglossia}
591 \setmainlanguage{german}
592 \end{lstlisting}
594 \noindent in der Präambel werden die mit dem Paket \Paket{hyph-utf8}
595 installierten Trennmuster für die \emph{reformierte} Rechtschreibung
596 geladen. Mit den Optionen \texttt{variant=""austrian},
597 \texttt{variant=""swiss} und \texttt{spelling=""old} können wahlweise
598 die österreichische Varietät, die Schweizer Varietät sowie die
599 traditionelle Rechtschreibung gewählt werden, beispielsweise:
601 \begin{lstlisting}[style=LaTeX]
602 \usepackage{polyglossia}
603 \setmainlanguage[variant=swiss, spelling=old]{german}
604 \end{lstlisting}
606 Um Trennhilfen wie \verb+""+, \verb+"ff+ oder \verb+"ck+ verwenden zu
607 können, muss zusätzlich die Option \texttt{babelshorthands=""true}
608 gesetzt werden.
610 Mit \hologo{XeLaTeX} ist es außerdem möglich, manuell installierte
611 statt der voreingestellten Trennmuster zu verwenden. Hierzu kommt das
612 Paket \Paket{hyphsubst} wie folgt zum Einsatz. Für die reformierte
613 Rechtschreibung:
615 \begin{lstlisting}[style=LaTeX]
616 \usepackage{polyglossia}
617 \setmainlanguage{german} % ggf. variant=austrian/swiss
618 \usepackage[ngerman=ngerman-x-<datum>]{hyphsubst}
619 \end{lstlisting}
621 Für die traditionelle Rechtschreibung in Deutschland und Österreich:
623 \begin{lstlisting}[style=LaTeX]
624 \usepackage{polyglossia}
625 \setmainlanguage[spelling=old]{german} % ggf. variant=austrian
626 \usepackage[german=german-x-<datum>]{hyphsubst}
627 \end{lstlisting}
629 Für die traditionelle Rechtschreibung in der Schweiz:
631 \begin{lstlisting}[style=LaTeX]
632 \usepackage{polyglossia}
633 \setmainlanguage[variant=swiss, spelling=old]{german}
634 \usepackage[swissgerman=gswiss-x-<datum>]{hyphsubst}
635 \end{lstlisting}
637 Mit \hologo{LuaLaTeX} in Verbindung mit \Paket{Polyglossia} ist das
638 Ersetzen der Trennmuster auf diese Weise nicht möglich.
640 \subsubsection{p\TeX/up\TeX}
642 Die in Japan gebräuchlichen \hologo{TeX}"=Varianten p\TeX{} und
643 up\TeX{} verwenden für deutschsprachige Texte die experimentellen
644 Trennmuster, die mit dem Paket \Paket{hyph-utf8} installiert sind.
646 \subsubsection{\hologo{ConTeXt}}
648 \hologo{ConTeXt} besitzt eigene Trennmusterdateien. Die Trennmuster
649 werden aus dem Paket \Paket{hyph-utf8} übernommen; Unterstützung für
650 die traditionelle deutsche Rechtschreibung in der Schweiz fehlt
651 allerdings zur Zeit.
653 Siehe \autoref{sec:fragen} für Hinweise, wie die Version der
654 \hologo{ConTeXt}-Trennmuster bestimmt werden kann.
656 \section{Trennregeln und Konventionen}
657 \label{sec:trennregeln}
659 Die Trennmuster für die traditionelle Rechtschreibung in Deutschland
660 und Österreich orientieren sich an den verbindlichen Regeln des Dudens
661 in der Fassung von 1991~\cite{duden:1991}. Dasselbe gilt für die
662 Trennmuster für die traditionelle Rechtschreibung in der Schweiz,
663 jedoch mit einer unten beschriebenen Abweichung. Die Trennmuster für
664 die reformierte Rechtschreibung orientieren sich an den amtlichen
665 Regeln für die Rechtschreibung der deutschen Sprache in der Fassung
666 von 2006~\cite{amtlRegeln:2006, amtlRegeln:2006:duden}.
668 Die Regeln lassen gewisse Freiheiten bei der Schreibung und Trennung
669 von Wörtern zu. Da sich solche Freiheiten nicht ohne weiteres auf die
670 maschinelle Worttrennung übertragen lassen, wurden die im folgenden
671 beschriebenen Konventionen getroffen. Hauptsächlich betreffen diese
672 die reformierte Rechtschreibung, die zusätzliche Freiheiten eingeführt
673 hat.\footnote{%
674 Im Ergebnis weicht in reformierter Rechtschreibung die Trennung zum
675 Beispiel des Dudens (nach Sprechsilben) von der Trennung mit diesen
676 Trennmustern (bevorzugt etymologisch) ab, siehe auch
677 \regelref{enum:reformEtymo} und \regelref{enum:reformClusterLR}
678 sowie \autoref{sec:fragen}.} Beziehen sich die Konventionen für die
679 reformierte Rechtschreibung auf die traditionelle Rechtschreibung, so
680 werden die entsprechenden Regeln etwas ausführlicher dargestellt. Die
681 folgenden Abschnitte enthalten jedoch keine vollständige Aufstellung
682 der Silbentrennregeln. Diese sind den entsprechenden Regelwerken zu
683 entnehmen. Es folgen zunächst einige allgemeine Hinweise:
685 \begin{itemize}
687 \item In Liangs Trennalgorithmus werden Groß- und Kleinschreibung
688 nicht unterschieden~\cite{liang:1983}. Die Schreibweisen
689 \emph{Nachtritt} und \emph{nachtritt} werden aus Sicht des
690 Trennalgorithmus gleich behandelt (siehe auch
691 \regelref{enum:tradDoppeld} und \regelref{enum:reformDoppeld}).
693 \item Die von einem Programm aus diesen Mustern abgeleiteten möglichen
694 Trennstellen können (u.\,a. durch Programmfehler) durchaus von denen
695 der zugrundeliegenden Wortliste abweichen. So führt zum Beispiel
696 die Eingabe \lstinline[style=LaTeX]+Meta"llegierung+
697 (Dreikonsonantenregel in der traditionellen Rechtschreibung) mit dem
698 Paket \Paket{Babel} zu den in \autoref{tab:trennung-dreik} gezeigten
699 Trennmöglichkeiten.
701 \begin{table}
702 \centering
703 \caption{Unterschiedlich ermittelte Trennmöglichkeiten.}
704 \label{tab:trennung-dreik}
705 \begin{tabular}{ll}
706 Quelle & Trennmöglichkeiten\\
707 \addlinespace
708 \toprule
709 \addlinespace
710 \hologo{pdfLaTeX} mit \Paket{Babel}~3.8 & Me-tall(-l)egierung\\
711 \hologo{pdfLaTeX} mit \Paket{Babel}~3.9 & Me-tall(-l)e-gie-rung\\
712 erwünscht \emph{(vgl. \regelref{enum:tradnstd})} & Me-tall(-l)egie-rung\\
713 \end{tabular}
714 \end{table}
716 \item Die von \hologo{TeX} gewählte Trennung kann in Einzelfällen mit
717 den \hologo{TeX}- und \Paket{Babel}"=Kürzeln
718 \lstinline[style=LaTeX]+\-+ und \lstinline[style=LaTeX]+"-+ geändert
719 werden. Für dokumentweite Änderungen der Trennung eignet sich das
720 Kommando \lstinline[style=LaTeX]+\hyphenation+.
722 \item Die Datei \Datei{CHANGES} beschreibt bekannte, systematische
723 Fehler der Trennmuster.
725 \item In den Beispielen zeigt die linke (grüne) Spalte jeweils die
726 Trennung mit den experimentellen Trennmustern, die rechten (roten)
727 Spalten zeigen alternative oder unerwünschte Trennungen.
729 \end{itemize}
731 \subsection{Traditionelle Rechtschreibung in Deutschland und
732 Österreich}
733 \label{sec:tradRS}
735 \begin{enumerate}[\hspace{1em}\itshape{T}1]
736 \labelformat{enumi}{\textit{T#1}}
738 \item\label{enum:tradhyphenmin} Die minimale unterstützte Silbenlänge
739 am Wortanfang und "~ende beträgt zwei Buchstaben
740 \cite[R~178]{duden:1991}.
742 Siehe \autoref{sec:fragen} für Hinweise, wie sich diese Länge
743 abweichend einstellen lässt. Wird die Mindestlänge auf weniger als
744 zwei Buchstaben verringert, so können fehlerhafte Trennungen
745 auftreten.
747 \item\label{enum:tradSinn} Sinnentstellende und irreführende
748 Trennungen werden möglichst vermieden \cite[R~181]{duden:1991}
749 (siehe auch \regelref{enum:tradnstd}):
751 \begin{tabular}[t]{TU}
752 An-alpha-bet & Anal-phabet\\
753 Kaf-ka-kenner & Kafkaken-ner\\
754 Tal-entwäs-se-rung & Talent-wässerung\\
755 \end{tabular}
757 Beachte, dass derzeit die Unterdrückung von solchen Trennstellen bis
758 zu einem gewissen Grade willkürlich und subjektiv ist. Außerdem ist
759 die Erfassung weit davon entfernt, vollständig zu sein. Um diesen
760 Problemen abzuhelfen, ist für zukünftige Versionen der Trennmuster
761 ein anderer, automatisierter Ansatz geplant, welcher die Anzahl
762 manuell zu erfassender Fälle sehr stark reduzieren wird.
764 \item\label{enum:tradDoppeld} In mehrdeutigen Wörtern werden
765 Trennungen nur an übereinstimmenden Trennstellen zugelassen.
767 \begin{tabular}[t]{TUU}
768 nachtritt & nach-tritt & Nacht-ritt\\
769 Wachstu-be & Wach-stube & Wachs-tube\\
770 Druckerzeug-nis & Druck-erzeugnis & Drucker-zeugnis\\
771 Mu-sikerle-ben & Musik-erleben & Musi-ker-leben\\
772 Fuß-balleh-re & Fußball-ehre & Fußball-lehre\\
773 \end{tabular}
775 Beachte, die Trennstellen »Drucker-zeugnis« und »Musiker-leben«
776 sind in den Interpretationen \emph{Druck-Erzeugnis} und
777 \emph{Musik-Erleben} irreführend. Sie entfallen nach
778 \regelref{enum:tradSinn} und sind nicht als übereinstimmende
779 Trennstellen anzusehen. Zur Spezialtrennung »Fußball-lehre« siehe
780 auch \regelref{enum:tradnstd}.
782 Für diese Regel gelten die folgenden Einschränkungen:
784 \begin{itemize}
786 \item Bei mehrdeutigen Wörtern endend auf \emph{"~ende},
787 \emph{"~enden}, \emph{"~endes} wird stets die Trennung der
788 Partizipform des Verbs verwendet.
790 \begin{tabular}[t]{TUU}
791 fu-ßen-de & Fuß-ende & fußende\\
792 spie-len-de & Spiel-ende & spielende
793 \end{tabular}
795 \item Mehrdeutigkeiten, die durch die Ersatzschreibweise von Wörtern
796 mit~\emph{ß} auftreten, werden nicht berücksichtigt (vergleiche
797 \regelref{enum:tradEszett}).
799 \begin{tabular}[t]{TUU}
800 Mas-se & \textls{M\kern-.4ptA-SSE} & \textls{M\kern-.4ptA\kern-.6ptSSE}
801 \end{tabular}
803 \end{itemize}
805 \item\label{enum:tradEszett} Wird der Buchstabe~\emph{ß} durch
806 \emph{ss/SS} ersetzt, so bleibt die Trennung davon unberührt
807 \cite[R~179]{duden:1991}:
809 \begin{tabular}[t]{T}
810 \textls{GRÖSS-TE}\\
811 \textls{GRÜ-SSE}\\
812 \textls{M\kern-.4ptA\kern-.4pt-SSES}\\
813 \end{tabular}
815 Für diese Regel gilt die folgende Einschränkung:
816 \begin{itemize}
818 \item Wenn durch den Ersatz von~\emph{ß} an dieser Stelle keine
819 eindeutige Trennung möglich ist, so wird zugunsten der Bedeutung
820 des Wortes in der normalen Schreibweise getrennt (siehe auch
821 \regelref{enum:tradDoppeld}).
823 \begin{tabular}[t]{TTU}
824 \textls{FLÖS-SE} & (wegen flös-se) & \textls{FLÖ-SSE}\\
825 \textls{MAS-SE} & (wegen Mas-se) & \textls{MA-SSE}\\
826 \end{tabular}
828 Beachte:
829 \begin{itemize}
831 \item Wird \emph{ß} mit \lstinline[style=LaTeX]+\MakeUppercase+
832 durch~\emph{SS} ersetzt, so bleibt \emph{SS} stets ungetrennt.
833 Die Trennung richtet sich dann nach der Schreibweise
834 mit~\emph{ß} im Quelldokument.
836 \item Existiert ein Wort in verschiedenen Varietäten in der
837 Schreibweise mit~\emph{ß} und mit~\emph{ss}, so wird aufgrund
838 dieser Einschränkung \emph{s-s} stets getrennt:
840 \begin{tabular}[t]{TTUU}
841 Ge-scho-ße & (AT)\\
842 Ge-schos-se & (D) & \textls{GESCHO-SSE} & (AT)\\
843 \end{tabular}
845 \item Wenn durch den Ersatz des~\emph{ß} an entfernten Stellen
846 keine eindeutige Trennung möglich wird, zum Beispiel an
847 Wortfugen, so werden die betroffenen Trennungen gemäß
848 \regelref{enum:tradDoppeld} unterdrückt. In der Folge wird
849 gegebenenfalls auch die Trennung von \emph{ss/SS} unterdrückt.
851 \begin{tabular}[t]{TU}
852 \textls{BAHN-HOFSTRASSE} & \textls{BAHNHOF-STRA-SSE}\\
853 & \textls{BAHNHOFS-TRAS-SE}\\
854 \end{tabular}
856 \end{itemize}
858 \end{itemize}
860 \item\label{enum:tradOW} In Ableitungen von Namen auf \emph{"~ow} wird
861 die Nottrennung der Ableitungssilben \emph{"~er}, \emph{"~ern},
862 \emph{"~ers} unterdrückt \cite[R~180]{duden:1991}:
864 \begin{tabular}[t]{TU}
865 Tel-tower & Teltow-er\\
866 Trep-towern & Treptow-ern\\
867 Pan-kowers & Pankow-ers\\
868 \end{tabular}
870 \item\label{enum:tradnstd} Spezialtrennungen (\emph{engl.:}
871 non-standard hyphenation), die nach Regeln erfolgen, die über das
872 bloße Einfügen eines Trennstrichs hinausgehen, wie die \emph{ck}"~
873 oder die Dreikonsonantenregel, kann \hologo{TeX} nicht automatisch
874 behandeln. Aus diesem Grund sind solche Trennstellen in diesen
875 Trennmustern nicht berücksichtigt.
877 \begin{tabular}[t]{lTUU}
878 \lstinline[style=LaTeX]+drucken+ & drucken & druk-ken\\
879 \lstinline[style=LaTeX]+Zuckerbäcker+ & Zucker-bäcker & Zuk-kerbäk-ker\\
880 \lstinline[style=LaTeX]+Brennessel+ & Brennes-sel & Brenn-nessel\\
881 \lstinline[style=LaTeX]+Stoffetzen+ & Stoffet-zen & Stoff-fetzen\\
882 \end{tabular}
884 Die Dreikonsonantenregel birgt aufgrund des ausgefallenen
885 Konsonanten die Gefahr irreführender und sinnentstellender
886 Trennungen (siehe auch \regelref{enum:tradSinn}). Trennstellen, die
887 in einem Abstand von zwei Lauten auf eine Wortfuge mit Anwendung der
888 Dreikonsonantenregel folgen, werden daher grundsätzlich unterdrückt.
890 \begin{tabular}[t]{lTUU}
891 \lstinline[style=LaTeX]+Metallegierung+ & Me-tallegie-rung & Metall-legierung & Metalle-gierung\\
892 \lstinline[style=LaTeX]+schnellebige+ & schnellebi-ge & schnell-lebige & schnelle-bige\\
893 \lstinline[style=LaTeX]+Stilleben+ & Stilleben & Still-leben & Stille-ben\\
894 \end{tabular}
895 \par\nobreak
896 \textit{auch:}
898 \begin{tabular}[t]{lTUU}
899 \lstinline[style=LaTeX]+Abfallager+ & Ab-fallager & Abfall-lager & Abfalla-ger\\
900 \lstinline[style=LaTeX]+Zellstoffabrik+ & Zell-stoffabrik & Zellstoff-fabrik & Zellstoffa-brik\\
901 \end{tabular}
903 Das Paket \Paket{Babel} stellt verschiedene Kürzel zur Verfügung,
904 u.\,a. \lstinline[style=LaTeX]+"ck+%
905 \footnote{Spezialtrennungen werden in \hologo{TeX} mit Hilfe des
906 Kommandos \lstinline[style=LaTeX]+\\discretionary+ kodiert. So
907 wird zum Beispiel das \Paket{Babel}-Kürzel
908 \lstinline[style=LaTeX]+\"ck+ in der Eingabe während der
909 Kompilation durch
910 \lstinline[style=LaTeX]+\\discretionary\{k-\}\{k\}\{ck\}+ ersetzt,
911 wodurch \emph{k-k}-Trennungen möglich werden.}
913 oder \lstinline[style=LaTeX]+"ff+ \emph{etc.}, mit denen
914 Spezialtrennungen im Quelldokument ausgezeichnet werden können
915 (siehe auch \autoref{tab:trennung-dreik}). Das Alternativpaket
916 \Paket{Polyglossia} stellt diese Kürzel ebenfalls zur Verfügung,
917 falls beim Laden der deutschen Sprache (in der Regel mit dem Befehl
918 \lstinline[style=LaTeX]+\setmainlanguage+) die Option
919 \lstinline[style=LaTeX]+babelshorthands=true+ angegeben wird.
921 \hologo{LuaTeX}%
922 \footnote{\url{http://www.luatex.org/}}
924 soll in einer zukünftigen Version Mechanismen zur automatischen
925 Behandlung von Spezialtrennungen bereitstellen. Eine physische
926 Auszeichnung im Quelltext ist dann nicht mehr erforderlich. Die
927 entsprechenden Spezialtrennmuster für die deutsche Sprache werden
928 ebenfalls im Rahmen dieses Projekts erstellt.
930 \end{enumerate}
932 \subsection{Traditionelle Rechtschreibung in der Schweiz}
933 \label{sec:tradchRS}
935 Die Trennmuster für die traditionelle Rechtschreibung in der Schweiz
936 folgen weitgehend den Konventionen für die traditionelle
937 Rechtschreibung in Deutschland (siehe \autoref{sec:tradRS}). Die
938 folgende Liste enthält daher nur Fälle, in denen davon abgewichen wird
939 oder deren Beschreibung aus anderen Gründen sinnvoll erscheint.
941 \begin{enumerate}[\hspace{1em}\itshape{TS}1]
942 \labelformat{enumi}{\textit{TS#1}}
944 \item\label{enum:tradchEszett} Wörter mit \emph{ß} werden gemäß den
945 Regeln für die traditionelle Rechtschreibung in Deutschland
946 getrennt.
948 \item\label{enum:tradchSS} Abweichend von \regelref{enum:tradEszett}
949 wird \emph{ss/SS} immer als Doppelkonsonant behandelt und
950 gegebenenfalls getrennt:
952 \begin{tabular}[t]{T}
953 grös-ste\\
954 Grüs-se\\
955 Mas-ses\\
956 \end{tabular}
958 Beachte, wird \emph{ß} jedoch mit
959 \lstinline[style=LaTeX]+\MakeUppercase+ durch~\emph{SS} ersetzt, so
960 bleibt~\emph{SS} stets ungetrennt. Die Trennung richtet sich dann
961 nach der Schreibweise mit~\emph{ß} im Quelldokument (siehe
962 \regelref{enum:tradchEszett}).
964 \end{enumerate}
966 \subsection{Reformierte Rechtschreibung}
967 \label{sec:reformRS}
969 \begin{enumerate}[\hspace{1em}\itshape{R}1]
970 \labelformat{enumi}{\textit{R#1}}
972 \item\label{enum:reformhyphenmin} Die minimale unterstützte Silbenlänge
973 am Wortanfang und "~ende beträgt zwei Buchstaben
974 \cite[\S~107]{amtlRegeln:2006, amtlRegeln:2006:duden}.
976 Siehe \autoref{sec:fragen} für Hinweise, wie sich diese Länge
977 abweichend einstellen lässt. Wird die Mindestlänge auf weniger als
978 zwei Buchstaben verringert, so können fehlerhafte Trennungen
979 auftreten.
981 \item\label{enum:reformEtymo} Falls die Trennung nach Sprechsilben und
982 die etymologische (sprachgeschichtliche) Trennung kollidieren, wird
983 weitgehend die etymologische Trennung gewählt
984 \cite[\S~113]{amtlRegeln:2006, amtlRegeln:2006:duden}:
986 \begin{tabular}[t]{RUU}
987 % Heli-ko-pter & Helikop-ter\\
988 % in-ter-view-en & intervie-wen\\
989 in-ter-es-sant & inte-ressant\\
990 Lin-ole-um & Li-noleum & Lino-leum\\
991 Päd-ago-ge & Pä-dagoge & Päda-goge\\
992 \end{tabular}
994 \item\label{enum:reformClusterLR} In Fremdwörtern bleiben die
995 Buchstabengruppen \emph{bl}, \emph{pl}, \emph{fl}, \emph{gl},
996 \emph{cl}, \emph{kl}, \emph{phl}; \emph{br}, \emph{pr}, \emph{dr},
997 \emph{tr}, \emph{fr}, \emph{vr}, \emph{gr}, \emph{cr}, \emph{kr},
998 \emph{phr}, \emph{thr}; \emph{chth}; \emph{gn}, \emph{kn} im
999 allgemeinen ungetrennt, nicht jedoch \emph{str}
1000 \cite[\S~112]{amtlRegeln:2006, amtlRegeln:2006:duden}
1001 i.\,V.\,m.~\cite[R~179]{duden:1991}:
1003 \begin{tabular}[t]{RU}
1004 Ar-thri-tis & Arth-ritis\\
1005 % Co-gnac & Cog-nac\\
1006 Di-plom & Dip-lom\\
1007 % Fe-bru-ar & Feb-ruar\\
1008 igno-rie-re & ig-noriere\\
1009 In-te-gral & Integ-ral\\
1010 \end{tabular}
1011 \par\nobreak
1012 \textit{aber:}
1014 \begin{tabular}[t]{RUU}
1015 In-dus-trie & Indu-strie & Indust-rie\\
1016 % Ma-gis-tra-le & Magi-strale\\
1017 de-struk-tiv\\
1018 sub-lim\\
1019 \end{tabular}
1021 \item\label{enum:reformSinn} Sinnentstellende und irreführende
1022 Trennungen werden möglichst vermieden \cite[\S~107]{amtlRegeln:2006,
1023 amtlRegeln:2006:duden}:
1025 \begin{tabular}[t]{RU}
1026 An-alpha-bet & Anal-phabet\\
1027 Kaf-ka-kenner & Kafkaken-ner\\
1028 Tal-entwäs-se-rung & Talent-wässerung\\
1029 \end{tabular}
1031 \item\label{enum:reformDoppeld} In mehrdeutigen Wörtern werden
1032 Trennungen nur an übereinstimmenden Trennstellen zugelassen:
1034 % Das »@{}« entfernt den rechten Rand der Tabelle und verhindert
1035 % so eine »overfull«-Warnung.
1036 \begin{tabular}[t]{RUUU@{}}
1037 Druckerzeug-nis & Dru-ckerzeugnis & Druck-erzeugnis &
1038 Drucker-zeugnis\\
1039 Mu-sikerle-ben & Musi-kerleben & Musik-erleben & Musiker-leben\\
1040 nachtritt & nach-tritt & Nacht-ritt\\
1041 Wachstu-be & Wach-stube & Wachs-tube\\
1042 \end{tabular}
1044 Beachte, die Trennstellen »Drucker-zeugnis« und »Musiker-leben«
1045 sind in den Interpretationen \emph{Druck-Erzeugnis} und
1046 \emph{Musik-Erleben} irreführend. Sie entfallen nach
1047 \regelref{enum:reformSinn} und sind nicht als übereinstimmende
1048 Trennstellen anzusehen.
1050 Für diese Regel gilt die folgende Einschränkung:
1052 \begin{itemize}
1054 \item Bei mehrdeutigen Wörtern endend auf \emph{"~ende},
1055 \emph{"~enden}, \emph{"~endes} wird stets die Trennung der
1056 Partizipform des Verbs verwendet.
1058 \begin{tabular}[t]{RUU}
1059 fu-ßen-de & Fuß-ende & fußende\\
1060 spie-len-de & Spiel-ende & spielende
1061 \end{tabular}
1063 \end{itemize}
1065 \item\label{enum:reformEszett} Wird der Buchstabe~\emph{ß} durch
1066 \emph{ss/SS} ersetzt, so wird \emph{s"~s} getrennt \cite[\S\S~25~E3,
1067 110]{amtlRegeln:2006, amtlRegeln:2006:duden}:
1069 \begin{tabular}[t]{R}
1070 \textls{GRÖS-STE}\\
1071 \textls{GRÜS-SE}\\
1072 \textls{M\kern-.4ptA\kern-.6ptS-SES}\\
1073 \end{tabular}
1075 Wird~\emph{ß} mit \lstinline[style=LaTeX]+\MakeUppercase+ oder in
1076 Kapitälchen in~\emph{SS} gewandelt, so bleibt~\emph{SS} ungetrennt.
1077 Dies ist kein Fehler in den Trennmustern, sondern im
1078 \hologo{LaTeX}-Kern fest implementiert.
1080 % \item\label{enum:reformOW} In Ableitungen von Namen auf \emph{"~ow}
1081 % bleibt \emph{"~ow} ungetrennt, wenn es den Laut [o\,:] bezeichnet.
1082 % Die Nottrennung der Ableitungssilben \emph{"~er}, \emph{"~ern},
1083 % \emph{"~ers} wird unterdrückt \cite[\S~113]{amtlRegeln:2006,
1084 % amtlRegeln:2006:duden}
1085 % i.\,V.\,m.~\cite[R~180]{duden:1991}:
1087 % \begin{tabular}[t]{RUU}
1088 % Tel-tower & Telto-wer & Teltow-er\\
1089 % Trep-towern & Trepto-wern & Treptow-ern\\
1090 % Pan-kowers & Panko-wers & Pankow-ers\\
1091 % \end{tabular}
1093 \end{enumerate}
1096 \section{Trennfehler}
1097 \label{sec:trennfehler}
1099 Mit den vorliegenden Trennmustern können sämtliche Wörter der
1100 zugrundeliegenden Wortliste fehlerfrei getrennt werden. Technisch
1101 gesprochen endet der letzte \Programm{patgen}-Lauf mit der Meldung
1103 \begin{lstlisting}[style=shell]
1104 1783028 good, 0 bad, 0 missed
1105 100.00 %, 0.00 %, 0.00 %
1106 \end{lstlisting}
1108 \noindent (der Wert vor \lstinline[style=shell]+good+ ist vom
1109 Listenumfang abhängig). Trotz des großen Umfangs der Wortliste lassen
1110 sich Trennfehler in Wörtern, die nicht in der Liste enthalten sind,
1111 nicht vermeiden. Der Umfang der Wortliste kann allerdings nicht
1112 beliebig erweitert werden.%
1113 \footnote{Liangs Schema sieht nur einen begrenzten Bereich für die
1114 Trennstellenbewertungen vor (0--9). Die derzeitigen Trennmuster
1115 vewenden Bewertungen bis zur Höhe~7.}
1117 In den folgenden Fällen sollten fehlerhafte Trennungen der Trennmuster
1118 jedoch gemeldet werden:
1120 \begin{enumerate}[\hspace{1em}A.]
1122 \item\label{enum:kritWLfehlerhaft} Das Wort ist bereits in der
1123 Wortliste enthalten. Der Eintrag ist jedoch fehlerhaft.
1125 \end{enumerate}
1127 Falls das Wort nicht in der Wortliste enthalten ist, bestehen sehr
1128 gute Chancen, dass es aufgenommen wird, wenn eines der folgenden
1129 Kriterien erfüllt ist:
1131 \begin{enumerate}[\hspace{1em}A.]
1132 \refstepcounter{enumi}% Fortsetzung der obigen Aufzählung.
1134 \item\label{enum:kritHerkTM} Das betreffende Wort wird mit den
1135 \emph{herkömmlichen} Trennmustern für die traditionelle oder
1136 reformierte Rechtschreibung korrekt getrennt. Korrekt bedeutet
1137 hier: Nicht alle möglichen Trennstellen müssen erkannt werden; es
1138 werden jedoch in keinem Fall falsche Trennstellen ermittelt. Zum
1139 Testen kann in \TeX\ der folgende Aufruf verwendet werden (die
1140 Ausgabe erfolgt in der \texttt{log}-Datei):
1142 \begin{lstlisting}[style=LaTeX]
1143 \showhyphens{durch Leerzeichen getrennte Wörter}
1144 \end{lstlisting}
1146 \item\label{enum:kritSinn} Es handelt es sich um eine orthographisch
1147 richtige, aber sinnentstellende oder irreführende Trennung.
1148 Berücksichtigt werden allerdings nur Wörter, die aus höchstens zwei
1149 (gegebenenfalls prä- und suffigierten) Wörtern zusammengesetzt sind,
1150 zum Beispiel »Talent-wässerung«. Nicht berücksichtigt wird
1151 hingegen die »Talent-wässerungsanlage«.
1153 \end{enumerate}
1155 Einige bekannte Fehler in den Trennmustern sind in der Datei
1156 \Datei{CHANGES} verzeichnet. Noch nicht bekannte falsche, fehlende
1157 und unerwünschte Worttrennungen können an die E-Mail-Adresse
1158 \href{mailto:trennmuster@dante.de}{trennmuster@dante.de} gerichtet
1159 werden.
1161 Trennfehler, die in den Trennmustern nicht korrigiert werden können,
1162 können mit Hilfe einer privaten Ausnahmeliste behandelt werden:
1164 \begin{lstlisting}[style=LaTeX]
1165 \hyphenation{Tal-entwäs-se-rungs-an-la-ge Kaf-ka-kenner-klub}
1166 \end{lstlisting}
1168 Die aktuelle und ältere Ausgaben der Trennmuster sind im Dateibereich
1169 des Trennmuster-Wikis erhältlich.%
1170 \footnote{\url{https://wiki.dante.de/doku.php?id=trennmuster:trennmuster}}
1172 Im Entwicklerrepositorium\footnote{%
1173 siehe \url{https://wiki.dante.de/doku.php?id=trennmuster:projekt-trennmuster}}
1174 befindet sich ein Makefile, mit dem jederzeit neue Trennmuster erzeugt
1175 werden können.
1177 \nobreak
1178 \noindent\parbox{\linewidth}{%
1179 \vspace*{\baselineskip}
1180 \raggedright
1181 \itshape
1182 Happy \TeX ing!\newline
1183 Die deutschsprachige Trennmustermannschaft
1187 \begingroup
1188 \RaggedRight
1189 \bibliography{dehyph-exptl}
1190 \endgroup
1193 \appendix
1194 \section{Dateien und Installation}
1195 \label{sec:installation}
1197 Die eigentlichen Trennmusterdateien liegen in \Abk{utf-8}"=Kodierung
1198 vor (siehe \autoref{tab:dateien}, Endung \texttt{.pat}). Sie werden
1199 von \hologo{TeX} nicht direkt geladen, sondern durch Manteldateien,
1200 die ebenfalls Teil des Pakets sind (Endung \texttt{.tex}). Wird eine
1201 8-Bit-fähige \hologo{TeX}"=Variante erkannt, übernehmen diese
1202 Manteldateien die Konvertierung der Trennmuster in die
1203 \Abk{t1}-Kodierung.
1205 \begin{table}
1206 \centering
1207 \caption{Trennmuster- und Manteldateien}
1208 \label{tab:dateien}
1209 \begin{tabular}{l>{\ttfamily}l>{\ttfamily}l}
1210 Rechtschreibung & \normalfont Trennmusterdatei & \normalfont Manteldatei\\
1211 \addlinespace\toprule\addlinespace
1212 traditionell & dehypht-x-<datum>.pat & dehypht-x-<datum>.tex\\
1213 traditionell (Schweiz) & dehyphts-x-<datum>.pat & dehyphts-x-<datum>.tex\\
1214 reformiert & dehyphn-x-<datum>.pat & dehyphn-x-<datum>.tex\\
1215 \end{tabular}
1216 \end{table}
1218 Bei der Installation werden die Manteldateien an die in
1219 \autoref{tab:varietaeten} gezeigten Trennmusterbezeichner gebunden.
1220 Diese Schritte werden für verschiedene \hologo{TeX}"=Verteilungen in
1221 der Datei \Datei{INSTALL} beschrieben. Nach der Installation können
1222 die experimentellen Trennmuster wie in \autoref{sec:aktivieren}
1223 gezeigt verwendet werden.
1226 \section{Fragen \& Antworten}
1227 \label{sec:fragen}
1229 \newcommand*{\fragefont}{\itshape}
1230 \newcommand*{\themenfont}{\large\normalfont}
1231 \newcounter{cntfrage}% Zähler für Fragen.
1232 \newcounter{thema}% Zähler für Themenüberschriften.
1233 \renewcommand*{\thethema}{\Roman{thema}.}
1234 \newcounter{frage}% Zähler für Fragen.
1235 \renewcommand*{\thefrage}{\arabic{frage}.}
1236 \newboolean{nextfrage}
1238 \makeatletter
1240 %%% Neue zref-Liste frage = (type, text, anchor).
1241 \zref@newlist{frage}
1242 \zref@newprop{type}{f}
1243 \zref@newprop{text}{??}
1244 \zref@addprop{frage}{type}
1245 \zref@addprop{frage}{text}
1246 \zref@addprop{frage}{anchor}
1248 %%% Fügt eine neue Themenüberschrift ein.
1249 \newcommand*{\fragenthema}[1]{%
1250 \par
1251 \pagebreak[1]
1252 \vspace{1.5\baselineskip plus .6\baselineskip minus .6\baselineskip}
1253 \refstepcounter{cntfrage}
1254 \stepcounter{thema}
1255 \zref@setcurrent{type}{t}
1256 \zref@setcurrent{text}{\thethema~#1}
1257 \zref@labelbylist{frage:\thecntfrage}{frage}
1258 \noindent{\themenfont\thethema~#1\par}
1261 %%% Umgebung für eine Frage mit Antwort.
1262 \newenvironment{frageantwort}[1]{%
1263 \par
1264 \vspace{.25\baselineskip plus .1\baselineskip minus .1\baselineskip}
1265 \refstepcounter{cntfrage}
1266 \stepcounter{frage}
1267 % bei Aufzählungen innerhalb einer Frage römisch nummerieren
1268 \renewcommand{\labelenumi}{\roman{enumi}.}
1269 \zref@setcurrent{type}{f}
1270 \zref@setcurrent{text}{\thefrage~#1}
1271 \zref@labelbylist{frage:\thecntfrage}{frage}
1272 \noindent{\fragefont\thefrage~#1\par}
1273 \nobreak\noindent\ignorespaces
1275 \vspace{.25\baselineskip plus .1\baselineskip minus .1\baselineskip}
1278 %%% Zeige alle Fragen in sortierter Reihenfolge.
1279 \newcommand{\zeigefragen}{%
1280 \par
1281 \zref@refused{frage:1}
1282 \setcounter{cntfrage}{1}
1283 \setboolean{nextfrage}{true}
1284 \whiledo{\boolean{nextfrage}}{
1285 \vspace{.25\baselineskip plus .1\baselineskip minus .1\baselineskip}
1286 \ifthenelse{\equal{\zref@extract{frage:\thecntfrage}{type}}{f}}{% Frage
1287 \noindent%
1288 \begingroup%
1289 \fragefont%
1290 \hyperlink{\zref@extract{frage:\thecntfrage}{anchor}}{%
1291 \zref@extract{frage:\thecntfrage}{text}%
1293 \par
1294 \endgroup
1295 }{% Themenüberschrift
1296 \noindent%
1297 \begingroup%
1298 \themenfont%
1299 \zref@extract{frage:\thecntfrage}{text}%
1300 \par
1301 \endgroup
1302 \nobreak
1304 \stepcounter{cntfrage}
1305 \zref@ifrefundefined{frage:\thecntfrage}{\setboolean{nextfrage}{false}}{}
1307 \vspace{.5\baselineskip plus .1\baselineskip minus .1\baselineskip}
1308 \setcounter{cntfrage}{0}
1309 \setcounter{frage}{0}
1313 \zeigefragen
1316 \fragenthema{Verwenden der Trennmuster}
1318 \begin{frageantwort}{Wie kann für die experimentellen Trennmuster aus
1319 dem Paket \Paket{dehyph-exptl} das Datum ermittelt werden, das
1320 Teil des Trennmusterbezeichners ist, wie in
1321 \autoref{sec:verwenden} erwähnt?}
1323 Die Trennmusterbezeichner werden in der Datei \Datei{language.dat}
1324 definiert, wo auch die Verbindung zu den Manteldateien hergestellt
1325 wird. Da ein Teil der Trennmusterbezeichner bereits bekannt ist,
1326 \verb+german-x+, vgl. \autoref{tab:varietaeten}, kann die Datei
1327 \Datei{language.dat} danach durchsucht werden. Zunächst muss der
1328 Ort der Datei mit Hilfe des Kommandos \Programm{kpsewhich} ermittelt
1329 werden. Es folgen die vollständigen Kommandos für unixähnliche
1330 Shells und die Windows-Kommandozeile \Datei{cmd.exe} (einzugeben
1331 ohne Zeilenumbruch). Achtung, bei den einfachen Anführungszeichen
1332 handelt es sich um Gravis (»Backquotes«).
1334 \begin{lstlisting}[style=shell, caption=Shell]
1335 grep -i german-x `kpsewhich language.dat`
1336 \end{lstlisting}
1338 \begin{lstlisting}[style=shell, caption=\Datei{cmd.exe}]
1339 for /F "usebackq" %f in (`kpsewhich language.dat`)
1340 do find /i "german-x" "%f"
1341 \end{lstlisting}
1343 Die Ausgabe dieser Kommandos sieht etwa wie folgt aus (das Datum
1344 kann abweichen):
1346 \begin{lstlisting}
1347 german-x-2024-02-28 dehypht-x-2024-02-28.tex
1348 =german-x-latest
1349 ngerman-x-2024-02-28 dehyphn-x-2024-02-28.tex
1350 =ngerman-x-latest
1351 \end{lstlisting}
1353 Die gesuchten Trennmusterbezeichner befinden sich in der ersten
1354 Spalte und lauten in diesem Beispiel
1355 \lstinline[style=LaTeX]{german-x-2024-02-28} und
1356 \lstinline[style=LaTeX]{ngerman-x-2024-02-28}. In der zweiten
1357 Spalte kann man die Namen der Manteldateien erkennen
1358 (vgl. \autoref{tab:dateien}). Die mit einem Gleichheitszeichen
1359 beginnenden Zeilen definieren ein Synonym für den
1360 Trennmusterbezeichner der unmittelbar vorangehenden Zeile in der
1361 Datei \Datei{language.dat}.
1362 \end{frageantwort}
1365 \begin{frageantwort}{Wie kann die Version der experimentellen Muster
1366 ermittelt werden, die im Paket \Paket{hyph-utf8} enthalten sind?}
1368 Das Vorgehen ähnelt dem der vorherigen Antwort. Zunächst wird der
1369 Ort einer bestimmten Datei ermittelt. Diese wird dann nach einer
1370 hilfreichen Zeichenkette durchsucht.
1372 \begin{lstlisting}[style=shell, caption=Shell]
1373 grep dehyph `kpsewhich hyph-de-1996.tex`
1374 \end{lstlisting}
1376 \begin{lstlisting}[style=shell, caption=\Datei{cmd.exe}]
1377 for /F "usebackq" %f in (`kpsewhich hyph-de-1996.tex`)
1378 do find "dehyph" "%f"
1379 \end{lstlisting}
1381 Die Ausgabe dieser Kommandos sieht etwa wie folgt aus (das Datum
1382 kann abweichen):
1384 \begin{lstlisting}
1385 \message{German Hyphenation Patterns (Reformed Orthography, 2006)
1386 `dehyphn-x' 2024-02-28 (WL)}
1387 \end{lstlisting}
1388 \end{frageantwort}
1390 \begin{frageantwort}{Wie kann die Version der experimentellen Muster
1391 ermittelt werden, die von \hologo{ConTeXt} verwendet werden?}
1393 Derzeit (Stand Februar 2021) gibt es keine Möglichkeit, die Version direkt
1394 zu ermitteln. Allerdings werden die \hologo{ConTeXt}-Muster automatisch
1395 aus den vorhandenen \Paket{hyph-utf8}-Mustern erzeugt; die Versionen sind
1396 daher ident zu den in \hologo{XeTeX} verwendeten Mustern.
1397 \end{frageantwort}
1399 \begin{frageantwort}{Ich habe neue Trennmuster erstellt. Wie kann ich diese
1400 installieren?}
1402 Die folgende Antwort richtet sich an Nutzer von \hologo{TeX} Live, die auf
1403 ihrem System über Administrationsrechte verfügen.
1405 \begin{enumerate}
1407 \item Überprüfen Sie, ob auf Ihrem System das Verzeichnis
1408 \Datei{TEXMFLOCAL\slash tex\slash generic\slash config}
1409 existiert.\footnote{Bei \Datei{TEXMFLOCAL} handelt es sich um den lokalen
1410 Baum der \hologo{TeX}-Installation, unter Unix in der Regel
1411 \Datei{/usr/local/texlive/texmf-local}, unter Windows \Datei{C:\textbackslash
1412 texlive\textbackslash texmf-local}.} Falls nicht, legen Sie es an.
1414 \item Überprüfen Sie, ob im Verzeichnis \Datei{TEXMFLOCAL\slash tex\slash
1415 generic\slash config} die Dateien \Datei{language-local.dat} und
1416 \Datei{language-local.def} existieren. Falls nicht, legen Sie sie an.
1418 \item Ergänzen Sie in der Datei \Datei{language-local.def} die folgende
1419 Zeile:\footnote{Als Vorbild für die erforderlichen Angaben können die
1420 vorhandenen Eintragungen in den Konfigurationsdateien \Datei{language.def}
1421 und \Datei{language.dat} der \hologo{TeX}-Installation dienen.}
1423 \begin{lstlisting}[style=LaTeX]
1424 \addlanguage{<Name>}{<Datei>}{<Ausnahmedatei>}{<lmin>}{<rmin>}
1425 \end{lstlisting}
1427 \noindent Dabei ist \texttt{<Name>} eine selbstgewählte Bezeichnung für die
1428 Trennmuster, \texttt{<Datei>} der Name der Trennmusterdatei bzw. der
1429 Manteldatei, wenn es eine solche gibt (vgl. \autoref{sec:installation}),
1430 \texttt{<Ausnahmedatei>} ggf. eine Datei mit Trennausnahmen (ansonsten leer),
1431 \texttt{<lmin>} die Mindestlänge einer am Wortanfang und
1432 \texttt{<rmin>} die Mindestlänge einer Wortende abgetrennten
1433 Silbe. Für deutsche Trennmuster setzt man die beiden letztgenannten Werte
1434 typischerweise auf \texttt{2}.
1436 Ergänzen Sie entsprechend in der Datei \Datei{language-local.dat} die
1437 folgende Zeile:
1439 \begin{lstlisting}
1440 <Name> <Datei>
1441 \end{lstlisting}
1443 \item Verschieben Sie Ihre Trennmusterdateien in das Verzeichnis
1444 \Datei{TEXMFLOCAL\slash tex\slash generic}.
1446 \item Führen Sie \emph{als Administrator} die Befehle
1448 \begin{lstlisting}[style=shell]
1449 mktexlsr
1450 \end{lstlisting}
1452 \noindent und
1454 \begin{lstlisting}[style=shell]
1455 tlmgr generate --rebuild-sys language
1456 \end{lstlisting}
1458 \noindent aus.
1460 \end{enumerate}
1462 Die so installierten Trennmuster können nun den Hinweisen in
1463 \autoref{sec:aktivieren} entsprechend aktiviert werden.
1464 \end{frageantwort}
1466 \begin{frageantwort}{Um in bestimmten Dokumenten einen dauerhaft stabilen
1467 Umbruch zu erreichen, will ich verhindern, dass die zur Zeit vorhandenen
1468 Trennmuster bei einer Aktualisierung der \hologo{TeX}-Installation verloren
1469 gehen. Wie gehe ich vor?}
1471 Suchen Sie auf Ihrem System nach der benötigten Trennmusterdatei und der
1472 zugehörigen Manteldatei gemäß \autoref{tab:dateien} und erstellen Sie Kopien
1473 dieser Dateien. Folgen Sie dann den Anweisungen der Antwort auf die vorige
1474 Frage.
1476 \end{frageantwort}
1479 \fragenthema{Rechtschreibung}
1481 \begin{frageantwort}{Verlag, Prüfer o.\,ä. bemängeln die Trennung der
1482 Trennmuster für die reformierte Rechtschreibung. Zum Beispiel
1483 wird »In-dus-trie« getrennt, der Duden trennt jedoch
1484 »In-dust-rie«.}
1486 Die amtlichen Regeln für die Rechtschreibung der deutschen Sprache
1487 lassen für viele Wörter mehrere Trennvarianten zu. Die Trennmuster
1488 und ebenso Wörterverzeichnisse legen sich aus praktischen Gründen
1489 auf eine Trennvariante fest. Sie können daher unterschiedliche
1490 Trennungen verwenden, ohne dass eine von beiden falsch ist. Aus
1491 diesem Grund sind Wörterverzeichnisse nicht geeignet, eine bestimmte
1492 Trennung auf Richtigkeit zu prüfen. Verbindlich sind einzig die
1493 amtlichen Regeln für die Rechtschreibung der deutschen
1494 Sprache~\cite{amtlRegeln:2006}. Häufig sind diese im Anhang eines
1495 Wörterbuchs abgedruckt. Die von den Trennmustern befolgten
1496 Konventionen können \autoref{sec:trennregeln} entnommen werden.
1498 Wenn Unsicherheit darüber herrscht, wie die Rechtschreibung geprüft
1499 wird, sollte dies frühzeitig geklärt werden. Nicht jedem Redakteur
1500 oder Prüfer ist bewusst, dass der Duden seine normative Stellung mit
1501 der Rechtschreibreform~1996 eingebüßt hat.
1502 \end{frageantwort}
1505 \begin{frageantwort}{Gibt es dudenkonforme Trennmuster für die
1506 reformierte Rechtschreibung?}
1508 Zur Zeit nicht, es ist auch nicht geplant. Dieses Projekt ist
1509 jedoch offen für Vorschläge und Mitarbeit.
1510 \end{frageantwort}
1513 \begin{frageantwort}{Weshalb werden noch Trennmuster für die
1514 traditionelle Rechtschreibung bereitgestellt?}
1516 Die amtlichen Regeln für die Rechtschreibung der deutschen Sprache
1517 in der Fassung von 2006 sind nur für öffentliche Einrichtungen und
1518 Behörden verbindlich. Im privaten Schriftverkehr kann man wahlweise
1519 die traditionelle oder die reformierte Rechtschreibung verwenden.%
1520 \footnote{Oder auch keine von beiden.}
1522 Daher erfreut sich die traditionelle Rechtschreibung weiterhin
1523 großer Beliebtheit.
1525 Für Texte in gebrochener Schrift ist die traditionelle
1526 Rechtschreibung sogar vorzuziehen.
1527 \end{frageantwort}
1529 \begin{frageantwort}{In der Voreinstellung für die deutsche Sprache
1530 beträgt die Mindestlänge abgetrennter Silben zwei Buchstaben. Wie
1531 kann diese Mindestlänge verändert werden?}
1533 Nehmen wir an, am Wortanfang sollen nicht weniger als drei und am
1534 Wortende nicht weniger als vier Buchstaben abgetrennt werden. Dann
1535 sind folgende Befehle nötig:
1537 \begin{itemize}
1538 \item Mit Plain-\hologo{TeX}:
1540 \begin{lstlisting}[style=LaTeX]
1541 \uselanguage{<sprache>}
1542 \lefthyphenmin=3
1543 \righthyphenmin=4
1544 \end{lstlisting}
1546 Ersetze dabei \texttt{<sprache>} durch eine der in
1547 \autoref{subsubsec:PlainTeX} erwähnten Trennmusterbezeichnungen,
1548 beispielsweise \texttt{ngerman}.
1550 \item Mit \hologo{LaTeX} und \Paket{Babel}:
1552 \begin{lstlisting}[style=LaTeX]
1553 \usepackage[<sprache>]{babel}
1554 \renewcommand*{\<sprache>hyphenmins}{34}
1555 \end{lstlisting}
1557 Ersetze dabei \texttt{<sprache>} durch eine der in
1558 \autoref{subsubsec:LaTeX+Babel} erwähnten
1559 \Paket{Babel}-Sprachbezeichnungen, beispielsweise
1560 \texttt{ngerman}.
1562 \item Mit \hologo{XeLaTeX}/\hologo{LuaLaTeX} und
1563 \Paket{Polyglossia} (Version 1.50 oder neuer):
1565 \begin{lstlisting}[style=LaTeX]
1566 \usepackage{polyglossia}
1567 \setmainlanguage{german}
1568 \setlanghyphenmins[<option>]{<sprache>}{3}{4}
1569 \end{lstlisting}
1571 Ersetze dabei \texttt{<option>} und \texttt{<sprache>} durch eine der in
1572 \autoref{subsubsec:LaTeX+PolyGlossia} erwähnten
1573 \Paket{Polyglossia}-Sprachbezeichnungen, beispielsweise
1574 \texttt{spelling=old} und \texttt{german}.
1575 \end{itemize}
1576 \end{frageantwort}
1578 \begin{frageantwort}{Können Trennungen mit einer Silbenlänge von nur
1579 einem Buchstaben ermöglicht werden, zum Beispiel für den Satz in
1580 schmalen Kolumnen?}
1582 Mit diesen Trennmustern ist das nicht möglich. Die
1583 Abtrennung einzelner Vokale, zum Beispiel »A-bend«, war nur
1584 kurzzeitig zulässig; die entsprechende Regelung von 1996 wurde mit
1585 der Rechtschreibreform 2006 wieder zurückgenommen. Wird die
1586 Silbenmindestlänge für die Worttrennung auf eins verringert, können
1587 falsche Trennungen auftreten.
1588 \end{frageantwort}
1591 \fragenthema{Mitarbeit}
1593 \begin{frageantwort}{Wie kann ich mich über dieses Projekt
1594 informieren?}
1596 Zentrale Anlaufstelle ist das Trennmuster-Wiki, welches sich
1597 momentan jedoch noch im Aufbau befindet.%
1598 \footnote{\url{https://wiki.dante.de/doku.php?id=trennmuster:trennmuster}}
1600 Für Fragen und Hinweise kann nach Anmeldung die Mailingliste%
1602 \footnote{\href{mailto:trennmuster@dante.de}{trennmuster@dante.de}}
1604 genutzt werden.
1606 \begin{itemize}
1608 \item Die Datei \Datei{CHANGES} enthält bekannte, systematische
1609 Fehler der Trennmuster.
1611 \item Das
1612 Entwicklerrepositorium%
1614 \footnote{\url{https://repo.or.cz/wortliste.git/tree/HEAD:/dokumente}}
1616 enthält im Verzeichnis \Datei{dokumente} eine Reihe von Dateien, welche
1617 u.\,a. Trennregeln und Trennstile im Detail beschreibt.
1619 \end{itemize}
1620 \end{frageantwort}
1623 \begin{frageantwort}{Wie kann ich helfen?}
1625 Die deutschsprachige Trennmustermannschaft ist eine offene Gruppe
1626 und benötigt dringend weitere Mithilfe. Interessenten sind daher
1627 hoch willkommen! Zum Mitmachen gibt es mehrere Möglichkeiten:
1629 \begin{itemize}
1630 \item Die einfachste ist, die experimentellen Trennmuster ausgiebig
1631 zu testen und Fehler zu melden (siehe \autoref{sec:trennfehler}).
1633 \item Besonders hilfreich wäre Mitarbeit am Projekt. Als Einstieg
1634 kann die (grobe) Aufgabenliste in der Projektbeschreibung dienen.
1636 Obwohl schon experimentelle Trennmuster veröffentlicht wurden,
1637 steht dieses Projekt noch ziemlich am Anfang. Ziel ist, die
1638 verwendete Wortliste von möglichst vielen Menschen in verteilter
1639 Arbeit auf Richtigkeit zu prüfen. Bis dahin bleibt jedoch noch
1640 viel zu tun.
1642 \item Mittelfristig -- nach Fertigstellung der Prüfmaske~-- kann
1643 auch durch systematische Durchsicht eines Teils der Wortliste
1644 geholfen werden.
1646 \item Fragen, Hinweise und Ideen sind auf der Mailingliste immer
1647 willkommen!
1648 \end{itemize}
1649 \end{frageantwort}
1652 \begin{frageantwort}{Sollten Trennfehler einzeln oder gesammelt
1653 eingereicht werden?}
1655 Das ist egal. Es sollten allerdings die folgenden Hinweise beim
1656 Einreichen von Fehlern beachtet werden:
1658 \begin{description}
1659 \setkomafont{descriptionlabel}{\normalfont\itshape}
1661 \item[Aktualität] Wenn ältere Trennmusterdateien verwenden werden,
1662 bitte zuerst prüfen, ob der Fehler auch mit aktuellen Trennmustern
1663 auftritt. Die aktuellen Trennmuster sind auf \Abk{ctan} im Paket
1664 \Paket{dehyph-exptl} oder im Dateibereich unter der
1665 Projekt-\Abk{url} erhältlich. Im Repositorium befindet sich auch
1666 ein Makefile, mit dem jederzeit neue Trennmuster aus der aktuellen
1667 Wortliste erzeugt werden können.
1669 \item[Informationen] In einem Fehlerbericht sollte für das
1670 betreffende Wort die richtige und bei einzelnen Worteinreichungen
1671 auch die falsche Trennung angegeben werden. Außerdem die genaue
1672 Version der verwendeten Trennmuster (traditionelle oder
1673 reformierte Rechtschreibung, Datum der Trennmusterdatei).
1675 \item[Listenformat] Es erleichtert die Korrektur, wenn
1676 Berichtigungsvorschläge in Form einer Liste eingereicht werden,
1677 die automatisch mit Skripten bearbeitet werden kann. Die
1678 folgenden Konventionen sollten dabei eingehalten werden:
1680 \begin{itemize}
1681 \item Die Spalten werden mit einem Semikolon \verb+;+ getrennt.
1682 \item Die erste Spalte enthält das betreffende Wort in
1683 ungetrennter Form.
1684 \item Die zweite Spalte enthält das Wort in der Trennvariante nach
1685 traditioneller Rechtschreibung.
1686 \item Falls die Trennung nach reformierter Rechtschreibung davon
1687 abweicht, steht diese in der dritten Spalte.
1688 \item Ab der vierten Spalte \emph{können} weitere Trennvarianten
1689 folgen, etwa die falsche Trennung. Eine kurze Erklärung sollte
1690 dann darauf eingehen.
1691 \item Unerwünschte Trennungen werden mit einem Punkt \verb+.+
1692 markiert.
1693 \item Anfang und Ende der Liste sollten klar erkennbar sein.
1694 \end{itemize}
1696 Eine Liste könnte beispielhaft so aussehen:
1698 \begin{lstlisting}[style=Text]
1699 sonnendurchfluteten;son-nen-durch-flu-te-ten
1700 Talentwässerung;Tal-ent.wäs-se-rung
1701 Fensterplatz;Fen-ster-platz;Fens-ter-platz
1702 \end{lstlisting}
1704 Dieses Format ist auch für einzeln eingereichte Korrekturen
1705 sinnvoll.
1707 \item[Betreff] Der Betreff einer Fehlermeldung sollte aussagekräftig
1708 sein. Daher sollten mehrere Trennfehler, sofern möglich,
1709 thematisch zusammengefasst werden. Außerdem kann zur einfacheren
1710 Zuordnung das entsprechende Kriterium aus
1711 \autoref{sec:trennfehler} dem Betreff der E-Mail in eckigen
1712 Klammern vorangestellt werden, zum Beispiel:
1714 \begin{lstlisting}[style=Text]
1715 Betreff: [A] sonnendurchfluteten
1716 \end{lstlisting}
1718 \noindent für einen Trennfehler im Wortes
1719 \emph{sonnendurchfluteten}, der durch einen Fehler in der
1720 Wortliste hervorgerufen wird.
1721 \end{description}
1722 \end{frageantwort}
1724 \end{document}
1726 %%% Local Variables:
1727 %%% mode: latex
1728 %%% TeX-engine: default
1729 %%% TeX-PDF-mode: t
1730 %%% TeX-master: t
1731 %%% coding: utf-8
1732 %%% End: