dehyph-exptl/dehyph-exptl.tex

   1 %%% Artikelklasse mit:
   2 %%% * Grundschriftgröße 11 Punkt,
   3 %%% * klassischem Satzspiegel,
   4 %%% * flachem Inhaltsverzeichnis,
   5 %%% * Tabellenüberschriften.
   6 \documentclass[11pt,
   7                DIV=9,
   8                toc=flat,
   9                captions=tableheading,
  10                abstract=on]{scrartcl}
  11
  12 %%% Eingabekodierung ist UTF-8.
  13 \usepackage[utf8]{inputenc}
  14
  15 %%% Schrifteinstellung:
  16 %%% * Grundschrift Palatino,
  17 %%% * Akzidenzschrift Bera Sans,
  18 %%% * Schreibmaschinenschrift Latin Modern Typewriter.
  19 \usepackage[T1]{fontenc}
  20 \usepackage[osf]{mathpazo}
  21 \usepackage[scaled=0.85]{berasans}
  22 \renewcommand*{\ttdefault}{lmtt}
  23 \usepackage{textcomp}
  24
  25 \linespread{1.1}
  26 \usepackage[expansion=true,
  27             letterspace=80]{microtype}
  28
  29 %%% Lade einige Pakete.
  30 \usepackage{ifthen}
  31 \usepackage{calc}
  32 \usepackage{multicol}
  33 \usepackage{paralist}
  34 \usepackage{fncylab}
  35 \usepackage{tabularx}
  36 \usepackage{booktabs}
  37 \usepackage{ragged2e}
  38 \usepackage{hologo}
  39 \usepackage[defaultlines=4,
  40             all]{nowidow}
  41
  42 \newcolumntype{L}{>{\raggedright\arraybackslash}X}
  43
  44 \usepackage{listings}
  45 \lstloadlanguages{[LaTeX]TeX, sh}
  46 \lstset{
  47   basicstyle=\ttfamily,
  48   keywordstyle={},
  49   commentstyle={},
  50   columns=flexible,
  51   showspaces=false,
  52   showstringspaces=false,
  53   % aboveskip=12pt,
  54   % belowskip=12pt,
  55   % frame=tb,
  56   % framesep=8pt,
  57   % framerule=2pt,
  58   xleftmargin=6pt,
  59   xrightmargin=6pt,
  60   % framexleftmargin=6pt,
  61   % framexrightmargin=6pt,
  62   inputencoding=utf8,
  63   extendedchars=true,
  64   literate={ä}{{\"a}}1 {ö}{{\"o}}1 {ü}{{\"u}}1,
  65 }
  66 \lstdefinestyle{LaTeX}{
  67   language=[LaTeX]TeX,
  68   basicstyle=\ttfamily,
  69   keywordstyle={},
  70   commentstyle={\itshape}
  71 }
  72 \lstdefinestyle{shell}{
  73   language=sh,
  74   basicstyle=\ttfamily,
  75   keywordstyle={},
  76   commentstyle={\itshape},
  77   upquote=true % Gravis korrekt anzeigen
  78 }
  79 \lstdefinestyle{Text}{
  80   language=,
  81   basicstyle=\ttfamily,
  82   keywordstyle={},
  83   commentstyle={}
  84 }
  85
  86 \usepackage{needspace}
  87
  88 %%% Literaturverweise in runden Klammern mit Semikolon als Trenner.
  89 % \usepackage[round,semicolon]{natbib}
  90 % \renewcommand*{\bibnumfmt}[1]{(#1)}
  91
  92 %%% Literaturverzeichnis mit Sprachunterstützung.
  93 \usepackage[fixlanguage]{babelbib}
  94 \bibliographystyle{babalpha}
  95 %%% Babelbib fordert trotz fixlanguage zuviele Sprachen an.
  96 \usepackage[english,
  97             german,
  98             ngerman]{babel}
  99
 100 %%% Einstellungen für interaktive PDF-Dokumente.
 101 \usepackage[rgb,x11names]{xcolor}
 102 \usepackage[hyperref]{zref}
 103 \usepackage{hyperref}
 104 \hypersetup{
 105   pdftitle={dehyph-exptl},
 106   pdfauthor={Die deutschsprachige Trennmustermannschaft},
 107   pdfkeywords={TeX,
 108                deutsche Rechtschreibung,
 109                Trennmuster,
 110                computergestützte Worttrennung}
 111 }
 112 \hypersetup{
 113   ngerman,% Für \autoref.
 114   pdfstartview={XYZ null null null},% Viewer bestimmt Zoomfaktor.
 115   colorlinks,
 116   linkcolor=RoyalBlue3,
 117   urlcolor=Chocolate4,
 118   citecolor=DeepPink2
 119 }
 120 \newcommand*{\regelref}[1]{%
 121   \begingroup
 122   \renewcommand*{\Itemautorefname}{Regel}%
 123   \autoref{#1}%
 124   \endgroup%
 125 }
 126
 127 %%% Schriftfestlegungen.
 128 \setkomafont{title}{\normalcolor\normalfont}
 129 \setkomafont{sectioning}{\normalcolor\normalfont}
 130 \setkomafont{section}{\Large}
 131 \setkomafont{subsection}{\Large\itshape}
 132 \setkomafont{descriptionlabel}{\normalfont\itshape}
 133
 134 %%% Einige Makros für logische Auszeichnungen definieren.
 135 \newcommand*{\Abk}[1]{\mbox{\textsc{\lsstyle#1}}}
 136 \newcommand*{\Paket}[1]{\textsf{#1}}
 137 \newcommand*{\Programm}[1]{\lstinline[style=shell]{#1}}
 138 \newcommand*{\Datei}[1]{\texttt{#1}}
 139
 140 \colorlet{falschcol}{red!80!black}
 141 \colorlet{tradcol}{green!50!black}
 142 \colorlet{reformcol}{green!75!black}
 143 \colorlet{unerwcol}{red!60!black}
 144
 145 \newcolumntype{T}{>{\color{tradcol}}l}
 146 \newcolumntype{R}{>{\color{reformcol}}l}
 147 \newcolumntype{U}{>{\color{unerwcol}}l}
 148
 149 \newcommand*{\trennung}[2]{%
 150   \makebox[0pt][l]{%
 151     \color{#1}%
 152     \smash{\rule[-3.5pt]{\widthof{#2}}{.7pt}}% Schriftabhängig.
 153   }%
 154   #2%
 155 }
 156 \newcommand*{\ftr}[1]{\trennung{falschcol}{#1}}% Falsche Trennung.
 157
 158 %%% Satzspiegel erneut berechnen.
 159 \typearea{last}
 160
 161
 162 %%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
 163
 164 \begin{document}
 165
 166 %%% Trennausnahmen definieren.
 167 \hyphenation{
 168   Back-end
 169   hyph-subst
 170   Ent-wick-ler-re-po-si-to-ri-um
 171   Wort-her-kunft
 172   Not-tren-nung
 173   Trenn-al-go-rith-mus
 174   um-bruch-in-kom-pa-tib-le
 175 }
 176
 177 %%% Protokollierung der Trennungen für findhyph.
 178 %\tracingparagraphs=1
 179
 180 %%% Dokumenttitel.
 181 \author{Die deutschsprachige Trennmustermannschaft}
 182 \title{\Paket{dehyph-exptl}\thanks{This document describes the
 183     \Paket{dehyph-exptl} package v0.5.}}
 184 \subtitle{Experimentelle Trennmuster für die deutsche Sprache}
 185 \maketitle
 186
 187 %%% Zweisprachige Zusammenfassung.
 188 \selectlanguage{english}
 189 \begin{abstract}
 190   This document describes the experimental hyphenation patterns for
 191   the German language, covering traditional and reformed orthography
 192   for several varieties of Standard German.  When using
 193   \hologo{XeTeX}/\hologo{LuaTeX}, these patterns are used
 194   automatically.  In other cases, they have to be loaded explicitly.
 195   More information can be found in the Trennmuster-Wiki%
 196   \footnote{\url{http://projekte.dante.de/Trennmuster}} (in German).
 197 \end{abstract}
 198
 199 \selectlanguage{ngerman}
 200 \begin{abstract}
 201   Dieses Dokument beschreibt die experimentellen Trennmuster für die
 202   deutsche Sprache, die das in Deutschland, Österreich und der Schweiz
 203   gebräuchliche Standarddeutsch in der traditionellen und reformierten
 204   Rechtschreibung abdecken.  Bei Nutzung von
 205   \hologo{XeTeX}/\hologo{LuaTeX} werden diese Muster automatisch
 206   verwendet; in anderen Fällen müssen sie i.\,d.\,R. ausdrücklich
 207   geladen werden.
 208 \end{abstract}
 209
 210 \vfill
 211 \begingroup
 212 \em\large
 213
 214 \begin{center}
 215   Warnung!
 216 \end{center}
 217
 218 Diese Trennmuster befinden sich im experimentellen Status.  Sie können
 219 auf dem \Abk{ctan} und in den \hologo{TeX}"=Verteilungen jederzeit
 220 durch umbruchinkompatible aktualisierte Versionen ersetzt werden.  Für
 221 Anwendungen, die einen dauerhaft stabilen Umbruch erfordern, sind sie
 222 nur geeignet, falls manuell eine feste Version installiert wird.
 223 \endgroup \vfill
 224
 225 \clearpage
 226 %%% Zweispaltiges Inhaltsverzeichnis.
 227 \begin{multicols}{2}
 228   \RaggedRight
 229   \small
 230   \selectlanguage{ngerman}
 231   \tableofcontents
 232 \end{multicols}
 233
 234
 235 \section{Einleitung}
 236 \label{sec:einleitung}
 237
 238 Der in \hologo{TeX} implementierte Trennalgorithmus arbeitet
 239 musterbasiert~\cite{liang:1983}.  Prinzipiell können mit einem solchen
 240 Algorithmus nicht alle möglichen Wörter korrekt getrennt werden.  Die
 241 Qualität der Worttrennung einer Sprache wird jedoch maßgeblich von der
 242 Qualität der Wortliste beeinflusst, aus der die verwendeten
 243 Trennmuster berechnet wurden.
 244
 245 Obwohl die herkömmlichen Trennmuster für die deutsche Sprache bei der
 246 Worttrennung in gewöhnlichen Texten eine akzeptable Fehlerrate
 247 erreichen, enthalten sie doch eine Reihe von Schwächen:%
 248 \footnote{Diese Liste bezieht sich auf die Trennmusterdateien
 249   \Datei{dehypht.tex}, Version~3.2a vom 3.\,3.\,1999, und
 250   \Datei{dehyphn.tex}, Version~31 vom 7.\,5.\,2001.}
 251
 252 \bigskip\smallskip
 253 \needspace{4\baselineskip}
 254 \noindent\textit{traditionelle und reformierte Rechtschreibung}
 255
 256 \begin{itemize}
 257 \item In zusammengesetzten Wörtern treten häufig Trennfehler an
 258   Wortfugen auf.
 259
 260 \item Fremdwörter mit akzentuierten Buchstaben werden mangelhaft
 261   getrennt: ">C\ftr{af}é"<, ">Ci-tr\ftr{oë}n"<, ">F\ftr{aç}on"<,
 262   ">vo\ftr{il}à"<.
 263
 264 \item Die Trennmusterdateien enthalten eine Mischung aus \Abk{t1}-
 265   sowie unvollständigen \Abk{ot1}-kodierten Mustern.  Mit Erscheinen
 266   von 16-Bit"=fähigen \hologo{TeX}"=Varianten werden sauber
 267   \Abk{utf-8}"=kodierte Trennmuster nötig~\cite{miklavec:2008}.
 268 \end{itemize}
 269
 270 \bigskip
 271 \needspace{4\baselineskip}
 272 \noindent\textit{traditionelle Rechtschreibung}
 273
 274 \begin{itemize}
 275 \item Die herkömmlichen Trennmuster für die traditionelle deutsche
 276   Rechtschreibung können mit \Programm{patgen} nicht reproduziert
 277   werden, da die zugrundeliegende Wortliste verschollen ist.  Die
 278   Pflege der Trennmuster ist daher schwierig bis unmöglich.  Für freie
 279   Software ist dies kein zufriedenstellender Zustand.
 280
 281 \item Umfang und Qualität der ursprünglichen Wortliste lassen sich
 282   nicht mehr einschätzen.  Für die Trennmuster in traditioneller
 283   Rechtschreibung existiert jedoch inzwischen eine Ausnahmeliste mit
 284   über 3500 korrigierten Trennungen einfacher Wörter
 285   \cite{lemberg:2003, lemberg:2005}.%
 286   \footnote{\url{http://mirrors.ctan.org/language/hyphenation/dehyph/dehyphtex.tex}}
 287
 288 \item Wird in der traditionellen Rechtschreibung \emph{ß} durch
 289   \emph{ss/SS} oder \emph{sz/SZ} ersetzt, so bleibt die Trennung davon
 290   unberührt.  Die herkömmlichen Trennmuster berücksichtigen diese
 291   Regel nicht und trennen häufig den Ersatz:
 292   \textls{">GR\ftr{ÖS"~S}E"<}, \textls{">GR\ftr{ÜS"~S}E"<},
 293   \textls{">M\ftr{AS"~S}ES"<}.%
 294   \footnote{Die Trennung der herkömmlichen Muster entspricht den
 295     Regeln der deutschen Standardsprache in der Schweiz, obwohl diese
 296     Sprachvarietät vom Paket \Paket{Babel} bis 2013 nicht offiziell
 297     unterstützt wurde.  \Paket{Babel} versucht den Mangel mit Hilfe
 298     des Kürzels \lstinline[style=LaTeX]+\"S+ zu kompensieren.}
 299
 300 \item Abweichende Schreibweisen, die in der traditionellen
 301   Rechtschreibung in Österreich und der Schweiz verwendet werden,
 302   werden mangelhaft getrennt: ">Gro\ftr{s"~so}n-kel"<,
 303   ">Ku\ftr{s"~sh}and"<, ">Ma\ftr{ssn}ah-me"<, ">mi\ftr{s"~sa}ch-ten"<
 304   (nur Schweiz) und ">Ex-pre\ftr{ssz}ug"<, ">Fit-ne\ftr{s"~sc}en-ter"<,
 305   ">Fit-ne\ftr{sst}rai-ner"<.
 306 \end{itemize}
 307
 308 \bigskip
 309 \needspace{4\baselineskip}
 310 \noindent\textit{reformierte Rechtschreibung}
 311
 312 \begin{itemize}
 313 \item Die Trennmuster für die reformierte deutsche Rechtschreibung
 314   wurden nicht mit \Programm{patgen} aus einer Wortliste erstellt.
 315   Stattdessen wurden die Trennmuster für die traditionelle
 316   Rechtschreibung von Hand an die reformierten Regeln
 317   angepasst~\cite{schmidt:1998}.  Aus diesem Grund ist die
 318   Worttrennung mit den Trennmustern für die reformierte
 319   Rechtschreibung etwas schlechter als mit den Trennmustern für die
 320   traditionelle Rechtschreibung.
 321 \end{itemize}
 322
 323 Das Projekt \emph{Freie Wortlisten und Trennmuster für die deutsche
 324   Sprache} hat sich das Ziel gesetzt, neue Trennmuster hoher Qualität
 325 für die deutsche Sprache zu erstellen, die die genannten Probleme
 326 ausräumen.
 327
 328 Den experimentellen Trennmustern dieses Pakets liegt eine Wortliste
 329 mit den etwa fünfhunderttausend häufigsten Wörtern der deutschen
 330 Sprache zugrunde.  Vermutlich ist diese Liste erheblich umfangreicher
 331 als die ursprüngliche Wortliste, in der Worthäufigkeiten
 332 wahrscheinlich überhaupt nicht berücksichtigt wurden.  Die verwendete
 333 Wortliste deckt das in Deutschland, Österreich und der Schweiz
 334 gebräuchliche Standarddeutsch ab.
 335
 336 Mit den vorliegenden Trennmustern sollte für nicht"=fachsprachliche
 337 Wörter eine sehr gute Trennqualität erreicht werden.  Insbesondere
 338 sollte sich die Trennung häufig auftretender zusammengesetzter Wörter
 339 verbessern.
 340
 341
 342 \section{Verwenden der Trennmuster}
 343 \label{sec:verwenden}
 344
 345 Die experimentellen Trennmuster werden durch zwei verschiedene
 346 \hologo{TeX}"=Pakete zur Verfügung gestellt, die beide in einer
 347 vollständigen Installation einer aktuellen \hologo{TeX}"=Distribution
 348 enthalten sein sollten.
 349
 350 Das Paket \Paket{hyph-utf8} enthält Trennmuster für alle von
 351 \hologo{TeX} unterstützten Sprachen.  Für die deutsche Sprache sind
 352 die experimentellen Muster enthalten.  Diese werden standardmäßig nur
 353 von \hologo{XeTeX}, \hologo{LuaTeX} und p\TeX\footnote{Eine in Japan
 354   populäre \TeX-Variante.} sowie von allen \hologo{TeX}"=Varianten für
 355 die Schweizer Varietät der deutschen Sprache in traditioneller
 356 Rechtschreibung\footnote{Diese Varietät wird erst seit dem Jahr 2013
 357   unterstützt, sodass keine Abwärtskompatibilität erforderlich ist.}
 358 benutzt.  In den übrigen Fällen wird dagegen auf die herkömmlichen
 359 Trennmuster zurückgegriffen.
 360
 361 Das Paket \Paket{dehyph-exptl} enthält die experimentellen
 362 Trennmuster für die deutsche Sprache.  Es hat den Zweck, diese den
 363 Nutzern der älteren \hologo{TeX}"=Varianten wie \hologo{pdfTeX}
 364 zugänglich zu machen.  Die hierfür nötigen Vorkehrungen werden unten
 365 beschrieben.
 366
 367 Siehe \autoref{sec:fragen} für Hinweise, wie die Version der in beiden
 368 Paketen enthaltenen Muster ermittelt werden kann.
 369
 370 Zur manuellen Installation einer bestimmten Version der
 371 experimentellen Trennmuster siehe \autoref{sec:installation}.
 372
 373 Beachte, in den folgenden Abschnitten ist \verb+<datum>+ durch das bei
 374 der Installation angegebene Datum in \Abk{iso}"=Notation
 375 (\verb+JJJJ-MM-TT+) oder die Zeichenkette \verb+latest+ zu ersetzen.
 376
 377
 378 \subsection{Sprachvarietät und Rechtschreibung}
 379 \label{sec:varietaeten}
 380
 381 Experimentelle Trennmuster stehen für die Worttrennung der deutschen
 382 Sprache in der traditionellen und der reformierten Rechtschreibung zur
 383 Verfügung.  Die Trennmuster unterstützen die drei in Deutschland,
 384 Österreich und der Schweiz gebräuchlichen Hauptvarietäten der
 385 deutschen Standardsprache.  \autoref{tab:varietaeten} zeigt die
 386 Trennmuster, die abhängig von gewünschter Varietät und Rechtschreibung
 387 in einem Dokument zu aktivieren sind.
 388
 389 \begin{table}
 390   \centering
 391   \caption{Die unterstützten Varietäten und Rechtschreibungen}
 392   \label{tab:varietaeten}
 393   \begin{tabular}{l>{\ttfamily}l}
 394     \normalfont Sprachvarietät
 395     & Trennmusterbezeichner\\
 396     \addlinespace\toprule\addlinespace
 397     \hspace*{-\tabcolsep}\normalfont\emph{traditionelle Rechtschreibung}\\
 398     Deutschland, Österreich
 399     & german-x-<datum>\\
 400     Schweiz
 401     & gswiss-x-<datum>\\\addlinespace
 402     \hspace*{-\tabcolsep}\normalfont\emph{reformierte Rechtschreibung}\\
 403     Deutschland, Österreich, Schweiz
 404     & ngerman-x-<datum>\\
 405   \end{tabular}
 406 \end{table}
 407
 408 Varietäten, die sich nur in der Verwendung und Schreibung einzelner
 409 Wörter voneinander unterscheiden, können durch gemeinsame Trennmuster
 410 unterstützt werden.
 411 % Die Eingabewortliste für \Programm{patgen} ist dann eine Vereinigung
 412 % der den Varietäten entsprechenden Wortlisten.
 413 Zum Beispiel werden Besonderheiten der österreichischen
 414 Standardsprache in den Trennmustern für die Standardsprache
 415 Deutschlands berücksichtigt.  Österreichische und deutsche Anwender
 416 können daher dieselben Trennmuster verwenden (wie das auch schon bei
 417 den herkömmlichen Trennmustern der Fall war).
 418
 419 Aufgrund unvereinbarer Trennregeln in der traditionellen
 420 Rechtschreibung der Standardsprachen Deutschlands/""Österreichs und
 421 der Schweiz werden für die letztere Varietät eigene Trennmuster
 422 bereitgestellt.
 423
 424 Mit der Rechtschreibreform 1996 wurden die Trennregeln aller drei
 425 Standardsprachen so weit angeglichen, dass für die reformierte
 426 Rechtschreibung einheitliche Trennmuster für alle drei unterstützten
 427 Sprachvarietäten bereitgestellt werden können.
 428
 429 \subsection{Aktivieren der Trennmuster}
 430 \label{sec:aktivieren}
 431
 432 Im Folgenden wird dargestellt, wie die experimentellen Trennmuster bei
 433 Verwendung unterschiedlicher \hologo{TeX}"=Varianten geladen werden
 434 können.
 435
 436 Das Ergebnis für die traditionelle und reformierte Rechtschreibung mit
 437 herkömmlichen und experimentellen Trennmustern ist in
 438 \autoref{tab:trennvarianten} zusammengefasst.  Ob die experimentellen
 439 Trennmuster korrekt aktiviert werden, kann mit dem folgenden kleinen
 440 Dokument getestet werden, dessen Ausgabe in der \texttt{log}"=Datei
 441 erscheint.
 442
 443 \begin{lstlisting}[style=LaTeX]
 444 \begin{document}
 445 \showhyphens{löste Fassade modernste Abendstern Mordopfer}
 446 \end{document}
 447 \end{lstlisting}
 448
 449 %\suppressfloats[t]
 450 \begin{table*}
 451   \centering
 452   \caption{Trennvarianten}
 453   \label{tab:trennvarianten}
 454   \begin{tabular}{llll}
 455     \multicolumn{2}{c}{\itshape traditionelle Rechtschreibung} &
 456     \multicolumn{2}{c}{\itshape reformierte Rechtschreibung}\\
 457     herkömmlich & experimentell & herkömmlich & experimentell\\
 458     \addlinespace\toprule\addlinespace
 459     l\ftr{ös-t}e & lö-ste & lös-te & lös-te\\
 460     Fas-sa-de & Fas-sa-de & Fa\ftr{ss}a-de & Fas-sa-de\\
 461     mo-\ftr{d-e}rn-ste & mo-dern-ste & mo-\ftr{d-e}rns-te & mo-derns-te\\
 462     Abend-stern & Abend-stern & Aben\ftr{ds-t}ern & Abend-stern\\
 463     Mo\ftr{r-do}p-fer & Mord-op-fer & Mo\ftr{r-do}p-fer & Mord-op-fer\\
 464   \end{tabular}
 465 \end{table*}
 466
 467 \subsubsection{Plain-\TeX}
 468 \label{subsubsec:PlainTeX}
 469
 470 Bei Verwendung eines \hologo{eTeX}"=basierten Compilers
 471 (\Programm{etex}, \Programm{pdftex}, \Programm{xetex} oder
 472 \Programm{luatex}) steht der Befehl \verb+\uselanguage+ zum Laden von
 473 Trennmustern zur Verfügung.  Er akzeptiert neben anderen die Argumente
 474 \texttt{german}, \texttt{ngerman} und \texttt{swissgerman} (nicht
 475 jedoch \texttt{austrian}, \texttt{naustrian} und
 476 \texttt{nswissgerman}).\footnote{Die zulässigen Sprachbezeichnungen
 477   finden sich in der Datei \Datei{language.def} der
 478   \hologo{TeX}"=Installation.}  Um die Silbentrennung gemäß
 479 reformierter deutscher Rechtschreibung zu aktivieren, ist also
 480 folgender Befehl ausreichend:
 481
 482 \begin{lstlisting}[style=LaTeX]
 483 \uselanguage{ngerman}
 484 \end{lstlisting}
 485
 486 Die Compiler \Programm{xetex} und \Programm{luatex} verwenden für alle
 487 definierten Varietäten der deutschen Sprache die experimentellen
 488 Trennmuster, die mit dem Paket \Paket{hyph-utf8} installiert sind;
 489 \Programm{etex} und \Programm{pdftex} tun dies nur für
 490 \texttt{swissgerman}.
 491
 492 Für die Varietäten \texttt{german} und \texttt{ngerman} laden
 493 \Programm{etex} und \Programm{pdftex} hingegen aus Gründen der
 494 Abwärtskompatibilität die herkömmlichen Trennmuster.  Die
 495 experimentellen Trennmuster können am einfachsten aktiviert werden,
 496 indem etwa \lstinline[style=LaTeX]+\uselanguage{ngerman}+ durch den
 497 folgenden Befehl ersetzt wird:
 498
 499 \begin{lstlisting}[style=LaTeX]
 500 \uselanguage{ngerman-x-latest}
 501 \end{lstlisting}
 502
 503 Auf entsprechende Weise ist es mit allen Compilern möglich, eine
 504 alternative, manuell installierte Trennmusterversion zu verwenden:
 505
 506 \begin{lstlisting}[style=LaTeX]
 507 \uselanguage{ngerman-x-<datum>}
 508 \end{lstlisting}
 509
 510 Vorausgesetzt ist dabei, dass ein entsprechender Eintrag in der
 511 Konfigurationsdatei \Datei{language.def} oder einer lokalen Version
 512 derselben existiert.
 513
 514 Soll der \verb+\uselanguage+-Befehl seine gewohnte Form behalten, ist
 515 zum Laden alternativer Trennmuster auch folgendes Vorgehen mit Hilfe
 516 des Pakets \Paket{hyphsubst} möglich:
 517
 518 \begin{lstlisting}[style=LaTeX]
 519 \input hyphsubst.sty
 520 \HyphSubstLet{ngerman}{ngerman-x-<datum>}
 521 \uselanguage{ngerman}
 522 \end{lstlisting}
 523
 524 Zu beachten ist, dass in Plain-\hologo{TeX} unabhängig vom verwendeten
 525 Compiler Wörter mit Umlauten, \emph{ß} oder Akzentbuchstaben an vielen
 526 Trennstellen nicht automatisiert getrennt werden können.
 527
 528 \subsubsection{\LaTeX{} mit dem Sprachenpaket \Paket{Babel}}
 529 \label{subsubsec:LaTeX+Babel}
 530
 531 Das Paket \Paket{Babel} kennt für die traditionelle Rechtschreibung
 532 die Sprachbezeichnungen \texttt{german}, \texttt{austrian} und
 533 \texttt{swissgerman}, für die reformierte Rechtschreibung
 534 \texttt{ngerman}, \texttt{naustrian} und \texttt{nswissgerman}, wobei
 535 diese sechs Varietäten durch drei Trennmustersätze abgedeckt werden
 536 können (\autoref{tab:varietaeten}).
 537
 538 Die Compiler \Programm{xelatex} und \Programm{lualatex} verwenden für
 539 alle definierten Varietäten der deutschen Sprache die experimentellen
 540 Trennmuster, die mit dem Paket \Paket{hyph-utf8} installiert sind;
 541 \Programm{latex} und \Programm{pdflatex} tun dies nur für
 542 \texttt{swissgerman}.
 543
 544 Für die übrigen fünf Varietäten laden \Programm{latex} und
 545 \Programm{pdflatex} hingegen aus Gründen der Abwärtskompatibilität
 546 standardmäßig die herkömmlichen Trennmuster.  Um stattdessen die
 547 experimentellen Trennmuster zu aktivieren, sind für die reformierte
 548 Rechtschreibung folgende Zeilen in die Präambel des Dokuments
 549 aufzunehmen.  Die Trennmusterbezeichner, die vom Paket \Paket{Babel}
 550 verwendet werden, werden dazu mit Hilfe des Pakets \Paket{hyphsubst}
 551 aus dem \Paket{Oberdiek}-Bündel so geändert, dass sie auf die
 552 experimentellen Trennmuster verweisen:
 553
 554 \begin{lstlisting}[style=LaTeX]
 555 \usepackage[T1]{fontenc}
 556 \usepackage[ngerman]{babel}
 557 \usepackage[ngerman=ngerman-x-latest]{hyphsubst}
 558 \end{lstlisting}
 559
 560 Für die österreichische Varietät:
 561
 562 \begin{lstlisting}[style=LaTeX]
 563 \usepackage[T1]{fontenc}
 564 \usepackage[naustrian]{babel}
 565 \usepackage[naustrian=ngerman-x-latest]{hyphsubst}
 566 \end{lstlisting}
 567
 568 Auf entsprechende Weise ist es mit allen \hologo{LaTeX}"=Compilern
 569 möglich, eine alternative, manuell installierte Trennmusterversion zu
 570 aktivieren:
 571
 572 \begin{lstlisting}[style=LaTeX]
 573 \usepackage[ngerman]{babel}
 574 \usepackage[ngerman=ngerman-x-<datum>]{hyphsubst}
 575 \end{lstlisting}
 576
 577 Das Paket \Paket{hyphsubst} erlaubt auch das mehrfache Umschalten der
 578 Trennmuster innerhalb des Dokuments.  Hinweise hierzu können der
 579 Paketanleitung entnommen
 580 werden.\footnote{\url{https://ctan.org/pkg/hyphsubst}}
 581
 582 \subsubsection{\hologo{XeLaTeX}/\hologo{LuaLaTeX} mit dem
 583   Sprachenpaket \Paket{Polyglossia}}
 584
 585 Für \hologo{XeLaTeX} und \hologo{LuaLaTeX} steht als Alternative zu
 586 \Paket{Babel} das Paket
 587 \Paket{Polyglossia}\footnote{\url{https://ctan.org/pkg/polyglossia}}
 588 zur Verfügung.  Mit den Zeilen
 589
 590 \begin{lstlisting}[style=LaTeX]
 591 \usepackage{polyglossia}
 592 \setmainlanguage{german}
 593 \end{lstlisting}
 594
 595 \noindent in der Präambel werden die mit dem Paket \Paket{hyph-utf8}
 596 installierten Trennmuster für die \emph{reformierte} Rechtschreibung
 597 geladen.  Mit den Optionen \texttt{variant=""austrian},
 598 \texttt{variant=""swiss} und \texttt{spelling=""old} können wahlweise
 599 die österreichische Varietät, die Schweizer Varietät sowie die
 600 traditionelle Rechtschreibung gewählt werden, beispielsweise:
 601
 602 \begin{lstlisting}[style=LaTeX]
 603 \usepackage{polyglossia}
 604 \setmainlanguage[variant=swiss, spelling=old]{german}
 605 \end{lstlisting}
 606
 607 Um Trennhilfen wie \verb+""+, \verb+"ff+ oder \verb+"ck+ verwenden zu
 608 können, muss zusätzlich die Option \texttt{babelshorthands=""true}
 609 gesetzt werden.
 610
 611 Mit \hologo{XeLaTeX} ist es außerdem möglich, manuell installierte
 612 statt der voreingestellten Trennmuster zu verwenden.  Hierzu kommt das
 613 Paket \Paket{hyphsubst} wie folgt zum Einsatz.  Für die reformierte
 614 Rechtschreibung:
 615
 616 \begin{lstlisting}[style=LaTeX]
 617 \usepackage{polyglossia}
 618 \setmainlanguage{german} % ggf. variant=austrian/swiss
 619 \usepackage[ngerman=ngerman-x-<datum>]{hyphsubst}
 620 \end{lstlisting}
 621
 622 Für die traditionelle Rechtschreibung in Deutschland und Österreich:
 623
 624 \begin{lstlisting}[style=LaTeX]
 625 \usepackage{polyglossia}
 626 \setmainlanguage[spelling=old]{german} % ggf. variant=austrian
 627 \usepackage[german=german-x-<datum>]{hyphsubst}
 628 \end{lstlisting}
 629
 630 Für die traditionelle Rechtschreibung in der Schweiz:
 631
 632 \begin{lstlisting}[style=LaTeX]
 633 \usepackage{polyglossia}
 634 \setmainlanguage[variant=swiss, spelling=old]{german}
 635 \usepackage[swissgerman=gswiss-x-<datum>]{hyphsubst}
 636 \end{lstlisting}
 637
 638 Mit \hologo{LuaLaTeX} in Verbindung mit \Paket{Polyglossia} ist das
 639 Ersetzen der Trennmuster auf diese Weise nicht möglich.
 640
 641 \subsubsection{p\TeX/up\TeX}
 642
 643 Die in Japan gebräuchlichen \hologo{TeX}"=Varianten p\TeX{} und
 644 up\TeX{} verwenden für deutschsprachige Texte die experimentellen
 645 Trennmuster, die mit dem Paket \Paket{hyph-utf8} installiert sind.
 646
 647 \subsubsection{\hologo{ConTeXt}}
 648
 649 \hologo{ConTeXt} besitzt eigene Trennmusterdateien.  Die Trennmuster
 650 werden aus dem Paket \Paket{hyph-utf8} übernommen, jedoch
 651 zeitverzögert, sodass sie in \hologo{ConTeXt} im Allgemeinen in einer
 652 älteren Version vorliegen.  Die Trennmuster für die traditionelle
 653 deutsche Rechtschreibung in der Schweiz fehlen zur Zeit.
 654
 655 Siehe \autoref{sec:fragen} für Hinweise, wie die Version der
 656 \hologo{ConTeXt}-Trennmuster bestimmt werden kann.
 657
 658 \section{Trennregeln und Konventionen}
 659 \label{sec:trennregeln}
 660
 661 Die Trennmuster für die traditionelle Rechtschreibung in Deutschland
 662 und Österreich orientieren sich an den verbindlichen Regeln des Dudens
 663 in der Fassung von 1991~\cite{duden:1991}.  Dasselbe gilt für die
 664 Trennmuster für die traditionelle Rechtschreibung in der Schweiz,
 665 jedoch mit einer unten beschriebenen Abweichung.  Die Trennmuster für
 666 die reformierte Rechtschreibung orientieren sich an den amtlichen
 667 Regeln für die Rechtschreibung der deutschen Sprache in der Fassung
 668 von 2006~\cite{amtlRegeln:2006, amtlRegeln:2006:duden}.
 669
 670 Die Regeln lassen gewisse Freiheiten bei der Schreibung und Trennung
 671 von Wörtern zu.  Da sich solche Freiheiten nicht ohne weiteres auf die
 672 maschinelle Worttrennung übertragen lassen, wurden die im folgenden
 673 beschriebenen Konventionen getroffen.  Hauptsächlich betreffen diese
 674 die reformierte Rechtschreibung, die zusätzliche Freiheiten eingeführt
 675 hat.\footnote{%
 676   Im Ergebnis weicht in reformierter Rechtschreibung die Trennung zum
 677   Beispiel des Dudens (nach Sprechsilben) von der Trennung mit diesen
 678   Trennmustern (bevorzugt etymologisch) ab, siehe auch
 679   \regelref{enum:reformEtymo} und \regelref{enum:reformClusterLR}
 680   sowie \autoref{sec:fragen}.}  Beziehen sich die Konventionen für die
 681 reformierte Rechtschreibung auf die traditionelle Rechtschreibung, so
 682 werden die entsprechenden Regeln etwas ausführlicher dargestellt.  Die
 683 folgenden Abschnitte enthalten jedoch keine vollständige Aufstellung
 684 der Silbentrennregeln.  Diese sind den entsprechenden Regelwerken zu
 685 entnehmen.  Es folgen zunächst einige allgemeine Hinweise:
 686
 687 \begin{itemize}
 688
 689 \item In Liangs Trennalgorithmus werden Groß- und Kleinschreibung
 690   nicht unterschieden~\cite{liang:1983}.  Die Schreibweisen
 691   \emph{Nachtritt} und \emph{nachtritt} werden aus Sicht des
 692   Trennalgorithmus gleich behandelt (siehe auch
 693   \regelref{enum:tradDoppeld} und \regelref{enum:reformDoppeld}).
 694
 695 \item Die von einem Programm aus diesen Mustern abgeleiteten möglichen
 696   Trennstellen können (u.\,a. durch Programmfehler) durchaus von denen
 697   der zugrundeliegenden Wortliste abweichen.  So führt zum Beispiel
 698   die Eingabe \lstinline[style=LaTeX]+Meta"llegierung+
 699   (Dreikonsonantenregel in der traditionellen Rechtschreibung) mit dem
 700   Paket \Paket{Babel} zu den in \autoref{tab:trennung-dreik} gezeigten
 701   Trennmöglichkeiten.
 702
 703   \begin{table}
 704     \centering
 705     \caption{Unterschiedlich ermittelte Trennmöglichkeiten.}
 706     \label{tab:trennung-dreik}
 707     \begin{tabular}{ll}
 708       Quelle & Trennmöglichkeiten\\
 709       \addlinespace
 710       \toprule
 711       \addlinespace
 712       \hologo{pdfLaTeX} mit \Paket{Babel}~3.8 & Me-tall(-l)egierung\\
 713       \hologo{pdfLaTeX} mit \Paket{Babel}~3.9 & Me-tall(-l)e-gie-rung\\
 714       erwünscht \emph{(vgl. \regelref{enum:tradnstd})} & Me-tall(-l)egie-rung\\
 715     \end{tabular}
 716   \end{table}
 717
 718 \item Die von \hologo{TeX} gewählte Trennung kann in Einzelfällen mit
 719   den \hologo{TeX}- und \Paket{Babel}"=Kürzeln
 720   \lstinline[style=LaTeX]+\-+ und \lstinline[style=LaTeX]+"-+ geändert
 721   werden.  Für dokumentweite Änderungen der Trennung eignet sich das
 722   Kommando \lstinline[style=LaTeX]+\hyphenation+.
 723
 724 \item Die Datei \Datei{CHANGES} beschreibt bekannte, systematische
 725   Fehler der Trennmuster.
 726
 727 \item In den Beispielen zeigt die linke (grüne) Spalte jeweils die
 728   Trennung mit den experimentellen Trennmustern, die rechten (roten)
 729   Spalten zeigen alternative oder unerwünschte Trennungen.
 730
 731 \end{itemize}
 732
 733 \subsection{Traditionelle Rechtschreibung in Deutschland und
 734   Österreich}
 735 \label{sec:tradRS}
 736
 737 \begin{enumerate}[\hspace{1em}\itshape{T}1]
 738 \labelformat{enumi}{\textit{T#1}}
 739
 740 \item\label{enum:tradhyphenmin} Die minimale unterstützte Silbenlänge
 741   am Wortanfang und "~ende beträgt zwei Buchstaben
 742   \cite[R~178]{duden:1991}.
 743
 744   Siehe \autoref{sec:fragen} für Hinweise, wie sich diese Länge
 745   abweichend einstellen lässt.  Wird die Mindestlänge auf weniger als
 746   zwei Buchstaben verringert, so können fehlerhafte Trennungen
 747   auftreten.
 748
 749 \item\label{enum:tradSinn} Sinnentstellende und irreführende
 750   Trennungen werden möglichst vermieden \cite[R~181]{duden:1991}
 751   (siehe auch \regelref{enum:tradnstd}):
 752
 753   \begin{tabular}[t]{TU}
 754     An-alpha-bet & Anal-phabet\\
 755     Kaf-ka-kenner & Kafkaken-ner\\
 756     Tal-entwäs-se-rung & Talent-wässerung\\
 757   \end{tabular}
 758
 759   Beachte, dass derzeit die Unterdrückung von solchen Trennstellen bis
 760   zu einem gewissen Grade willkürlich und subjektiv ist.  Außerdem ist
 761   die Erfassung weit davon entfernt, vollständig zu sein.  Um diesen
 762   Problemen abzuhelfen, ist für zukünftige Versionen der Trennmuster
 763   ein anderer, automatisierter Ansatz geplant, welcher die Anzahl
 764   manuell zu erfassender Fälle sehr stark reduzieren wird.
 765
 766 \item\label{enum:tradDoppeld} In mehrdeutigen Wörtern werden
 767   Trennungen nur an übereinstimmenden Trennstellen zugelassen.
 768
 769   \begin{tabular}[t]{TUU}
 770     nachtritt & nach-tritt & Nacht-ritt\\
 771     Wachstu-be & Wach-stube & Wachs-tube\\
 772     Druckerzeug-nis & Druck-erzeugnis & Drucker-zeugnis\\
 773     Mu-sikerle-ben & Musik-erleben & Musi-ker-leben\\
 774     Fuß-balleh-re & Fußball-ehre & Fußball-lehre\\
 775   \end{tabular}
 776
 777   Beachte, die Trennstellen ">Drucker-zeugnis"< und ">Musiker-leben"<
 778   sind in den Interpretationen \emph{Druck-Erzeugnis} und
 779   \emph{Musik-Erleben} irreführend.  Sie entfallen nach
 780   \regelref{enum:tradSinn} und sind nicht als übereinstimmende
 781   Trennstellen anzusehen.  Zur Spezialtrennung ">Fußball-lehre"< siehe
 782   auch \regelref{enum:tradnstd}.
 783
 784   Für diese Regel gelten die folgenden Einschränkungen:
 785
 786   \begin{itemize}
 787
 788   \item Bei mehrdeutigen Wörtern endend auf \emph{"~ende},
 789     \emph{"~enden}, \emph{"~endes} wird stets die Trennung der
 790     Partizipform des Verbs verwendet.
 791
 792     \begin{tabular}[t]{TUU}
 793       fu-ßen-de & Fuß-ende & fußende\\
 794       spie-len-de & Spiel-ende & spielende
 795     \end{tabular}
 796
 797   \item Mehrdeutigkeiten, die durch die Ersatzschreibweise von Wörtern
 798     mit~\emph{ß} auftreten, werden nicht berücksichtigt (vergleiche
 799     \regelref{enum:tradEszett}).
 800
 801     \begin{tabular}[t]{TUU}
 802       Mas-se & \textls{M\kern-.4ptA-SSE} & \textls{M\kern-.4ptA\kern-.6ptSSE}
 803     \end{tabular}
 804
 805   \end{itemize}
 806
 807 \item\label{enum:tradEszett} Wird der Buchstabe~\emph{ß} durch
 808   \emph{ss/SS} ersetzt, so bleibt die Trennung davon unberührt
 809   \cite[R~179]{duden:1991}:
 810
 811   \begin{tabular}[t]{T}
 812     \textls{GRÖSS-TE}\\
 813     \textls{GRÜ-SSE}\\
 814     \textls{M\kern-.4ptA\kern-.4pt-SSES}\\
 815   \end{tabular}
 816
 817   Für diese Regel gilt die folgende Einschränkung:
 818   \begin{itemize}
 819
 820   \item Wenn durch den Ersatz von~\emph{ß} an dieser Stelle keine
 821     eindeutige Trennung möglich ist, so wird zugunsten der Bedeutung
 822     des Wortes in der normalen Schreibweise getrennt (siehe auch
 823     \regelref{enum:tradDoppeld}).
 824
 825     \begin{tabular}[t]{TTU}
 826       \textls{FLÖS-SE} & (wegen flös-se) & \textls{FLÖ-SSE}\\
 827       \textls{MAS-SE} & (wegen Mas-se) & \textls{MA-SSE}\\
 828     \end{tabular}
 829
 830     Beachte:
 831     \begin{itemize}
 832
 833     \item Wird \emph{ß} mit \lstinline[style=LaTeX]+\MakeUppercase+
 834       durch~\emph{SS} ersetzt, so bleibt \emph{SS} stets ungetrennt.
 835       Die Trennung richtet sich dann nach der Schreibweise
 836       mit~\emph{ß} im Quelldokument.
 837
 838     \item Existiert ein Wort in verschiedenen Varietäten in der
 839       Schreibweise mit~\emph{ß} und mit~\emph{ss}, so wird aufgrund
 840       dieser Einschränkung \emph{s-s} stets getrennt:
 841
 842       \begin{tabular}[t]{TTUU}
 843         Ge-scho-ße  & (AT)\\
 844         Ge-schos-se & (D) & \textls{GESCHO-SSE} & (AT)\\
 845       \end{tabular}
 846
 847     \item Wenn durch den Ersatz des~\emph{ß} an entfernten Stellen
 848       keine eindeutige Trennung möglich wird, zum Beispiel an
 849       Wortfugen, so werden die betroffenen Trennungen gemäß
 850       \regelref{enum:tradDoppeld} unterdrückt.  In der Folge wird
 851       gegebenenfalls auch die Trennung von \emph{ss/SS} unterdrückt.
 852
 853       \begin{tabular}[t]{TU}
 854         \textls{BAHN-HOFSTRASSE} & \textls{BAHNHOF-STRA-SSE}\\
 855                                  & \textls{BAHNHOFS-TRAS-SE}\\
 856       \end{tabular}
 857
 858     \end{itemize}
 859
 860   \end{itemize}
 861
 862 \item\label{enum:tradOW} In Ableitungen von Namen auf \emph{"~ow} wird
 863   die Nottrennung der Ableitungssilben \emph{"~er}, \emph{"~ern},
 864   \emph{"~ers} unterdrückt \cite[R~180]{duden:1991}:
 865
 866   \begin{tabular}[t]{TU}
 867     Tel-tower & Teltow-er\\
 868     Trep-towern & Treptow-ern\\
 869     Pan-kowers & Pankow-ers\\
 870   \end{tabular}
 871
 872 \item\label{enum:tradnstd} Spezialtrennungen (\emph{engl.:}
 873   non-standard hyphenation), die nach Regeln erfolgen, die über das
 874   bloße Einfügen eines Trennstrichs hinausgehen, wie die \emph{ck}"~
 875   oder die Dreikonsonantenregel, kann \hologo{TeX} nicht automatisch
 876   behandeln.  Aus diesem Grund sind solche Trennstellen in diesen
 877   Trennmustern nicht berücksichtigt.
 878
 879   \begin{tabular}[t]{lTUU}
 880     \lstinline[style=LaTeX]+drucken+ & drucken & druk-ken\\
 881     \lstinline[style=LaTeX]+Zuckerbäcker+ & Zucker-bäcker & Zuk-kerbäk-ker\\
 882     \lstinline[style=LaTeX]+Brennessel+ & Brennes-sel & Brenn-nessel\\
 883     \lstinline[style=LaTeX]+Stoffetzen+ & Stoffet-zen & Stoff-fetzen\\
 884   \end{tabular}
 885
 886   Die Dreikonsonantenregel birgt aufgrund des ausgefallenen
 887   Konsonanten die Gefahr irreführender und sinnentstellender
 888   Trennungen (siehe auch \regelref{enum:tradSinn}).  Trennstellen, die
 889   in einem Abstand von zwei Lauten auf eine Wortfuge mit Anwendung der
 890   Dreikonsonantenregel folgen, werden daher grundsätzlich unterdrückt.
 891
 892   \begin{tabular}[t]{lTUU}
 893     \lstinline[style=LaTeX]+Metallegierung+ & Me-tallegie-rung & Metall-legierung & Metalle-gierung\\
 894     \lstinline[style=LaTeX]+schnellebige+ & schnellebi-ge & schnell-lebige & schnelle-bige\\
 895     \lstinline[style=LaTeX]+Stilleben+ & Stilleben & Still-leben & Stille-ben\\
 896   \end{tabular}
 897   \par\nobreak
 898   \textit{auch:}
 899
 900   \begin{tabular}[t]{lTUU}
 901     \lstinline[style=LaTeX]+Abfallager+ & Ab-fallager & Abfall-lager & Abfalla-ger\\
 902     \lstinline[style=LaTeX]+Zellstoffabrik+ & Zell-stoffabrik & Zellstoff-fabrik & Zellstoffa-brik\\
 903   \end{tabular}
 904
 905   Das Paket \Paket{Babel} stellt verschiedene Kürzel zur Verfügung,
 906   u.\,a. \lstinline[style=LaTeX]+"ck+%
 907   \footnote{Spezialtrennungen werden in \hologo{TeX} mit Hilfe des
 908     Kommandos \lstinline[style=LaTeX]+\\discretionary+ kodiert.  So
 909     wird zum Beispiel das \Paket{Babel}-Kürzel
 910     \lstinline[style=LaTeX]+\"ck+ in der Eingabe während der
 911     Kompilation durch
 912     \lstinline[style=LaTeX]+\\discretionary\{k-\}\{k\}\{ck\}+ ersetzt,
 913     wodurch \emph{k-k}-Trennungen möglich werden.}
 914   %
 915   oder \lstinline[style=LaTeX]+"ff+ \emph{etc.}, mit denen
 916   Spezialtrennungen im Quelldokument ausgezeichnet werden können
 917   (siehe auch \autoref{tab:trennung-dreik}).  Das Alternativpaket
 918   \Paket{Polyglossia} stellt diese Kürzel ebenfalls zur Verfügung,
 919   falls beim Laden der deutschen Sprache (in der Regel mit dem Befehl
 920   \lstinline[style=LaTeX]+\setmainlanguage+) die Option
 921   \lstinline[style=LaTeX]+babelshorthands=true+ angegeben wird.
 922
 923   \hologo{LuaTeX}%
 924   \footnote{\url{http://www.luatex.org/}}
 925 %
 926   soll in einer zukünftigen Version Mechanismen zur automatischen
 927   Behandlung von Spezialtrennungen bereitstellen.  Eine physische
 928   Auszeichnung im Quelltext ist dann nicht mehr erforderlich.  Die
 929   entsprechenden Spezialtrennmuster für die deutsche Sprache werden
 930   ebenfalls im Rahmen dieses Projekts erstellt.
 931
 932 \end{enumerate}
 933
 934 \subsection{Traditionelle Rechtschreibung in der Schweiz}
 935 \label{sec:tradchRS}
 936
 937 Die Trennmuster für die traditionelle Rechtschreibung in der Schweiz
 938 folgen weitgehend den Konventionen für die traditionelle
 939 Rechtschreibung in Deutschland (siehe \autoref{sec:tradRS}).  Die
 940 folgende Liste enthält daher nur Fälle, in denen davon abgewichen wird
 941 oder deren Beschreibung aus anderen Gründen sinnvoll erscheint.
 942
 943 \begin{enumerate}[\hspace{1em}\itshape{TS}1]
 944 \labelformat{enumi}{\textit{TS#1}}
 945
 946 \item\label{enum:tradchEszett} Wörter mit \emph{ß} werden gemäß den
 947   Regeln für die traditionelle Rechtschreibung in Deutschland
 948   getrennt.
 949
 950 \item\label{enum:tradchSS} Abweichend von \regelref{enum:tradEszett}
 951   wird \emph{ss/SS} immer als Doppelkonsonant behandelt und
 952   gegebenenfalls getrennt:
 953
 954   \begin{tabular}[t]{T}
 955     grös-ste\\
 956     Grüs-se\\
 957     Mas-ses\\
 958   \end{tabular}
 959
 960   Beachte, wird \emph{ß} jedoch mit
 961   \lstinline[style=LaTeX]+\MakeUppercase+ durch~\emph{SS} ersetzt, so
 962   bleibt~\emph{SS} stets ungetrennt.  Die Trennung richtet sich dann
 963   nach der Schreibweise mit~\emph{ß} im Quelldokument (siehe
 964   \regelref{enum:tradchEszett}).
 965
 966 \end{enumerate}
 967
 968 \subsection{Reformierte Rechtschreibung}
 969 \label{sec:reformRS}
 970
 971 \begin{enumerate}[\hspace{1em}\itshape{R}1]
 972 \labelformat{enumi}{\textit{R#1}}
 973
 974 \item\label{enum:reformhyphenmin} Die minimale unterstützte Silbenlänge
 975   am Wortanfang und "~ende beträgt zwei Buchstaben
 976   \cite[\S~107]{amtlRegeln:2006, amtlRegeln:2006:duden}.
 977
 978   Siehe \autoref{sec:fragen} für Hinweise, wie sich diese Länge
 979   abweichend einstellen lässt.  Wird die Mindestlänge auf weniger als
 980   zwei Buchstaben verringert, so können fehlerhafte Trennungen
 981   auftreten.
 982
 983 \item\label{enum:reformEtymo} Falls die Trennung nach Sprechsilben und
 984   die etymologische (sprachgeschichtliche) Trennung kollidieren, wird
 985   weitgehend die etymologische Trennung gewählt
 986   \cite[\S~113]{amtlRegeln:2006, amtlRegeln:2006:duden}:
 987
 988   \begin{tabular}[t]{RUU}
 989 %    Heli-ko-pter & Helikop-ter\\
 990 %    in-ter-view-en & intervie-wen\\
 991     in-ter-es-sant & inte-ressant\\
 992     Lin-ole-um & Li-noleum & Lino-leum\\
 993     Päd-ago-ge & Pä-dagoge & Päda-goge\\
 994   \end{tabular}
 995
 996 \item\label{enum:reformClusterLR} In Fremdwörtern bleiben die
 997   Buchstabengruppen \emph{bl}, \emph{pl}, \emph{fl}, \emph{gl},
 998   \emph{cl}, \emph{kl}, \emph{phl}; \emph{br}, \emph{pr}, \emph{dr},
 999   \emph{tr}, \emph{fr}, \emph{vr}, \emph{gr}, \emph{cr}, \emph{kr},
1000   \emph{phr}, \emph{thr}; \emph{chth}; \emph{gn}, \emph{kn} im
1001   allgemeinen ungetrennt, nicht jedoch \emph{str}
1002   \cite[\S~112]{amtlRegeln:2006, amtlRegeln:2006:duden}
1003   i.\,V.\,m.~\cite[R~179]{duden:1991}:
1004
1005   \begin{tabular}[t]{RU}
1006     Ar-thri-tis & Arth-ritis\\
1007 %    Co-gnac & Cog-nac\\
1008     Di-plom & Dip-lom\\
1009 %    Fe-bru-ar & Feb-ruar\\
1010     igno-rie-re & ig-noriere\\
1011     In-te-gral & Integ-ral\\
1012   \end{tabular}
1013   \par\nobreak
1014   \textit{aber:}
1015
1016   \begin{tabular}[t]{RUU}
1017     In-dus-trie & Indu-strie & Indust-rie\\
1018 %    Ma-gis-tra-le & Magi-strale\\
1019     de-struk-tiv\\
1020     sub-lim\\
1021   \end{tabular}
1022
1023 \item\label{enum:reformSinn} Sinnentstellende und irreführende
1024   Trennungen werden möglichst vermieden \cite[\S~107]{amtlRegeln:2006,
1025     amtlRegeln:2006:duden}:
1026
1027   \begin{tabular}[t]{RU}
1028     An-alpha-bet & Anal-phabet\\
1029     Kaf-ka-kenner & Kafkaken-ner\\
1030     Tal-entwäs-se-rung & Talent-wässerung\\
1031   \end{tabular}
1032
1033 \item\label{enum:reformDoppeld} In mehrdeutigen Wörtern werden
1034   Trennungen nur an übereinstimmenden Trennstellen zugelassen:
1035
1036   \begin{tabular}[t]{RUUU}
1037     Druckerzeug-nis & Dru-ckerzeugnis & Druck-erzeugnis &
1038     Drucker-zeugnis\\
1039     Mu-sikerle-ben & Musi-kerleben & Musik-erleben & Musiker-leben\\
1040     nachtritt & nach-tritt & Nacht-ritt\\
1041     Wachstu-be & Wach-stube & Wachs-tube\\
1042   \end{tabular}
1043
1044   Beachte, die Trennstellen ">Drucker-zeugnis"< und ">Musiker-leben"<
1045   sind in den Interpretationen \emph{Druck-Erzeugnis} und
1046   \emph{Musik-Erleben} irreführend.  Sie entfallen nach
1047   \regelref{enum:reformSinn} und sind nicht als übereinstimmende
1048   Trennstellen anzusehen.
1049
1050   Für diese Regel gilt die folgende Einschränkung:
1051
1052   \begin{itemize}
1053
1054   \item Bei mehrdeutigen Wörtern endend auf \emph{"~ende},
1055     \emph{"~enden}, \emph{"~endes} wird stets die Trennung der
1056     Partizipform des Verbs verwendet.
1057
1058     \begin{tabular}[t]{RUU}
1059       fu-ßen-de & Fuß-ende & fußende\\
1060       spie-len-de & Spiel-ende & spielende
1061     \end{tabular}
1062
1063   \end{itemize}
1064
1065 \item\label{enum:reformEszett} Wird der Buchstabe~\emph{ß} durch
1066   \emph{ss/SS} ersetzt, so wird \emph{s"~s} getrennt \cite[\S\S~25~E3,
1067   110]{amtlRegeln:2006, amtlRegeln:2006:duden}:
1068
1069   \begin{tabular}[t]{R}
1070     \textls{GRÖS-STE}\\
1071     \textls{GRÜS-SE}\\
1072     \textls{M\kern-.4ptA\kern-.6ptS-SES}\\
1073   \end{tabular}
1074
1075   Wird~\emph{ß} mit \lstinline[style=LaTeX]+\MakeUppercase+ oder in
1076   Kapitälchen in~\emph{SS} gewandelt, so bleibt~\emph{SS} ungetrennt.
1077   Dies ist kein Fehler in den Trennmustern, sondern im
1078   \hologo{LaTeX}-Kern fest implementiert.
1079
1080 % \item\label{enum:reformOW} In Ableitungen von Namen auf \emph{"~ow}
1081 %   bleibt \emph{"~ow} ungetrennt, wenn es den Laut [o\,:] bezeichnet.
1082 %   Die Nottrennung der Ableitungssilben \emph{"~er}, \emph{"~ern},
1083 %   \emph{"~ers} wird unterdrückt \cite[\S~113]{amtlRegeln:2006,
1084 %     amtlRegeln:2006:duden}
1085 %   i.\,V.\,m.~\cite[R~180]{duden:1991}:
1086
1087 %   \begin{tabular}[t]{RUU}
1088 %     Tel-tower & Telto-wer & Teltow-er\\
1089 %     Trep-towern & Trepto-wern & Treptow-ern\\
1090 %     Pan-kowers & Panko-wers & Pankow-ers\\
1091 %   \end{tabular}
1092
1093 \end{enumerate}
1094
1095
1096 \section{Trennfehler}
1097 \label{sec:trennfehler}
1098
1099 Mit den vorliegenden Trennmustern können sämtliche Wörter der
1100 zugrundeliegenden Wortliste fehlerfrei getrennt werden.  Technisch
1101 gesprochen endet der letzte \Programm{patgen}-Lauf mit der Meldung
1102
1103 \begin{lstlisting}[style=shell]
1104 1266082 good, 0 bad, 0 missed
1105 100.00 %, 0.00 %, 0.00 %
1106 \end{lstlisting}
1107
1108 \noindent (der Wert vor \lstinline[style=shell]+good+ ist vom
1109 Listenumfang abhängig).  Trotz des großen Umfangs der Wortliste lassen
1110 sich Trennfehler in Wörtern, die nicht in der Liste enthalten sind,
1111 nicht vermeiden.  Der Umfang der Wortliste kann allerdings nicht
1112 beliebig erweitert werden.%
1113 \footnote{Liangs Schema sieht nur einen begrenzten Bereich für die
1114   Trennstellenbewertungen vor (0--9).  Die derzeitigen Trennmuster
1115   vewenden bereits Bewertungen der Höhe~8.}
1116 %
1117 In den folgenden Fällen sollten fehlerhafte Trennungen der Trennmuster
1118 jedoch gemeldet werden:
1119
1120 \begin{enumerate}[\hspace{1em}A.]
1121
1122 \item\label{enum:kritWLfehlerhaft} Das Wort ist bereits in der
1123   Wortliste enthalten.  Der Eintrag ist jedoch fehlerhaft.
1124
1125 \end{enumerate}
1126
1127 Falls das Wort nicht in der Wortliste enthalten ist, bestehen sehr
1128 gute Chancen, dass es aufgenommen wird, wenn eines der folgenden
1129 Kriterien erfüllt ist:
1130
1131 \begin{enumerate}[\hspace{1em}A.]
1132   \refstepcounter{enumi}% Fortsetzung der obigen Aufzählung.
1133
1134 \item\label{enum:kritHerkTM} Das betreffende Wort wird mit den
1135   \emph{herkömmlichen} Trennmustern für die traditionelle oder
1136   reformierte Rechtschreibung korrekt getrennt.  Korrekt bedeutet
1137   hier: Nicht alle möglichen Trennstellen müssen erkannt werden; es
1138   werden jedoch in keinem Fall falsche Trennstellen ermittelt.  Zum
1139   Testen kann in \TeX\ der folgende Aufruf verwendet werden (die
1140   Ausgabe erfolgt in der \texttt{log}-Datei):
1141
1142 \begin{lstlisting}[style=LaTeX]
1143 \showhyphens{durch Leerzeichen getrennte Wörter}
1144 \end{lstlisting}
1145
1146 \item\label{enum:kritSinn} Es handelt es sich um eine orthographisch
1147   richtige, aber sinnentstellende oder irreführende Trennung.
1148   Berücksichtigt werden allerdings nur Wörter, die aus höchstens zwei
1149   (gegebenenfalls prä- und suffigierten) Wörtern zusammengesetzt sind,
1150   zum Beispiel ">Talent-wässerung"<.  Nicht berücksichtigt wird
1151   hingegen die ">Talent-wässerungsanlage"<.
1152
1153 \end{enumerate}
1154
1155 Einige bekannte Fehler in den Trennmustern sind in der Datei
1156 \Datei{CHANGES} verzeichnet.  Noch nicht bekannte falsche, fehlende
1157 und unerwünschte Worttrennungen können an die E-Mail-Adresse
1158 \href{mailto:trennmuster@dante.de}{trennmuster@dante.de} gerichtet
1159 werden.
1160
1161 Trennfehler, die in den Trennmustern nicht korrigiert werden können,
1162 können mit Hilfe einer privaten Ausnahmeliste behandelt werden:
1163
1164 \begin{lstlisting}[style=LaTeX]
1165 \hyphenation{Tal-entwäs-se-rungs-an-la-ge Kaf-ka-kenner-klub}
1166 \end{lstlisting}
1167
1168 Die aktuelle und ältere Ausgaben der Trennmuster sind im Dateibereich
1169 des Trennmuster-Wikis erhältlich.%
1170 \footnote{\url{http://projekte.dante.de/Trennmuster}}
1171 %
1172 Im Entwicklerrepositorium\footnote{%
1173   siehe \url{http://projekte.dante.de/Trennmuster/Entwickler}}
1174 befindet sich ein Makefile, mit dem jederzeit neue Trennmuster erzeugt
1175 werden können.
1176
1177 \nobreak
1178 \noindent\parbox{\linewidth}{%
1179   \vspace*{\baselineskip}
1180   \raggedright
1181   \itshape
1182   Happy \TeX ing!\newline
1183   Die deutschsprachige Trennmustermannschaft
1184 }
1185
1186
1187 \begingroup
1188   \RaggedRight
1189   \bibliography{dehyph-exptl}
1190 \endgroup
1191
1192
1193 \appendix
1194 \section{Dateien und Installation}
1195 \label{sec:installation}
1196
1197 Die eigentlichen Trennmusterdateien liegen in \Abk{utf-8}"=Kodierung
1198 vor (siehe \autoref{tab:dateien}, Endung \texttt{pat}).  Sie werden
1199 von \hologo{TeX} nicht direkt geladen, sondern durch Manteldateien,
1200 die ebenfalls Teil des Pakets sind (Endung \texttt{tex}).  Wird eine
1201 8-Bit-fähige \hologo{TeX}"=Variante erkannt, übernehmen diese
1202 Manteldateien die Konvertierung der Trennmuster in die
1203 \Abk{t1}-Kodierung.
1204
1205 \begin{table}
1206   \centering
1207   \caption{Trennmuster- und Manteldateien}
1208   \label{tab:dateien}
1209   \begin{tabular}{>{\ttfamily}l>{\ttfamily}l}
1210     \normalfont Trennmusterdatei & \normalfont Manteldatei\\
1211     \addlinespace\toprule\addlinespace
1212     dehypht-x-<datum>.pat & dehypht-x-<datum>.tex\\
1213     dehyphts-x-<datum>.pat & dehyphts-x-<datum>.tex\\
1214     dehyphn-x-<datum>.pat & dehyphn-x-<datum>.tex\\
1215   \end{tabular}
1216 \end{table}
1217
1218 Bei der Installation werden die Manteldateien an die in
1219 \autoref{tab:varietaeten} gezeigten Trennmusterbezeichner gebunden.
1220 Diese Schritte werden für verschiedene \hologo{TeX}"=Verteilungen in
1221 der Datei \Datei{INSTALL} beschrieben.  Nach der Installation können
1222 die experimentellen Trennmuster wie in \autoref{sec:aktivieren}
1223 gezeigt verwendet werden.
1224
1225
1226 \section{Fragen \& Antworten}
1227 \label{sec:fragen}
1228
1229 \newcommand*{\fragefont}{\itshape}
1230 \newcommand*{\themenfont}{\large\normalfont}
1231 \newcounter{cntfrage}% Zaehler fuer Fragen.
1232 \newcounter{thema}% Zaehler fuer Themenueberschriften.
1233 \renewcommand*{\thethema}{\Roman{thema}.}
1234 \newcounter{frage}% Zaehler fuer Fragen.
1235 \renewcommand*{\thefrage}{\arabic{frage}.}
1236 \newboolean{nextfrage}
1237
1238 \makeatletter
1239
1240 %%% Neue zref-Liste frage = (type, text, anchor).
1241 \zref@newlist{frage}
1242 \zref@newprop{type}{f}
1243 \zref@newprop{text}{??}
1244 \zref@addprop{frage}{type}
1245 \zref@addprop{frage}{text}
1246 \zref@addprop{frage}{anchor}
1247
1248 %%% Fuegt eine neue Themenueberschrift ein.
1249 \newcommand*{\fragenthema}[1]{%
1250   \par
1251   \pagebreak[1]
1252   \vspace{.25\baselineskip plus .1\baselineskip minus .1\baselineskip}
1253   \refstepcounter{cntfrage}
1254   \stepcounter{thema}
1255   \zref@setcurrent{type}{t}
1256   \zref@setcurrent{text}{\thethema~#1}
1257   \zref@labelbylist{frage:\thecntfrage}{frage}
1258   \noindent{\themenfont\thethema~#1\par}
1259 }
1260
1261 %%% Umgebung fuer eine Frage mit Antwort.
1262 \newenvironment{frageantwort}[1]{%
1263   \par
1264   \vspace{.25\baselineskip plus .1\baselineskip minus .1\baselineskip}
1265   \refstepcounter{cntfrage}
1266   \stepcounter{frage}
1267   \zref@setcurrent{type}{f}
1268   \zref@setcurrent{text}{\thefrage~#1}
1269   \zref@labelbylist{frage:\thecntfrage}{frage}
1270   \noindent{\fragefont\thefrage~#1\par}
1271   \nobreak\noindent\ignorespaces
1272 }{%
1273   \vspace{.25\baselineskip plus .1\baselineskip minus .1\baselineskip}
1274 }
1275
1276 %%% Zeige alle Fragen in sortierter Reihenfolge.
1277 \newcommand{\zeigefragen}{%
1278   \par
1279   \zref@refused{frage:1}
1280   \setcounter{cntfrage}{1}
1281   \setboolean{nextfrage}{true}
1282   \whiledo{\boolean{nextfrage}}{
1283     \vspace{.25\baselineskip plus .1\baselineskip minus .1\baselineskip}
1284     \ifthenelse{\equal{\zref@extract{frage:\thecntfrage}{type}}{f}}{% Frage
1285       \noindent%
1286       \begingroup%
1287         \fragefont%
1288         \hyperlink{\zref@extract{frage:\thecntfrage}{anchor}}{%
1289           \zref@extract{frage:\thecntfrage}{text}%
1290         }%
1291         \par
1292       \endgroup
1293     }{% Themenueberschrift
1294       \noindent%
1295       \begingroup%
1296         \themenfont%
1297         \zref@extract{frage:\thecntfrage}{text}%
1298         \par
1299       \endgroup
1300       \nobreak
1301     }
1302     \stepcounter{cntfrage}
1303     \zref@ifrefundefined{frage:\thecntfrage}{\setboolean{nextfrage}{false}}{}
1304   }
1305   \vspace{.5\baselineskip plus .1\baselineskip minus .1\baselineskip}
1306   \setcounter{cntfrage}{0}
1307   \setcounter{frage}{0}
1308 }
1309
1310
1311 \zeigefragen
1312
1313
1314 \fragenthema{Verwenden der Trennmuster}
1315
1316 \begin{frageantwort}{Wie kann für die experimentellen Trennmuster aus
1317     dem Paket \Paket{dehyph-exptl} das Datum ermittelt werden, das
1318     Teil des Trennmusterbezeichners ist, wie in
1319     \autoref{sec:verwenden} erwähnt?}
1320
1321   Die Trennmusterbezeichner werden in der Datei \Datei{language.dat}
1322   definiert, wo auch die Verbindung zu den Manteldateien hergestellt
1323   wird.  Da ein Teil der Trennmusterbezeichner bereits bekannt ist,
1324   \verb+german-x+, vgl. \autoref{tab:varietaeten}, kann die Datei
1325   \Datei{language.dat} danach durchsucht werden.  Zunächst muss der
1326   Ort der Datei mit Hilfe des Kommandos \Programm{kpsewhich} ermittelt
1327   werden.  Es folgen die vollständigen Kommandos für unixähnliche
1328   Shells und die Windows-Kommandozeile \Datei{cmd.exe} (einzugeben
1329   ohne Zeilenumbruch).  Achtung, bei den einfachen Anführungszeichen
1330   handelt es sich um Gravis (">Backquotes"<).
1331
1332 \begin{lstlisting}[style=shell, caption=Shell]
1333 grep -i german-x `kpsewhich language.dat`
1334 \end{lstlisting}
1335
1336 \begin{lstlisting}[style=shell, caption=\Datei{cmd.exe}]
1337 for /F "usebackq" %f in (`kpsewhich language.dat`)
1338   do find /i "german-x" "%f"
1339 \end{lstlisting}
1340
1341   Die Ausgabe dieser Kommandos sieht etwa wie folgt aus (das Datum
1342   kann abweichen):
1343
1344 \begin{lstlisting}
1345 german-x-2009-06-19 dehypht-x-2009-06-19.tex
1346 =german-x-latest
1347 ngerman-x-2009-06-19 dehyphn-x-2009-06-19.tex
1348 =ngerman-x-latest
1349 \end{lstlisting}
1350
1351   Die gesuchten Trennmusterbezeichner befinden sich in der ersten
1352   Spalte und lauten in diesem Beispiel
1353   \lstinline[style=LaTeX]{german-x-2009-06-19} und
1354   \lstinline[style=LaTeX]{ngerman-x-2009-06-19}.  In der zweiten
1355   Spalte kann man die Namen der Manteldateien erkennen
1356   (vgl. \autoref{tab:dateien}).  Die mit einem Gleichheitszeichen
1357   beginnenden Zeilen definieren ein Synonym für den
1358   Trennmusterbezeichner der unmittelbar vorangehenden Zeile in der
1359   Datei \Datei{language.dat}.
1360 \end{frageantwort}
1361
1362
1363 \begin{frageantwort}{Wie kann die Version der experimentellen Muster
1364     ermittelt werden, die im Paket \Paket{hyph-utf8} enthalten sind?}
1365
1366   Das Vorgehen ähnelt dem der vorherigen Antwort.  Zunächst wird der
1367   Ort einer bestimmten Datei ermittelt.  Diese wird dann nach einer
1368   hilfreichen Zeichenkette durchsucht.
1369
1370 \begin{lstlisting}[style=shell, caption=Shell]
1371 grep dehyph `kpsewhich hyph-de-1901.lic.txt`
1372 \end{lstlisting}
1373
1374 \begin{lstlisting}[style=shell, caption=\Datei{cmd.exe}]
1375 for /F "usebackq" %f in (`kpsewhich hyph-de-1901.lic.txt`)
1376   do find "dehyph" "%f"
1377 \end{lstlisting}
1378
1379   Die Ausgabe dieser Kommandos sieht etwa wie folgt aus (das Datum
1380   kann abweichen):
1381
1382 \begin{lstlisting}
1383 % dehypht-x-2011-06-01.pat
1384 \message{German Hyphenation Patterns (Traditional Orthography)
1385   `dehypht-x' 2011-06-01 (WL)}
1386 \end{lstlisting}
1387 \end{frageantwort}
1388
1389 \begin{frageantwort}{Wie kann die Version der experimentellen Muster
1390     ermittelt werden, die von \hologo{ConTeXt} verwendet werden?}
1391
1392   Das Vorgehen ähnelt dem der vorherigen Antwort.  Zunächst wird der
1393   Ort einer bestimmten Datei ermittelt.  Diese wird dann nach einer
1394   hilfreichen Zeichenkette durchsucht.
1395
1396 \begin{lstlisting}[style=shell, caption=Shell]
1397 grep dehyph `kpsewhich lang-de.rme`
1398 \end{lstlisting}
1399
1400 \begin{lstlisting}[style=shell, caption=\Datei{cmd.exe}]
1401 for /F "usebackq" %f in (`kpsewhich lang-de.rme`)
1402   do find "dehyph" "%f"
1403 \end{lstlisting}
1404
1405   Die Ausgabe dieser Kommandos sieht etwa wie folgt aus (das Datum
1406   kann abweichen):
1407
1408 \begin{lstlisting}
1409 % dehyphn-x-2014-05-21.pat
1410 \message{German Hyphenation Patterns (Reformed Orthography, 2006)
1411   `dehyphn-x' 2014-05-21 (WL)}
1412 \end{lstlisting}
1413 \end{frageantwort}
1414
1415
1416 \fragenthema{Rechtschreibung}
1417
1418 \begin{frageantwort}{Verlag, Prüfer o.\,ä. bemängeln die Trennung der
1419     Trennmuster für die reformierte Rechtschreibung.  Zum Beispiel
1420     wird ">In-dus-trie"< getrennt, der Duden trennt jedoch
1421     ">In-dust-rie"<.}
1422
1423   Die amtlichen Regeln für die Rechtschreibung der deutschen Sprache
1424   lassen für viele Wörter mehrere Trennvarianten zu.  Die Trennmuster
1425   und ebenso Wörterverzeichnisse legen sich aus praktischen Gründen
1426   auf eine Trennvariante fest.  Sie können daher unterschiedliche
1427   Trennungen verwenden, ohne dass eine von beiden falsch ist.  Aus
1428   diesem Grund sind Wörterverzeichnisse nicht geeignet, eine bestimmte
1429   Trennung auf Richtigkeit zu prüfen.  Verbindlich sind einzig die
1430   amtlichen Regeln für die Rechtschreibung der deutschen
1431   Sprache~\cite{amtlRegeln:2006}.  Häufig sind diese im Anhang eines
1432   Wörterbuchs abgedruckt.  Die von den Trennmustern befolgten
1433   Konventionen können \autoref{sec:trennregeln} entnommen werden.
1434
1435   Wenn Unsicherheit darüber herrscht, wie die Rechtschreibung geprüft
1436   wird, sollte dies frühzeitig geklärt werden.  Nicht jedem Redakteur
1437   oder Prüfer ist bewusst, dass der Duden seine normative Stellung mit
1438   der Rechtschreibreform~1996 eingebüßt hat.
1439 \end{frageantwort}
1440
1441
1442 \begin{frageantwort}{Gibt es dudenkonforme Trennmuster für die
1443     reformierte Rechtschreibung?}
1444
1445   Zur Zeit nicht, es ist auch nicht geplant.  Dieses Projekt ist
1446   jedoch offen für Vorschläge und Mitarbeit.
1447 \end{frageantwort}
1448
1449
1450 \begin{frageantwort}{Weshalb werden noch Trennmuster für die
1451     traditionelle Rechtschreibung bereitgestellt?}
1452
1453   Die amtlichen Regeln für die Rechtschreibung der deutschen Sprache
1454   in der Fassung von 2006 sind nur für öffentliche Einrichtungen und
1455   Behörden verbindlich.  Im privaten Schriftverkehr kann man wahlweise
1456   die traditionelle oder die reformierte Rechtschreibung verwenden.%
1457   \footnote{Oder auch keine von beiden.}
1458 %
1459   Daher erfreut sich die traditionelle Rechtschreibung weiterhin
1460   großer Beliebtheit.
1461
1462   Für Texte in gebrochener Schrift ist die traditionelle
1463   Rechtschreibung sogar vorzuziehen.
1464 \end{frageantwort}
1465
1466 \begin{frageantwort}{In der Voreinstellung für die deutsche Sprache
1467     beträgt die Mindestlänge abgetrennter Silben zwei Buchstaben. Wie
1468     kann diese Mindestlänge verändert werden?}
1469
1470   Nehmen wir an, am Wortanfang sollen nicht weniger als drei und am
1471   Wortende nicht weniger als vier Buchstaben abgetrennt werden.  Dann
1472   sind folgende Befehle nötig:
1473
1474   \begin{itemize}
1475   \item Mit Plain-\hologo{TeX}:
1476
1477 \begin{lstlisting}[style=LaTeX]
1478   \uselanguage{<sprache>}
1479   \lefthyphenmin=3
1480   \righthyphenmin=4
1481 \end{lstlisting}
1482
1483     Ersetze dabei \texttt{<sprache>} durch eine der in
1484     \autoref{subsubsec:PlainTeX} erwähnten Trennmusterbezeichnungen,
1485     beispielsweise \texttt{ngerman}.
1486
1487   \item Mit \hologo{LaTeX} und \Paket{Babel}:
1488
1489 \begin{lstlisting}[style=LaTeX]
1490   \usepackage[<sprache>]{babel}
1491   \renewcommand*{\<sprache>hyphenmins}{34}
1492 \end{lstlisting}
1493
1494     Ersetze dabei \texttt{<sprache>} durch eine der in
1495     \autoref{subsubsec:LaTeX+Babel} erwähnten
1496     \Paket{Babel}-Sprachbezeichnungen, beispielsweise
1497     \texttt{ngerman}.
1498
1499   \item Mit \hologo{XeLaTeX}/\hologo{LuaLaTeX} und
1500     \Paket{Polyglossia}:
1501
1502 \begin{lstlisting}[style=LaTeX]
1503   \usepackage{polyglossia}
1504   \setmainlanguage{german}
1505   \renewcommand*{\germanhyphenmins}{34}
1506 \end{lstlisting}
1507   \end{itemize}
1508 \end{frageantwort}
1509
1510 \begin{frageantwort}{Können Trennungen mit einer Silbenlänge von nur
1511     einem Buchstaben ermöglicht werden, zum Beispiel für den Satz in
1512     schmalen Kolumnen?}
1513
1514   Mit diesen Trennmustern ist das nicht möglich, da die
1515   zugrundeliegende Wortliste solche Trennungen nicht enthält.  Die
1516   Abtrennung einzelner Vokale, zum Beispiel ">A-bend"<, war nur
1517   kurzzeitig zulässig; die entsprechende Regelung von 1996 wurde mit
1518   der Rechtschreibreform 2006 wieder zurückgenommen.  Wird die
1519   Silbenmindestlänge für die Worttrennung auf eins verringert, können
1520   falsche Trennungen auftreten.
1521 \end{frageantwort}
1522
1523
1524 \fragenthema{Mitarbeit}
1525
1526 \begin{frageantwort}{Wie kann ich mich über dieses Projekt
1527     informieren?}
1528
1529   Zentrale Anlaufstelle ist das Trennmuster-Wiki, welches sich
1530   momentan jedoch noch im Aufbau befindet.%
1531   \footnote{\url{http://projekte.dante.de/Trennmuster}}
1532 %
1533   Für Fragen und Hinweise kann nach Anmeldung die Mailingliste;%
1534 %
1535   \footnote{\href{mailto:trennmuster@dante.de}{trennmuster@dante.de}}
1536 %
1537   oder alternativ die Usenetgruppe \Datei{de.comp.text.tex} genutzt
1538   werden.  Die folgenden Dateien enthalten weitergehende
1539   Informationen:
1540
1541   \begin{itemize}
1542
1543   \item Neben der Dokumentation zu den Trennmustern enthält dieses
1544     Paket eine Projektbeschreibung (\Datei{projektbeschreibung.pdf}).
1545
1546   \item Die Datei \Datei{CHANGES} enthält bekannte, systematische
1547     Fehler der Trennmuster.
1548
1549   \item Das Entwicklerrepositorium enthält in der Datei
1550     \Datei{README.wortliste} eine Beschreibung des Formats der
1551     Wortliste.
1552
1553   \end{itemize}
1554 \end{frageantwort}
1555
1556
1557 \begin{frageantwort}{Wie kann ich helfen?}
1558
1559   Die deutschsprachige Trennmustermannschaft ist eine offene Gruppe
1560   und benötigt dringend weitere Mithilfe.  Interessenten sind daher
1561   hoch willkommen!  Zum Mitmachen gibt es mehrere Möglichkeiten:
1562
1563   \begin{itemize}
1564   \item Die einfachste ist, die experimentellen Trennmuster ausgiebig
1565     zu testen und Fehler zu melden (siehe \autoref{sec:trennfehler}).
1566
1567   \item Besonders hilfreich wäre Mitarbeit am Projekt.  Als Einstieg
1568     kann die (grobe) Aufgabenliste in der Projektbeschreibung dienen.
1569
1570     Obwohl schon experimentelle Trennmuster veröffentlicht wurden,
1571     steht dieses Projekt noch ziemlich am Anfang.  Ziel ist, die
1572     verwendete Wortliste von möglichst vielen Menschen in verteilter
1573     Arbeit auf Richtigkeit zu prüfen.  Bis dahin bleibt jedoch noch
1574     viel zu tun.
1575
1576   \item Mittelfristig -- nach Fertigstellung der Prüfmaske~-- kann
1577     auch durch systematische Durchsicht eines Teils der Wortliste
1578     geholfen werden.
1579
1580   \item Fragen, Hinweise und Ideen sind auf der Mailingliste immer
1581     willkommen!
1582   \end{itemize}
1583 \end{frageantwort}
1584
1585
1586 \begin{frageantwort}{Sollten Trennfehler einzeln oder gesammelt
1587     eingereicht werden?}
1588
1589   Das ist egal.  Es sollten allerdings die folgenden Hinweise beim
1590   Einreichen von Fehlern beachtet werden:
1591
1592   \begin{description}
1593     \setkomafont{descriptionlabel}{\normalfont\itshape}
1594
1595   \item[Aktualität] Wenn ältere Trennmusterdateien verwenden werden,
1596     bitte zuerst prüfen, ob der Fehler auch mit aktuellen Trennmustern
1597     auftritt.  Die aktuellen Trennmuster sind im \Abk{ctan} im Paket
1598     \Paket{dehyph-exptl} oder im Dateibereich unter der
1599     Projekt-\Abk{url} erhältlich.  Im Repositorium befindet sich auch
1600     ein Makefile, mit dem jederzeit neue Trennmuster aus der aktuellen
1601     Wortliste erzeugt werden können.
1602
1603   \item[Informationen] In einem Fehlerbericht sollte für das
1604     betreffende Wort die richtige und bei einzelnen Worteinreichungen
1605     auch die falsche Trennung angegeben werden.  Außerdem die genaue
1606     Version der verwendeten Trennmuster (traditionelle oder
1607     reformierte Rechtschreibung, Datum der Trennmusterdatei).
1608
1609   \item[Listenformat] Es erleichtert die Korrektur, wenn
1610     Berichtigungsvorschläge in Form einer Liste eingereicht werden,
1611     die automatisch mit Skripten bearbeitet werden kann.  Die
1612     folgenden Konventionen sollten dabei eingehalten werden:
1613
1614     \begin{itemize}
1615     \item Die Spalten werden mit einem Semikolon \verb+;+ getrennt.
1616     \item Die erste Spalte enthält das betreffende Wort in
1617       ungetrennter Form.
1618     \item Die zweite Spalte enthält das Wort in der Trennvariante nach
1619       traditioneller Rechtschreibung.
1620     \item Falls die Trennung nach reformierter Rechtschreibung davon
1621       abweicht, steht diese in der dritten Spalte.
1622     \item Ab der vierten Spalte \emph{können} weitere Trennvarianten
1623       folgen, etwa die falsche Trennung.  Eine kurze Erklärung sollte
1624       dann darauf eingehen.
1625     \item Unerwünschte Trennungen werden mit einem Punkt \verb+.+
1626       markiert.
1627     \item Anfang und Ende der Liste sollten klar erkennbar sein.
1628     \end{itemize}
1629
1630     Eine Liste könnte beispielhaft so aussehen:
1631
1632 \begin{lstlisting}[style=Text]
1633 sonnendurchfluteten;son-nen-durch-flu-te-ten
1634 Talentwässerung;Tal-ent.wäs-se-rung
1635 Fensterplatz;Fen-ster-platz;Fens-ter-platz
1636 \end{lstlisting}
1637
1638     Dieses Format ist auch für einzeln eingereichte Korrekturen
1639     sinnvoll.
1640
1641   \item[Betreff] Der Betreff einer Fehlermeldung sollte aussagekräftig
1642     sein.  Daher sollten mehrere Trennfehler, sofern möglich,
1643     thematisch zusammengefasst werden.  Außerdem kann zur einfacheren
1644     Zuordnung das entsprechende Kriterium aus
1645     \autoref{sec:trennfehler} dem Betreff der E-Mail in eckigen
1646     Klammern vorangestellt werden, zum Beispiel:
1647
1648 \begin{lstlisting}[style=Text]
1649 Betreff: [A] sonnendurchfluteten
1650 \end{lstlisting}
1651
1652     \noindent für einen Trennfehler im Wortes
1653     \emph{sonnendurchfluteten}, der durch einen Fehler in der
1654     Wortliste hervorgerufen wird.
1655   \end{description}
1656 \end{frageantwort}
1657
1658
1659 \end{document}
1660
1661 %%% Local Variables:
1662 %%% mode: latex
1663 %%% TeX-engine: default
1664 %%% TeX-PDF-mode: t
1665 %%% TeX-master: t
1666 %%% coding: utf-8
1667 %%% End: