dehyph-exptl/dehyph-exptl.tex

   1 %%% Artikelklasse mit:
   2 %%% * Grundschriftgröße 11 Punkt,
   3 %%% * klassischem Satzspiegel,
   4 %%% * flachem Inhaltsverzeichnis,
   5 %%% * Tabellenüberschriften.
   6 \documentclass[11pt,
   7                DIV=9,
   8                toc=flat,
   9                captions=tableheading,
  10                abstract=on]{scrartcl}
  11
  12 \emergencystretch 1em
  13
  14 %%% Eingabekodierung ist UTF-8.
  15 \usepackage[utf8]{inputenc}
  16
  17 %%% Schrifteinstellung:
  18 %%% * Grundschrift Palatino,
  19 %%% * Akzidenzschrift Bera Sans,
  20 %%% * Schreibmaschinenschrift Latin Modern Typewriter.
  21 \usepackage[T1]{fontenc}
  22 \usepackage[osf]{mathpazo}
  23 \usepackage[scaled=0.85]{berasans}
  24 \renewcommand*{\ttdefault}{lmtt}
  25 \usepackage{textcomp}
  26
  27 \linespread{1.1}
  28 \usepackage[expansion=true,
  29             letterspace=80]{microtype}
  30
  31 %%% Lade einige Pakete.
  32 \usepackage{ifthen}
  33 \usepackage{calc}
  34 \usepackage{multicol}
  35 \usepackage{paralist}
  36 \usepackage{fncylab}
  37 \usepackage{tabularx}
  38 \usepackage{booktabs}
  39 \usepackage{ragged2e}
  40 \usepackage{hologo}
  41 \usepackage[defaultlines=4,
  42             all]{nowidow}
  43
  44 \newcolumntype{L}{>{\raggedright\arraybackslash}X}
  45
  46 \usepackage{listings}
  47 \lstloadlanguages{[LaTeX]TeX, sh}
  48 \lstset{
  49   basicstyle=\ttfamily,
  50   keywordstyle={},
  51   commentstyle={},
  52   columns=flexible,
  53   showspaces=false,
  54   showstringspaces=false,
  55   % frame=tb,
  56   % framesep=8pt,
  57   % framerule=2pt,
  58   xleftmargin=6pt,
  59   xrightmargin=6pt,
  60   % framexleftmargin=6pt,
  61   % framexrightmargin=6pt,
  62   inputencoding=utf8,
  63   extendedchars=true,
  64   literate={ä}{{\"a}}1 {ö}{{\"o}}1 {ü}{{\"u}}1,
  65 }
  66 \lstdefinestyle{LaTeX}{
  67   language=[LaTeX]TeX,
  68   basicstyle=\ttfamily,
  69   keywordstyle={},
  70   commentstyle={\itshape}
  71 }
  72 \lstdefinestyle{shell}{
  73   language=sh,
  74   basicstyle=\ttfamily,
  75   keywordstyle={},
  76   commentstyle={\itshape},
  77   upquote=true % Gravis korrekt anzeigen
  78 }
  79 \lstdefinestyle{Text}{
  80   language=,
  81   basicstyle=\ttfamily,
  82   keywordstyle={},
  83   commentstyle={}
  84 }
  85
  86 \usepackage{needspace}
  87
  88 %%% Literaturverweise in runden Klammern mit Semikolon als Trenner.
  89 % \usepackage[round,semicolon]{natbib}
  90 % \renewcommand*{\bibnumfmt}[1]{(#1)}
  91
  92 %%% Literaturverzeichnis mit Sprachunterstützung.
  93 \usepackage[fixlanguage]{babelbib}
  94 \bibliographystyle{babalpha}
  95 %%% Babelbib fordert trotz fixlanguage zuviele Sprachen an.
  96 \usepackage[english,
  97             german,
  98             ngerman]{babel}
  99 \usepackage[ngerman=ngerman-x-latest]{hyphsubst}
 100
 101 %%% Einstellungen für interaktive PDF-Dokumente.
 102 \usepackage[rgb,x11names]{xcolor}
 103 \usepackage[hyperref]{zref}
 104 \usepackage{hyperref}
 105 \hypersetup{
 106   pdftitle={dehyph-exptl},
 107   pdfauthor={Die deutschsprachige Trennmustermannschaft},
 108   pdfkeywords={TeX,
 109                deutsche Rechtschreibung,
 110                Trennmuster,
 111                computergestützte Worttrennung}
 112 }
 113 \hypersetup{
 114   ngerman,% Für \autoref.
 115   pdfstartview={XYZ null null null},% Viewer bestimmt Zoomfaktor.
 116   colorlinks,
 117   linkcolor=RoyalBlue3,
 118   urlcolor=Chocolate4,
 119   citecolor=DeepPink2
 120 }
 121 \newcommand*{\regelref}[1]{%
 122   \begingroup
 123   \renewcommand*{\Itemautorefname}{Regel}%
 124   \autoref{#1}%
 125   \endgroup%
 126 }
 127
 128 %%% Schriftfestlegungen.
 129 \setkomafont{title}{\normalcolor\normalfont}
 130 \setkomafont{sectioning}{\normalcolor\normalfont}
 131 \setkomafont{section}{\Large}
 132 \setkomafont{subsection}{\Large\itshape}
 133 \setkomafont{descriptionlabel}{\normalfont\itshape}
 134
 135 %%% Einige Makros für logische Auszeichnungen definieren.
 136 \newcommand*{\Abk}[1]{\mbox{\textsc{\lsstyle#1}}}
 137 \newcommand*{\Paket}[1]{\textsf{#1}}
 138 \newcommand*{\Programm}[1]{\lstinline[style=shell]{#1}}
 139 \newcommand*{\Datei}[1]{\texttt{#1}}
 140
 141 \colorlet{falschcol}{red!80!black}
 142 \colorlet{tradcol}{green!50!black}
 143 \colorlet{reformcol}{green!75!black}
 144 \colorlet{unerwcol}{red!60!black}
 145
 146 \newcolumntype{T}{>{\color{tradcol}}l}
 147 \newcolumntype{R}{>{\color{reformcol}}l}
 148 \newcolumntype{U}{>{\color{unerwcol}}l}
 149
 150 \newcommand*{\trennung}[2]{%
 151   \makebox[0pt][l]{%
 152     \color{#1}%
 153     \smash{\rule[-3.5pt]{\widthof{#2}}{.7pt}}% Schriftabhängig.
 154   }%
 155   #2%
 156 }
 157 \newcommand*{\ftr}[1]{\trennung{falschcol}{#1}}% Falsche Trennung.
 158
 159 %%% Satzspiegel erneut berechnen.
 160 \typearea{last}
 161
 162
 163 %%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
 164
 165 \begin{document}
 166
 167 %%% Trennausnahmen definieren.
 168 \hyphenation{
 169   Back-end
 170   hyph-subst
 171   Ent-wick-ler-re-po-si-to-ri-um
 172   Wort-her-kunft
 173   Not-tren-nung
 174   Trenn-al-go-rith-mus
 175   um-bruch-in-kom-pa-tib-le
 176 }
 177
 178 %%% Protokollierung der Trennungen für findhyph.
 179 %\tracingparagraphs=1
 180
 181 %%% Dokumenttitel.
 182 \author{Die deutschsprachige Trennmustermannschaft}
 183 \title{\Paket{dehyph-exptl}\thanks{This document describes the
 184     \Paket{dehyph-exptl} package v0.9.}}
 185 \subtitle{Experimentelle Trennmuster für die deutsche Sprache}
 186 \maketitle
 187
 188 %%% Zweisprachige Zusammenfassung.
 189 \selectlanguage{english}
 190 \begin{abstract}
 191   This document describes the experimental hyphenation patterns for
 192   the German language, covering traditional and reformed orthography
 193   for several varieties of Standard German.  When using
 194   \hologo{XeTeX}/\hologo{LuaTeX}, these patterns are used
 195   automatically.  In other cases, they have to be loaded explicitly.
 196   More information can be found in the Trennmuster-Wiki%
 197   \footnote{\url{https://projekte.dante.de/Trennmuster}} (in German).
 198 \end{abstract}
 199
 200 \selectlanguage{ngerman}
 201 \begin{abstract}
 202   Dieses Dokument beschreibt die experimentellen Trennmuster für die
 203   deutsche Sprache, die das in Deutschland, Österreich und der Schweiz
 204   gebräuchliche Standarddeutsch in der traditionellen und reformierten
 205   Rechtschreibung abdecken.  Bei Nutzung von
 206   \hologo{XeTeX}/\hologo{LuaTeX} werden diese Muster automatisch
 207   verwendet; in anderen Fällen müssen sie i.\,d.\,R. ausdrücklich
 208   geladen werden.
 209 \end{abstract}
 210
 211 \vfill
 212 \begingroup
 213 \em\large
 214
 215 \begin{center}
 216   Warnung!
 217 \end{center}
 218
 219 Diese Trennmuster befinden sich im experimentellen Status.  Sie können
 220 auf \Abk{ctan} und in den \hologo{TeX}"=Verteilungen jederzeit
 221 durch umbruchinkompatible aktualisierte Versionen ersetzt werden.  Für
 222 Anwendungen, die einen dauerhaft stabilen Umbruch erfordern, sind sie
 223 nur geeignet, falls manuell eine feste Version installiert wird.
 224 \endgroup \vfill
 225
 226 \clearpage
 227 %%% Zweispaltiges Inhaltsverzeichnis.
 228 \begin{multicols}{2}
 229   \RaggedRight
 230   \small
 231   \selectlanguage{ngerman}
 232   \tableofcontents
 233 \end{multicols}
 234
 235
 236 \section{Einleitung}
 237 \label{sec:einleitung}
 238
 239 Der in \hologo{TeX} implementierte Trennalgorithmus arbeitet
 240 musterbasiert~\cite{liang:1983}.  Prinzipiell können mit einem solchen
 241 Algorithmus nicht alle möglichen Wörter korrekt getrennt werden.  Die
 242 Qualität der Worttrennung einer Sprache wird jedoch maßgeblich von der
 243 Qualität der Wortliste beeinflusst, aus der die verwendeten
 244 Trennmuster berechnet wurden.
 245
 246 Obwohl die herkömmlichen Trennmuster für die deutsche Sprache bei der
 247 Worttrennung in gewöhnlichen Texten eine akzeptable Fehlerrate
 248 erreichen, enthalten sie doch eine Reihe von Schwächen:%
 249 \footnote{Diese Liste bezieht sich auf die Trennmusterdateien
 250   \Datei{dehypht.tex}, Version~3.2a vom 3.\,3.\,1999, und
 251   \Datei{dehyphn.tex}, Version~31 vom 7.\,5.\,2001.}
 252
 253 \bigskip\smallskip
 254 \needspace{4\baselineskip}
 255 \noindent\textit{traditionelle und reformierte Rechtschreibung}
 256
 257 \begin{itemize}
 258 \item In zusammengesetzten Wörtern treten häufig Trennfehler an
 259   Wortfugen auf.
 260
 261 \item Fremdwörter mit akzentuierten Buchstaben werden mangelhaft
 262   getrennt: »C\ftr{af}é«, »Ci-tr\ftr{oë}n«, »F\ftr{aç}on«,
 263   »vo\ftr{il}à«.
 264
 265 \item Die Trennmusterdateien enthalten eine Mischung aus \Abk{t1}-
 266   sowie unvollständigen \Abk{ot1}-kodierten Mustern.  Mit Erscheinen
 267   von 16-Bit"=fähigen \hologo{TeX}"=Varianten werden sauber
 268   \Abk{utf-8}"=kodierte Trennmuster nötig~\cite{miklavec:2008}.
 269 \end{itemize}
 270
 271 \bigskip
 272 \needspace{4\baselineskip}
 273 \noindent\textit{traditionelle Rechtschreibung}
 274
 275 \begin{itemize}
 276 \item Die herkömmlichen Trennmuster für die traditionelle deutsche
 277   Rechtschreibung können mit \Programm{patgen} nicht reproduziert
 278   werden, da die zugrundeliegende Wortliste verschollen ist.  Die
 279   Pflege der Trennmuster ist daher schwierig bis unmöglich.  Für freie
 280   Software ist dies kein zufriedenstellender Zustand.
 281
 282 \item Umfang und Qualität der ursprünglichen Wortliste lassen sich
 283   nicht mehr einschätzen.  Für die Trennmuster in traditioneller
 284   Rechtschreibung existiert jedoch inzwischen eine Ausnahmeliste mit
 285   über 3500 korrigierten Trennungen einfacher Wörter
 286   \cite{lemberg:2003, lemberg:2005}.%
 287   \footnote{\url{https://mirrors.ctan.org/language/hyphenation/dehyph/dehyphtex.tex}}
 288
 289 \item Wird in der traditionellen Rechtschreibung \emph{ß} durch
 290   \emph{ss/SS} oder \emph{sz/SZ} ersetzt, so bleibt die Trennung davon
 291   unberührt.  Die herkömmlichen Trennmuster berücksichtigen diese
 292   Regel nicht und trennen häufig den Ersatz:
 293   \textls{»GR\ftr{ÖS"~S}E«}, \textls{»GR\ftr{ÜS"~S}E«},
 294   \textls{»M\ftr{AS"~S}ES«}.%
 295   \footnote{Die Trennung der herkömmlichen Muster entspricht den
 296     Regeln der deutschen Standardsprache in der Schweiz, obwohl diese
 297     Sprachvarietät vom Paket \Paket{Babel} bis 2013 nicht offiziell
 298     unterstützt wurde.  \Paket{Babel} versucht den Mangel mit Hilfe
 299     des Kürzels \lstinline[style=LaTeX]+\"S+ zu kompensieren.}
 300
 301 \item Abweichende Schreibweisen, die in der traditionellen
 302   Rechtschreibung in Österreich und der Schweiz verwendet werden,
 303   werden mangelhaft getrennt: »Gro\ftr{s"~so}n-kel«,
 304   »Ku\ftr{s"~sh}and«, »Ma\ftr{ssn}ah-me«, »mi\ftr{s"~sa}ch-ten«
 305   (nur Schweiz) und »Ex-pre\ftr{ssz}ug«, »Fit-ne\ftr{s"~sc}en-ter«,
 306   »Fit-ne\ftr{sst}rai-ner«.
 307 \end{itemize}
 308
 309 \bigskip
 310 \needspace{4\baselineskip}
 311 \noindent\textit{reformierte Rechtschreibung}
 312
 313 \begin{itemize}
 314 \item Die Trennmuster für die reformierte deutsche Rechtschreibung
 315   wurden nicht mit \Programm{patgen} aus einer Wortliste erstellt.
 316   Stattdessen wurden die Trennmuster für die traditionelle
 317   Rechtschreibung von Hand an die reformierten Regeln
 318   angepasst~\cite{schmidt:1998}.  Aus diesem Grund ist die
 319   Worttrennung mit den Trennmustern für die reformierte
 320   Rechtschreibung etwas schlechter als mit den Trennmustern für die
 321   traditionelle Rechtschreibung.
 322 \end{itemize}
 323
 324 Das Projekt \emph{Freie Wortlisten und Trennmuster für die deutsche
 325   Sprache} hat sich das Ziel gesetzt, neue Trennmuster hoher Qualität
 326 für die deutsche Sprache zu erstellen, die die genannten Probleme
 327 ausräumen.
 328
 329 Den experimentellen Trennmustern dieses Pakets liegt eine Wortliste
 330 mit den etwa fünfhunderttausend häufigsten Wörtern der deutschen
 331 Sprache zugrunde.  Vermutlich ist diese Liste erheblich umfangreicher
 332 als die ursprüngliche Wortliste, in der Worthäufigkeiten
 333 wahrscheinlich überhaupt nicht berücksichtigt wurden.  Die verwendete
 334 Wortliste deckt das in Deutschland, Österreich und der Schweiz
 335 gebräuchliche Standarddeutsch ab.
 336
 337 Mit den vorliegenden Trennmustern sollte für nicht"=fachsprachliche
 338 Wörter eine sehr gute Trennqualität erreicht werden.  Insbesondere
 339 sollte sich die Trennung häufig auftretender zusammengesetzter Wörter
 340 verbessern.
 341
 342
 343 \section{Verwenden der Trennmuster}
 344 \label{sec:verwenden}
 345
 346 Die experimentellen Trennmuster werden durch zwei verschiedene
 347 \hologo{TeX}"=Pakete zur Verfügung gestellt, die beide in einer
 348 vollständigen Installation einer aktuellen \hologo{TeX}"=Distribution
 349 enthalten sein sollten.
 350
 351 Das Paket \Paket{hyph-utf8} enthält Trennmuster für alle von
 352 \hologo{TeX} unterstützten Sprachen.  Für die deutsche Sprache sind
 353 die experimentellen Muster enthalten.  Diese werden standardmäßig nur
 354 von \hologo{XeTeX}, \hologo{LuaTeX} und p\TeX\footnote{Eine in Japan
 355   populäre \TeX-Variante.} sowie von allen \hologo{TeX}"=Varianten für
 356 die Schweizer Varietät der deutschen Sprache in traditioneller
 357 Rechtschreibung\footnote{Diese Varietät wird erst seit dem Jahr 2013
 358   unterstützt, sodass keine Abwärtskompatibilität erforderlich ist.}
 359 benutzt.  In den übrigen Fällen wird dagegen auf die herkömmlichen
 360 Trennmuster zurückgegriffen.
 361
 362 Das Paket \Paket{dehyph-exptl} enthält die experimentellen
 363 Trennmuster für die deutsche Sprache.  Es hat den Zweck, diese den
 364 Nutzern der älteren \hologo{TeX}"=Varianten wie \hologo{pdfTeX}
 365 zugänglich zu machen.  Die hierfür nötigen Vorkehrungen werden unten
 366 beschrieben.
 367
 368 Siehe \autoref{sec:fragen} für Hinweise, wie die Version der in beiden
 369 Paketen enthaltenen Muster ermittelt werden kann.
 370
 371 Zur manuellen Installation einer bestimmten Version der
 372 experimentellen Trennmuster siehe \autoref{sec:installation}.
 373
 374 Beachte, in den folgenden Abschnitten ist \verb+<datum>+ durch das bei
 375 der Installation angegebene Datum in \Abk{iso}"=Notation
 376 (\verb+JJJJ-MM-TT+) oder die Zeichenkette \verb+latest+ zu ersetzen.
 377
 378
 379 \subsection{Sprachvarietät und Rechtschreibung}
 380 \label{sec:varietaeten}
 381
 382 Experimentelle Trennmuster stehen für die Worttrennung der deutschen
 383 Sprache in der traditionellen und der reformierten Rechtschreibung zur
 384 Verfügung.  Die Trennmuster unterstützen die drei in Deutschland,
 385 Österreich und der Schweiz gebräuchlichen Hauptvarietäten der
 386 deutschen Standardsprache.  \autoref{tab:varietaeten} zeigt die
 387 Trennmuster, die abhängig von gewünschter Varietät und Rechtschreibung
 388 in einem Dokument zu aktivieren sind.
 389
 390 \begin{table}
 391   \centering
 392   \caption{Die unterstützten Varietäten und Rechtschreibungen}
 393   \label{tab:varietaeten}
 394   \begin{tabular}{l>{\ttfamily}l}
 395     \normalfont Sprachvarietät
 396     & Trennmusterbezeichner\\
 397     \addlinespace\toprule\addlinespace
 398     \hspace*{-\tabcolsep}\normalfont\emph{traditionelle Rechtschreibung}\\
 399     Deutschland, Österreich
 400     & german-x-<datum>\\
 401     Schweiz
 402     & gswiss-x-<datum>\\\addlinespace
 403     \hspace*{-\tabcolsep}\normalfont\emph{reformierte Rechtschreibung}\\
 404     Deutschland, Österreich, Schweiz
 405     & ngerman-x-<datum>\\
 406   \end{tabular}
 407 \end{table}
 408
 409 Varietäten, die sich nur in der Verwendung und Schreibung einzelner
 410 Wörter voneinander unterscheiden, können durch gemeinsame Trennmuster
 411 unterstützt werden.
 412 % Die Eingabewortliste für \Programm{patgen} ist dann eine Vereinigung
 413 % der den Varietäten entsprechenden Wortlisten.
 414 Zum Beispiel werden Besonderheiten der österreichischen
 415 Standardsprache in den Trennmustern für die Standardsprache
 416 Deutschlands berücksichtigt.  Österreichische und deutsche Anwender
 417 können daher dieselben Trennmuster verwenden (wie das auch schon bei
 418 den herkömmlichen Trennmustern der Fall war).
 419
 420 Aufgrund unvereinbarer Trennregeln in der traditionellen
 421 Rechtschreibung der Standardsprachen Deutschlands/""Österreichs und
 422 der Schweiz werden für die letztere Varietät eigene Trennmuster
 423 bereitgestellt.
 424
 425 Mit der Rechtschreibreform 1996 wurden die Trennregeln aller drei
 426 Standardsprachen so weit angeglichen, dass für die reformierte
 427 Rechtschreibung einheitliche Trennmuster für alle drei unterstützten
 428 Sprachvarietäten bereitgestellt werden können.
 429
 430 \subsection{Aktivieren der Trennmuster}
 431 \label{sec:aktivieren}
 432
 433 Im Folgenden wird dargestellt, wie die experimentellen Trennmuster bei
 434 Verwendung unterschiedlicher \hologo{TeX}"=Varianten geladen werden
 435 können.
 436
 437 Das Ergebnis für die traditionelle und reformierte Rechtschreibung mit
 438 herkömmlichen und experimentellen Trennmustern ist in
 439 \autoref{tab:trennvarianten} zusammengefasst.  Ob die experimentellen
 440 Trennmuster korrekt aktiviert werden, kann mit dem folgenden kleinen
 441 Dokument getestet werden, dessen Ausgabe in der \texttt{log}"=Datei
 442 erscheint.
 443
 444 \begin{lstlisting}[style=LaTeX]
 445   \begin{document}
 446   \showhyphens{löste Fassade modernste Abendstern Mordopfer}
 447   \end{document}
 448 \end{lstlisting}
 449
 450 %\suppressfloats[t]
 451 \begin{table*}
 452   \centering
 453   \caption{Trennvarianten}
 454   \label{tab:trennvarianten}
 455   \begin{tabular}{llll}
 456     \multicolumn{2}{c}{\itshape traditionelle Rechtschreibung} &
 457     \multicolumn{2}{c}{\itshape reformierte Rechtschreibung}\\
 458     herkömmlich & experimentell & herkömmlich & experimentell\\
 459     \addlinespace\toprule\addlinespace
 460     l\ftr{ös-t}e & lö-ste & lös-te & lös-te\\
 461     Fas-sa-de & Fas-sa-de & Fa\ftr{ss}a-de & Fas-sa-de\\
 462     mo-\ftr{d-e}rn-ste & mo-dern-ste & mo-\ftr{d-e}rns-te & mo-derns-te\\
 463     Abend-stern & Abend-stern & Aben\ftr{ds-t}ern & Abend-stern\\
 464     Mo\ftr{r-do}p-fer & Mord-op-fer & Mo\ftr{r-do}p-fer & Mord-op-fer\\
 465   \end{tabular}
 466 \end{table*}
 467
 468 \subsubsection{Plain-\TeX}
 469 \label{subsubsec:PlainTeX}
 470
 471 Bei Verwendung eines \hologo{eTeX}"=basierten Compilers
 472 (\Programm{etex}, \Programm{pdftex}, \Programm{xetex} oder
 473 \Programm{luatex}) steht der Befehl \verb+\uselanguage+ zum Laden von
 474 Trennmustern zur Verfügung.  Er akzeptiert neben anderen die Argumente
 475 \texttt{german}, \texttt{ngerman} und \texttt{swissgerman} (nicht
 476 jedoch \texttt{austrian}, \texttt{naustrian} und
 477 \texttt{nswissgerman}).\footnote{Die zulässigen Sprachbezeichnungen
 478   finden sich in der Datei \Datei{language.def} der
 479   \hologo{TeX}"=Installation.}  Um die Silbentrennung gemäß
 480 reformierter deutscher Rechtschreibung zu aktivieren, ist also
 481 folgender Befehl ausreichend:
 482
 483 \begin{lstlisting}[style=LaTeX]
 484   \uselanguage{ngerman}
 485 \end{lstlisting}
 486
 487 Die Compiler \Programm{xetex} und \Programm{luatex} verwenden für alle
 488 definierten Varietäten der deutschen Sprache die experimentellen
 489 Trennmuster, die mit dem Paket \Paket{hyph-utf8} installiert sind;
 490 \Programm{etex} und \Programm{pdftex} tun dies nur für
 491 \texttt{swissgerman}.
 492
 493 Für die Varietäten \texttt{german} und \texttt{ngerman} laden
 494 \Programm{etex} und \Programm{pdftex} hingegen aus Gründen der
 495 Abwärtskompatibilität die herkömmlichen Trennmuster.  Die
 496 experimentellen Trennmuster können am einfachsten aktiviert werden,
 497 indem etwa \lstinline[style=LaTeX]+\uselanguage{ngerman}+ durch den
 498 folgenden Befehl ersetzt wird:
 499
 500 \begin{lstlisting}[style=LaTeX]
 501   \uselanguage{ngerman-x-latest}
 502 \end{lstlisting}
 503
 504 Auf entsprechende Weise ist es mit allen Compilern möglich, eine
 505 alternative, manuell installierte Trennmusterversion zu verwenden:
 506
 507 \begin{lstlisting}[style=LaTeX]
 508   \uselanguage{ngerman-x-<datum>}
 509 \end{lstlisting}
 510
 511 Vorausgesetzt ist dabei, dass ein entsprechender Eintrag in der
 512 Konfigurationsdatei \Datei{language.def} oder einer lokalen Version
 513 derselben existiert.
 514
 515 Soll der \verb+\uselanguage+-Befehl seine gewohnte Form behalten, ist
 516 zum Laden alternativer Trennmuster auch folgendes Vorgehen mit Hilfe
 517 des Pakets \Paket{hyphsubst} möglich:
 518
 519 \begin{lstlisting}[style=LaTeX]
 520   \input hyphsubst.sty
 521   \HyphSubstLet{ngerman}{ngerman-x-<datum>}
 522   \uselanguage{ngerman}
 523 \end{lstlisting}
 524
 525 Zu beachten ist, dass in Plain-\hologo{TeX} unabhängig vom verwendeten
 526 Compiler Wörter mit Umlauten, \emph{ß} oder Akzentbuchstaben an vielen
 527 Trennstellen nicht automatisiert getrennt werden können.
 528
 529 \subsubsection{\LaTeX{} mit dem Sprachenpaket \Paket{Babel}}
 530 \label{subsubsec:LaTeX+Babel}
 531
 532 Das Paket \Paket{Babel} kennt für die traditionelle Rechtschreibung
 533 die Sprachbezeichnungen \texttt{german}, \texttt{austrian} und
 534 \texttt{swissgerman}, für die reformierte Rechtschreibung
 535 \texttt{ngerman}, \texttt{naustrian} und \texttt{nswissgerman}, wobei
 536 diese sechs Varietäten durch drei Trennmustersätze abgedeckt werden
 537 können (\autoref{tab:varietaeten}).
 538
 539 Die Compiler \Programm{xelatex} und \Programm{lualatex} verwenden für
 540 alle definierten Varietäten der deutschen Sprache die experimentellen
 541 Trennmuster, die mit dem Paket \Paket{hyph-utf8} installiert sind;
 542 \Programm{latex} und \Programm{pdflatex} tun dies nur für
 543 \texttt{swissgerman}.
 544
 545 Für die übrigen fünf Varietäten laden \Programm{latex} und
 546 \Programm{pdflatex} hingegen aus Gründen der Abwärtskompatibilität
 547 standardmäßig die herkömmlichen Trennmuster.  Um stattdessen die
 548 experimentellen Trennmuster zu aktivieren, sind für die reformierte
 549 Rechtschreibung folgende Zeilen in die Präambel des Dokuments
 550 aufzunehmen.
 551
 552 \begin{lstlisting}[style=LaTeX]
 553   \usepackage[T1]{fontenc}
 554   \usepackage[ngerman]{babel}
 555   \babelprovide[hyphenrules=ngerman-x-latest]{ngerman}
 556 \end{lstlisting}
 557
 558 Für die österreichische Varietät:
 559
 560 \begin{lstlisting}[style=LaTeX]
 561   \usepackage[T1]{fontenc}
 562   \usepackage[naustrian]{babel}
 563   \babelprovide[hyphenrules=ngerman-x-latest]{naustrian}
 564 \end{lstlisting}
 565
 566 Auf entsprechende Weise ist es mit allen \hologo{LaTeX}"=Compilern
 567 möglich, eine alternative, manuell installierte Trennmusterversion zu
 568 aktivieren:
 569
 570 \begin{lstlisting}[style=LaTeX]
 571   \usepackage[T1]{fontenc}
 572   \usepackage[ngerman]{babel}
 573   \babelprovide[hyphenrules=ngerman-x-<datum>]{ngerman}
 574 \end{lstlisting}
 575
 576 Der Befehl \verb+\babelprovide+ erlaubt auch innerhalb eines Dokuments
 577 das mehrfache Umschalten der Trennmuster.
 578
 579 \subsubsection{\hologo{XeLaTeX}/\hologo{LuaLaTeX} mit dem
 580   Sprachenpaket \Paket{Polyglossia}}
 581 \label{subsubsec:LaTeX+PolyGlossia}
 582
 583 Für \hologo{XeLaTeX} und \hologo{LuaLaTeX} steht als Alternative zu
 584 \Paket{Babel} das Paket
 585 \Paket{Polyglossia}\footnote{\url{https://ctan.org/pkg/polyglossia}}
 586 zur Verfügung.  Mit den Zeilen
 587
 588 \begin{lstlisting}[style=LaTeX]
 589   \usepackage{polyglossia}
 590   \setmainlanguage{german}
 591 \end{lstlisting}
 592
 593 \noindent in der Präambel werden die mit dem Paket \Paket{hyph-utf8}
 594 installierten Trennmuster für die \emph{reformierte} Rechtschreibung
 595 geladen.  Mit den Optionen \texttt{variant=""austrian},
 596 \texttt{variant=""swiss} und \texttt{spelling=""old} können wahlweise
 597 die österreichische Varietät, die Schweizer Varietät sowie die
 598 traditionelle Rechtschreibung gewählt werden, beispielsweise:
 599
 600 \begin{lstlisting}[style=LaTeX]
 601   \usepackage{polyglossia}
 602   \setmainlanguage[variant=swiss, spelling=old]{german}
 603 \end{lstlisting}
 604
 605 Um Trennhilfen wie \verb+""+, \verb+"ff+ oder \verb+"ck+ verwenden zu
 606 können, muss zusätzlich die Option \texttt{babelshorthands=""true}
 607 gesetzt werden.
 608
 609 Mit \hologo{XeLaTeX} ist es außerdem möglich, manuell installierte
 610 statt der voreingestellten Trennmuster zu verwenden.  Hierzu kommt das
 611 Paket \Paket{hyphsubst} wie folgt zum Einsatz.  Für die reformierte
 612 Rechtschreibung:
 613
 614 \begin{lstlisting}[style=LaTeX]
 615   \usepackage{polyglossia}
 616   \setmainlanguage{german} % ggf. variant=austrian/swiss
 617   \usepackage[ngerman=ngerman-x-<datum>]{hyphsubst}
 618 \end{lstlisting}
 619
 620 Für die traditionelle Rechtschreibung in Deutschland und Österreich:
 621
 622 \begin{lstlisting}[style=LaTeX]
 623   \usepackage{polyglossia}
 624   \setmainlanguage[spelling=old]{german} % ggf. variant=austrian
 625   \usepackage[german=german-x-<datum>]{hyphsubst}
 626 \end{lstlisting}
 627
 628 Für die traditionelle Rechtschreibung in der Schweiz:
 629
 630 \begin{lstlisting}[style=LaTeX]
 631   \usepackage{polyglossia}
 632   \setmainlanguage[variant=swiss, spelling=old]{german}
 633   \usepackage[swissgerman=gswiss-x-<datum>]{hyphsubst}
 634 \end{lstlisting}
 635
 636 Mit \hologo{LuaLaTeX} in Verbindung mit \Paket{Polyglossia} ist das
 637 Ersetzen der Trennmuster auf diese Weise nicht möglich.
 638
 639 \subsubsection{p\TeX/up\TeX}
 640
 641 Die in Japan gebräuchlichen \hologo{TeX}"=Varianten p\TeX{} und
 642 up\TeX{} verwenden für deutschsprachige Texte die experimentellen
 643 Trennmuster, die mit dem Paket \Paket{hyph-utf8} installiert sind.
 644
 645 \subsubsection{\hologo{ConTeXt}}
 646
 647 \hologo{ConTeXt} besitzt eigene Trennmusterdateien.  Die Trennmuster
 648 werden aus dem Paket \Paket{hyph-utf8} übernommen; Unterstützung für
 649 die traditionelle deutsche Rechtschreibung in der Schweiz fehlt
 650 allerdings zur Zeit.
 651
 652 Siehe \autoref{sec:fragen} für Hinweise, wie die Version der
 653 \hologo{ConTeXt}-Trennmuster bestimmt werden kann.
 654
 655 \section{Trennregeln und Konventionen}
 656 \label{sec:trennregeln}
 657
 658 Die Trennmuster für die traditionelle Rechtschreibung in Deutschland
 659 und Österreich orientieren sich an den verbindlichen Regeln des Dudens
 660 in der Fassung von 1991~\cite{duden:1991}.  Dasselbe gilt für die
 661 Trennmuster für die traditionelle Rechtschreibung in der Schweiz,
 662 jedoch mit einer unten beschriebenen Abweichung.  Die Trennmuster für
 663 die reformierte Rechtschreibung orientieren sich an den amtlichen
 664 Regeln für die Rechtschreibung der deutschen Sprache in der Fassung
 665 von 2006~\cite{amtlRegeln:2006, amtlRegeln:2006:duden}.
 666
 667 Die Regeln lassen gewisse Freiheiten bei der Schreibung und Trennung
 668 von Wörtern zu.  Da sich solche Freiheiten nicht ohne weiteres auf die
 669 maschinelle Worttrennung übertragen lassen, wurden die im folgenden
 670 beschriebenen Konventionen getroffen.  Hauptsächlich betreffen diese
 671 die reformierte Rechtschreibung, die zusätzliche Freiheiten eingeführt
 672 hat.\footnote{%
 673   Im Ergebnis weicht in reformierter Rechtschreibung die Trennung zum
 674   Beispiel des Dudens (nach Sprechsilben) von der Trennung mit diesen
 675   Trennmustern (bevorzugt etymologisch) ab, siehe auch
 676   \regelref{enum:reformEtymo} und \regelref{enum:reformClusterLR}
 677   sowie \autoref{sec:fragen}.}  Beziehen sich die Konventionen für die
 678 reformierte Rechtschreibung auf die traditionelle Rechtschreibung, so
 679 werden die entsprechenden Regeln etwas ausführlicher dargestellt.  Die
 680 folgenden Abschnitte enthalten jedoch keine vollständige Aufstellung
 681 der Silbentrennregeln.  Diese sind den entsprechenden Regelwerken zu
 682 entnehmen.  Es folgen zunächst einige allgemeine Hinweise:
 683
 684 \begin{itemize}
 685
 686 \item In Liangs Trennalgorithmus werden Groß- und Kleinschreibung
 687   nicht unterschieden~\cite{liang:1983}.  Die Schreibweisen
 688   \emph{Nachtritt} und \emph{nachtritt} werden aus Sicht des
 689   Trennalgorithmus gleich behandelt (siehe auch
 690   \regelref{enum:tradDoppeld} und \regelref{enum:reformDoppeld}).
 691
 692 \item Die von einem Programm aus diesen Mustern abgeleiteten möglichen
 693   Trennstellen können (u.\,a. durch Programmfehler) durchaus von denen
 694   der zugrundeliegenden Wortliste abweichen.  So führt zum Beispiel
 695   die Eingabe \lstinline[style=LaTeX]+Meta"llegierung+
 696   (Dreikonsonantenregel in der traditionellen Rechtschreibung) mit dem
 697   Paket \Paket{Babel} zu den in \autoref{tab:trennung-dreik} gezeigten
 698   Trennmöglichkeiten.
 699
 700   \begin{table}
 701     \centering
 702     \caption{Unterschiedlich ermittelte Trennmöglichkeiten.}
 703     \label{tab:trennung-dreik}
 704     \begin{tabular}{ll}
 705       Quelle & Trennmöglichkeiten\\
 706       \addlinespace
 707       \toprule
 708       \addlinespace
 709       \hologo{pdfLaTeX} mit \Paket{Babel}~3.8 & Me-tall(-l)egierung\\
 710       \hologo{pdfLaTeX} mit \Paket{Babel}~3.9 & Me-tall(-l)e-gie-rung\\
 711       erwünscht \emph{(vgl. \regelref{enum:tradnstd})} & Me-tall(-l)egie-rung\\
 712     \end{tabular}
 713   \end{table}
 714
 715 \item Die von \hologo{TeX} gewählte Trennung kann in Einzelfällen mit
 716   den \hologo{TeX}- und \Paket{Babel}"=Kürzeln
 717   \lstinline[style=LaTeX]+\-+ und \lstinline[style=LaTeX]+"-+ geändert
 718   werden.  Für dokumentweite Änderungen der Trennung eignet sich das
 719   Kommando \lstinline[style=LaTeX]+\hyphenation+.
 720
 721 \item Die Datei \Datei{CHANGES} beschreibt bekannte, systematische
 722   Fehler der Trennmuster.
 723
 724 \item In den Beispielen zeigt die linke (grüne) Spalte jeweils die
 725   Trennung mit den experimentellen Trennmustern, die rechten (roten)
 726   Spalten zeigen alternative oder unerwünschte Trennungen.
 727
 728 \end{itemize}
 729
 730 \subsection{Traditionelle Rechtschreibung in Deutschland und
 731   Österreich}
 732 \label{sec:tradRS}
 733
 734 \begin{enumerate}[\hspace{1em}\itshape{T}1]
 735 \labelformat{enumi}{\textit{T#1}}
 736
 737 \item\label{enum:tradhyphenmin} Die minimale unterstützte Silbenlänge
 738   am Wortanfang und "~ende beträgt zwei Buchstaben
 739   \cite[R~178]{duden:1991}.
 740
 741   Siehe \autoref{sec:fragen} für Hinweise, wie sich diese Länge
 742   abweichend einstellen lässt.  Wird die Mindestlänge auf weniger als
 743   zwei Buchstaben verringert, so können fehlerhafte Trennungen
 744   auftreten.
 745
 746 \item\label{enum:tradSinn} Sinnentstellende und irreführende
 747   Trennungen werden möglichst vermieden \cite[R~181]{duden:1991}
 748   (siehe auch \regelref{enum:tradnstd}):
 749
 750   \begin{tabular}[t]{TU}
 751     An-alpha-bet & Anal-phabet\\
 752     Kaf-ka-kenner & Kafkaken-ner\\
 753     Tal-entwäs-se-rung & Talent-wässerung\\
 754   \end{tabular}
 755
 756   Beachte, dass derzeit die Unterdrückung von solchen Trennstellen bis
 757   zu einem gewissen Grade willkürlich und subjektiv ist.  Außerdem ist
 758   die Erfassung weit davon entfernt, vollständig zu sein.  Um diesen
 759   Problemen abzuhelfen, ist für zukünftige Versionen der Trennmuster
 760   ein anderer, automatisierter Ansatz geplant, welcher die Anzahl
 761   manuell zu erfassender Fälle sehr stark reduzieren wird.
 762
 763 \item\label{enum:tradDoppeld} In mehrdeutigen Wörtern werden
 764   Trennungen nur an übereinstimmenden Trennstellen zugelassen.
 765
 766   \begin{tabular}[t]{TUU}
 767     nachtritt & nach-tritt & Nacht-ritt\\
 768     Wachstu-be & Wach-stube & Wachs-tube\\
 769     Druckerzeug-nis & Druck-erzeugnis & Drucker-zeugnis\\
 770     Mu-sikerle-ben & Musik-erleben & Musi-ker-leben\\
 771     Fuß-balleh-re & Fußball-ehre & Fußball-lehre\\
 772   \end{tabular}
 773
 774   Beachte, die Trennstellen »Drucker-zeugnis« und »Musiker-leben«
 775   sind in den Interpretationen \emph{Druck-Erzeugnis} und
 776   \emph{Musik-Erleben} irreführend.  Sie entfallen nach
 777   \regelref{enum:tradSinn} und sind nicht als übereinstimmende
 778   Trennstellen anzusehen.  Zur Spezialtrennung »Fußball-lehre« siehe
 779   auch \regelref{enum:tradnstd}.
 780
 781   Für diese Regel gelten die folgenden Einschränkungen:
 782
 783   \begin{itemize}
 784
 785   \item Bei mehrdeutigen Wörtern endend auf \emph{"~ende},
 786     \emph{"~enden}, \emph{"~endes} wird stets die Trennung der
 787     Partizipform des Verbs verwendet.
 788
 789     \begin{tabular}[t]{TUU}
 790       fu-ßen-de & Fuß-ende & fußende\\
 791       spie-len-de & Spiel-ende & spielende
 792     \end{tabular}
 793
 794   \item Mehrdeutigkeiten, die durch die Ersatzschreibweise von Wörtern
 795     mit~\emph{ß} auftreten, werden nicht berücksichtigt (vergleiche
 796     \regelref{enum:tradEszett}).
 797
 798     \begin{tabular}[t]{TUU}
 799       Mas-se & \textls{M\kern-.4ptA-SSE} & \textls{M\kern-.4ptA\kern-.6ptSSE}
 800     \end{tabular}
 801
 802   \end{itemize}
 803
 804 \item\label{enum:tradEszett} Wird der Buchstabe~\emph{ß} durch
 805   \emph{ss/SS} ersetzt, so bleibt die Trennung davon unberührt
 806   \cite[R~179]{duden:1991}:
 807
 808   \begin{tabular}[t]{T}
 809     \textls{GRÖSS-TE}\\
 810     \textls{GRÜ-SSE}\\
 811     \textls{M\kern-.4ptA\kern-.4pt-SSES}\\
 812   \end{tabular}
 813
 814   Für diese Regel gilt die folgende Einschränkung:
 815   \begin{itemize}
 816
 817   \item Wenn durch den Ersatz von~\emph{ß} an dieser Stelle keine
 818     eindeutige Trennung möglich ist, so wird zugunsten der Bedeutung
 819     des Wortes in der normalen Schreibweise getrennt (siehe auch
 820     \regelref{enum:tradDoppeld}).
 821
 822     \begin{tabular}[t]{TTU}
 823       \textls{FLÖS-SE} & (wegen flös-se) & \textls{FLÖ-SSE}\\
 824       \textls{MAS-SE} & (wegen Mas-se) & \textls{MA-SSE}\\
 825     \end{tabular}
 826
 827     Beachte:
 828     \begin{itemize}
 829
 830     \item Wird \emph{ß} mit \lstinline[style=LaTeX]+\MakeUppercase+
 831       durch~\emph{SS} ersetzt, so bleibt \emph{SS} stets ungetrennt.
 832       Die Trennung richtet sich dann nach der Schreibweise
 833       mit~\emph{ß} im Quelldokument.
 834
 835     \item Existiert ein Wort in verschiedenen Varietäten in der
 836       Schreibweise mit~\emph{ß} und mit~\emph{ss}, so wird aufgrund
 837       dieser Einschränkung \emph{s-s} stets getrennt:
 838
 839       \begin{tabular}[t]{TTUU}
 840         Ge-scho-ße  & (AT)\\
 841         Ge-schos-se & (D) & \textls{GESCHO-SSE} & (AT)\\
 842       \end{tabular}
 843
 844     \item Wenn durch den Ersatz des~\emph{ß} an entfernten Stellen
 845       keine eindeutige Trennung möglich wird, zum Beispiel an
 846       Wortfugen, so werden die betroffenen Trennungen gemäß
 847       \regelref{enum:tradDoppeld} unterdrückt.  In der Folge wird
 848       gegebenenfalls auch die Trennung von \emph{ss/SS} unterdrückt.
 849
 850       \begin{tabular}[t]{TU}
 851         \textls{BAHN-HOFSTRASSE} & \textls{BAHNHOF-STRA-SSE}\\
 852                                  & \textls{BAHNHOFS-TRAS-SE}\\
 853       \end{tabular}
 854
 855     \end{itemize}
 856
 857   \end{itemize}
 858
 859 \item\label{enum:tradOW} In Ableitungen von Namen auf \emph{"~ow} wird
 860   die Nottrennung der Ableitungssilben \emph{"~er}, \emph{"~ern},
 861   \emph{"~ers} unterdrückt \cite[R~180]{duden:1991}:
 862
 863   \begin{tabular}[t]{TU}
 864     Tel-tower & Teltow-er\\
 865     Trep-towern & Treptow-ern\\
 866     Pan-kowers & Pankow-ers\\
 867   \end{tabular}
 868
 869 \item\label{enum:tradnstd} Spezialtrennungen (\emph{engl.:}
 870   non-standard hyphenation), die nach Regeln erfolgen, die über das
 871   bloße Einfügen eines Trennstrichs hinausgehen, wie die \emph{ck}"~
 872   oder die Dreikonsonantenregel, kann \hologo{TeX} nicht automatisch
 873   behandeln.  Aus diesem Grund sind solche Trennstellen in diesen
 874   Trennmustern nicht berücksichtigt.
 875
 876   \begin{tabular}[t]{lTUU}
 877     \lstinline[style=LaTeX]+drucken+ & drucken & druk-ken\\
 878     \lstinline[style=LaTeX]+Zuckerbäcker+ & Zucker-bäcker & Zuk-kerbäk-ker\\
 879     \lstinline[style=LaTeX]+Brennessel+ & Brennes-sel & Brenn-nessel\\
 880     \lstinline[style=LaTeX]+Stoffetzen+ & Stoffet-zen & Stoff-fetzen\\
 881   \end{tabular}
 882
 883   Die Dreikonsonantenregel birgt aufgrund des ausgefallenen
 884   Konsonanten die Gefahr irreführender und sinnentstellender
 885   Trennungen (siehe auch \regelref{enum:tradSinn}).  Trennstellen, die
 886   in einem Abstand von zwei Lauten auf eine Wortfuge mit Anwendung der
 887   Dreikonsonantenregel folgen, werden daher grundsätzlich unterdrückt.
 888
 889   \begin{tabular}[t]{lTUU}
 890     \lstinline[style=LaTeX]+Metallegierung+ & Me-tallegie-rung & Metall-legierung & Metalle-gierung\\
 891     \lstinline[style=LaTeX]+schnellebige+ & schnellebi-ge & schnell-lebige & schnelle-bige\\
 892     \lstinline[style=LaTeX]+Stilleben+ & Stilleben & Still-leben & Stille-ben\\
 893   \end{tabular}
 894   \par\nobreak
 895   \textit{auch:}
 896
 897   \begin{tabular}[t]{lTUU}
 898     \lstinline[style=LaTeX]+Abfallager+ & Ab-fallager & Abfall-lager & Abfalla-ger\\
 899     \lstinline[style=LaTeX]+Zellstoffabrik+ & Zell-stoffabrik & Zellstoff-fabrik & Zellstoffa-brik\\
 900   \end{tabular}
 901
 902   Das Paket \Paket{Babel} stellt verschiedene Kürzel zur Verfügung,
 903   u.\,a. \lstinline[style=LaTeX]+"ck+%
 904   \footnote{Spezialtrennungen werden in \hologo{TeX} mit Hilfe des
 905     Kommandos \lstinline[style=LaTeX]+\\discretionary+ kodiert.  So
 906     wird zum Beispiel das \Paket{Babel}-Kürzel
 907     \lstinline[style=LaTeX]+\"ck+ in der Eingabe während der
 908     Kompilation durch
 909     \lstinline[style=LaTeX]+\\discretionary\{k-\}\{k\}\{ck\}+ ersetzt,
 910     wodurch \emph{k-k}-Trennungen möglich werden.}
 911 %
 912   oder \lstinline[style=LaTeX]+"ff+ \emph{etc.}, mit denen
 913   Spezialtrennungen im Quelldokument ausgezeichnet werden können
 914   (siehe auch \autoref{tab:trennung-dreik}).  Das Alternativpaket
 915   \Paket{Polyglossia} stellt diese Kürzel ebenfalls zur Verfügung,
 916   falls beim Laden der deutschen Sprache (in der Regel mit dem Befehl
 917   \lstinline[style=LaTeX]+\setmainlanguage+) die Option
 918   \lstinline[style=LaTeX]+babelshorthands=true+ angegeben wird.
 919
 920   \hologo{LuaTeX}%
 921   \footnote{\url{http://www.luatex.org/}}
 922 %
 923   soll in einer zukünftigen Version Mechanismen zur automatischen
 924   Behandlung von Spezialtrennungen bereitstellen.  Eine physische
 925   Auszeichnung im Quelltext ist dann nicht mehr erforderlich.  Die
 926   entsprechenden Spezialtrennmuster für die deutsche Sprache werden
 927   ebenfalls im Rahmen dieses Projekts erstellt.
 928
 929 \end{enumerate}
 930
 931 \subsection{Traditionelle Rechtschreibung in der Schweiz}
 932 \label{sec:tradchRS}
 933
 934 Die Trennmuster für die traditionelle Rechtschreibung in der Schweiz
 935 folgen weitgehend den Konventionen für die traditionelle
 936 Rechtschreibung in Deutschland (siehe \autoref{sec:tradRS}).  Die
 937 folgende Liste enthält daher nur Fälle, in denen davon abgewichen wird
 938 oder deren Beschreibung aus anderen Gründen sinnvoll erscheint.
 939
 940 \begin{enumerate}[\hspace{1em}\itshape{TS}1]
 941 \labelformat{enumi}{\textit{TS#1}}
 942
 943 \item\label{enum:tradchEszett} Wörter mit \emph{ß} werden gemäß den
 944   Regeln für die traditionelle Rechtschreibung in Deutschland
 945   getrennt.
 946
 947 \item\label{enum:tradchSS} Abweichend von \regelref{enum:tradEszett}
 948   wird \emph{ss/SS} immer als Doppelkonsonant behandelt und
 949   gegebenenfalls getrennt:
 950
 951   \begin{tabular}[t]{T}
 952     grös-ste\\
 953     Grüs-se\\
 954     Mas-ses\\
 955   \end{tabular}
 956
 957   Beachte, wird \emph{ß} jedoch mit
 958   \lstinline[style=LaTeX]+\MakeUppercase+ durch~\emph{SS} ersetzt, so
 959   bleibt~\emph{SS} stets ungetrennt.  Die Trennung richtet sich dann
 960   nach der Schreibweise mit~\emph{ß} im Quelldokument (siehe
 961   \regelref{enum:tradchEszett}).
 962
 963 \end{enumerate}
 964
 965 \subsection{Reformierte Rechtschreibung}
 966 \label{sec:reformRS}
 967
 968 \begin{enumerate}[\hspace{1em}\itshape{R}1]
 969 \labelformat{enumi}{\textit{R#1}}
 970
 971 \item\label{enum:reformhyphenmin} Die minimale unterstützte Silbenlänge
 972   am Wortanfang und "~ende beträgt zwei Buchstaben
 973   \cite[\S~107]{amtlRegeln:2006, amtlRegeln:2006:duden}.
 974
 975   Siehe \autoref{sec:fragen} für Hinweise, wie sich diese Länge
 976   abweichend einstellen lässt.  Wird die Mindestlänge auf weniger als
 977   zwei Buchstaben verringert, so können fehlerhafte Trennungen
 978   auftreten.
 979
 980 \item\label{enum:reformEtymo} Falls die Trennung nach Sprechsilben und
 981   die etymologische (sprachgeschichtliche) Trennung kollidieren, wird
 982   weitgehend die etymologische Trennung gewählt
 983   \cite[\S~113]{amtlRegeln:2006, amtlRegeln:2006:duden}:
 984
 985   \begin{tabular}[t]{RUU}
 986 %    Heli-ko-pter & Helikop-ter\\
 987 %    in-ter-view-en & intervie-wen\\
 988     in-ter-es-sant & inte-ressant\\
 989     Lin-ole-um & Li-noleum & Lino-leum\\
 990     Päd-ago-ge & Pä-dagoge & Päda-goge\\
 991   \end{tabular}
 992
 993 \item\label{enum:reformClusterLR} In Fremdwörtern bleiben die
 994   Buchstabengruppen \emph{bl}, \emph{pl}, \emph{fl}, \emph{gl},
 995   \emph{cl}, \emph{kl}, \emph{phl}; \emph{br}, \emph{pr}, \emph{dr},
 996   \emph{tr}, \emph{fr}, \emph{vr}, \emph{gr}, \emph{cr}, \emph{kr},
 997   \emph{phr}, \emph{thr}; \emph{chth}; \emph{gn}, \emph{kn} im
 998   allgemeinen ungetrennt, nicht jedoch \emph{str}
 999   \cite[\S~112]{amtlRegeln:2006, amtlRegeln:2006:duden}
1000   i.\,V.\,m.~\cite[R~179]{duden:1991}:
1001
1002   \begin{tabular}[t]{RU}
1003     Ar-thri-tis & Arth-ritis\\
1004 %    Co-gnac & Cog-nac\\
1005     Di-plom & Dip-lom\\
1006 %    Fe-bru-ar & Feb-ruar\\
1007     igno-rie-re & ig-noriere\\
1008     In-te-gral & Integ-ral\\
1009   \end{tabular}
1010   \par\nobreak
1011   \textit{aber:}
1012
1013   \begin{tabular}[t]{RUU}
1014     In-dus-trie & Indu-strie & Indust-rie\\
1015 %    Ma-gis-tra-le & Magi-strale\\
1016     de-struk-tiv\\
1017     sub-lim\\
1018   \end{tabular}
1019
1020 \item\label{enum:reformSinn} Sinnentstellende und irreführende
1021   Trennungen werden möglichst vermieden \cite[\S~107]{amtlRegeln:2006,
1022     amtlRegeln:2006:duden}:
1023
1024   \begin{tabular}[t]{RU}
1025     An-alpha-bet & Anal-phabet\\
1026     Kaf-ka-kenner & Kafkaken-ner\\
1027     Tal-entwäs-se-rung & Talent-wässerung\\
1028   \end{tabular}
1029
1030 \item\label{enum:reformDoppeld} In mehrdeutigen Wörtern werden
1031   Trennungen nur an übereinstimmenden Trennstellen zugelassen:
1032
1033   % Das »@{}« entfernt den rechten Rand der Tabelle und verhindert
1034   % so eine »overfull«-Warnung.
1035   \begin{tabular}[t]{RUUU@{}}
1036     Druckerzeug-nis & Dru-ckerzeugnis & Druck-erzeugnis &
1037     Drucker-zeugnis\\
1038     Mu-sikerle-ben & Musi-kerleben & Musik-erleben & Musiker-leben\\
1039     nachtritt & nach-tritt & Nacht-ritt\\
1040     Wachstu-be & Wach-stube & Wachs-tube\\
1041   \end{tabular}
1042
1043   Beachte, die Trennstellen »Drucker-zeugnis« und »Musiker-leben«
1044   sind in den Interpretationen \emph{Druck-Erzeugnis} und
1045   \emph{Musik-Erleben} irreführend.  Sie entfallen nach
1046   \regelref{enum:reformSinn} und sind nicht als übereinstimmende
1047   Trennstellen anzusehen.
1048
1049   Für diese Regel gilt die folgende Einschränkung:
1050
1051   \begin{itemize}
1052
1053   \item Bei mehrdeutigen Wörtern endend auf \emph{"~ende},
1054     \emph{"~enden}, \emph{"~endes} wird stets die Trennung der
1055     Partizipform des Verbs verwendet.
1056
1057     \begin{tabular}[t]{RUU}
1058       fu-ßen-de & Fuß-ende & fußende\\
1059       spie-len-de & Spiel-ende & spielende
1060     \end{tabular}
1061
1062   \end{itemize}
1063
1064 \item\label{enum:reformEszett} Wird der Buchstabe~\emph{ß} durch
1065   \emph{ss/SS} ersetzt, so wird \emph{s"~s} getrennt \cite[\S\S~25~E3,
1066   110]{amtlRegeln:2006, amtlRegeln:2006:duden}:
1067
1068   \begin{tabular}[t]{R}
1069     \textls{GRÖS-STE}\\
1070     \textls{GRÜS-SE}\\
1071     \textls{M\kern-.4ptA\kern-.6ptS-SES}\\
1072   \end{tabular}
1073
1074   Wird~\emph{ß} mit \lstinline[style=LaTeX]+\MakeUppercase+ oder in
1075   Kapitälchen in~\emph{SS} gewandelt, so bleibt~\emph{SS} ungetrennt.
1076   Dies ist kein Fehler in den Trennmustern, sondern im
1077   \hologo{LaTeX}-Kern fest implementiert.
1078
1079 % \item\label{enum:reformOW} In Ableitungen von Namen auf \emph{"~ow}
1080 %   bleibt \emph{"~ow} ungetrennt, wenn es den Laut [o\,:] bezeichnet.
1081 %   Die Nottrennung der Ableitungssilben \emph{"~er}, \emph{"~ern},
1082 %   \emph{"~ers} wird unterdrückt \cite[\S~113]{amtlRegeln:2006,
1083 %     amtlRegeln:2006:duden}
1084 %   i.\,V.\,m.~\cite[R~180]{duden:1991}:
1085
1086 %   \begin{tabular}[t]{RUU}
1087 %     Tel-tower & Telto-wer & Teltow-er\\
1088 %     Trep-towern & Trepto-wern & Treptow-ern\\
1089 %     Pan-kowers & Panko-wers & Pankow-ers\\
1090 %   \end{tabular}
1091
1092 \end{enumerate}
1093
1094
1095 \section{Trennfehler}
1096 \label{sec:trennfehler}
1097
1098 Mit den vorliegenden Trennmustern können sämtliche Wörter der
1099 zugrundeliegenden Wortliste fehlerfrei getrennt werden.  Technisch
1100 gesprochen endet der letzte \Programm{patgen}-Lauf mit der Meldung
1101
1102 \begin{lstlisting}[style=shell]
1103   1783028 good, 0 bad, 0 missed
1104   100.00 %, 0.00 %, 0.00 %
1105 \end{lstlisting}
1106
1107 \noindent (der Wert vor \lstinline[style=shell]+good+ ist vom
1108 Listenumfang abhängig).  Trotz des großen Umfangs der Wortliste lassen
1109 sich Trennfehler in Wörtern, die nicht in der Liste enthalten sind,
1110 nicht vermeiden.  Der Umfang der Wortliste kann allerdings nicht
1111 beliebig erweitert werden.%
1112 \footnote{Liangs Schema sieht nur einen begrenzten Bereich für die
1113   Trennstellenbewertungen vor (0--9).  Die derzeitigen Trennmuster
1114   vewenden Bewertungen bis zur Höhe~7.}
1115 %
1116 In den folgenden Fällen sollten fehlerhafte Trennungen der Trennmuster
1117 jedoch gemeldet werden:
1118
1119 \begin{enumerate}[\hspace{1em}A.]
1120
1121 \item\label{enum:kritWLfehlerhaft} Das Wort ist bereits in der
1122   Wortliste enthalten.  Der Eintrag ist jedoch fehlerhaft.
1123
1124 \end{enumerate}
1125
1126 Falls das Wort nicht in der Wortliste enthalten ist, bestehen sehr
1127 gute Chancen, dass es aufgenommen wird, wenn eines der folgenden
1128 Kriterien erfüllt ist:
1129
1130 \begin{enumerate}[\hspace{1em}A.]
1131   \refstepcounter{enumi}% Fortsetzung der obigen Aufzählung.
1132
1133 \item\label{enum:kritHerkTM} Das betreffende Wort wird mit den
1134   \emph{herkömmlichen} Trennmustern für die traditionelle oder
1135   reformierte Rechtschreibung korrekt getrennt.  Korrekt bedeutet
1136   hier: Nicht alle möglichen Trennstellen müssen erkannt werden; es
1137   werden jedoch in keinem Fall falsche Trennstellen ermittelt.  Zum
1138   Testen kann in \TeX\ der folgende Aufruf verwendet werden (die
1139   Ausgabe erfolgt in der \texttt{log}-Datei):
1140
1141 \begin{lstlisting}[style=LaTeX]
1142   \showhyphens{durch Leerzeichen getrennte Wörter}
1143 \end{lstlisting}
1144
1145 \item\label{enum:kritSinn} Es handelt es sich um eine orthographisch
1146   richtige, aber sinnentstellende oder irreführende Trennung.
1147   Berücksichtigt werden allerdings nur Wörter, die aus höchstens zwei
1148   (gegebenenfalls prä- und suffigierten) Wörtern zusammengesetzt sind,
1149   zum Beispiel »Talent-wässerung«.  Nicht berücksichtigt wird
1150   hingegen die »Talent-wässerungsanlage«.
1151
1152 \end{enumerate}
1153
1154 Einige bekannte Fehler in den Trennmustern sind in der Datei
1155 \Datei{CHANGES} verzeichnet.  Noch nicht bekannte falsche, fehlende
1156 und unerwünschte Worttrennungen können an die E-Mail-Adresse
1157 \href{mailto:trennmuster@dante.de}{trennmuster@dante.de} gerichtet
1158 werden.
1159
1160 Trennfehler, die in den Trennmustern nicht korrigiert werden können,
1161 können mit Hilfe einer privaten Ausnahmeliste behandelt werden:
1162
1163 \begin{lstlisting}[style=LaTeX]
1164   \hyphenation{Tal-entwäs-se-rungs-an-la-ge Kaf-ka-kenner-klub}
1165 \end{lstlisting}
1166
1167 Die aktuelle und ältere Ausgaben der Trennmuster sind im Dateibereich
1168 des Trennmuster-Wikis erhältlich.%
1169 \footnote{\url{https://projekte.dante.de/Trennmuster}}
1170 %
1171 Im Entwicklerrepositorium\footnote{%
1172   siehe \url{https://projekte.dante.de/Trennmuster/Entwickler}}
1173 befindet sich ein Makefile, mit dem jederzeit neue Trennmuster erzeugt
1174 werden können.
1175
1176 \nobreak
1177 \noindent\parbox{\linewidth}{%
1178   \vspace*{\baselineskip}
1179   \raggedright
1180   \itshape
1181   Happy \TeX ing!\newline
1182   Die deutschsprachige Trennmustermannschaft
1183 }
1184
1185
1186 \begingroup
1187   \RaggedRight
1188   \bibliography{dehyph-exptl}
1189 \endgroup
1190
1191
1192 \appendix
1193 \section{Dateien und Installation}
1194 \label{sec:installation}
1195
1196 Die eigentlichen Trennmusterdateien liegen in \Abk{utf-8}"=Kodierung
1197 vor (siehe \autoref{tab:dateien}, Endung \texttt{.pat}).  Sie werden
1198 von \hologo{TeX} nicht direkt geladen, sondern durch Manteldateien,
1199 die ebenfalls Teil des Pakets sind (Endung \texttt{.tex}).  Wird eine
1200 8-Bit-fähige \hologo{TeX}"=Variante erkannt, übernehmen diese
1201 Manteldateien die Konvertierung der Trennmuster in die
1202 \Abk{t1}-Kodierung.
1203
1204 \begin{table}
1205   \centering
1206   \caption{Trennmuster- und Manteldateien}
1207   \label{tab:dateien}
1208   \begin{tabular}{l>{\ttfamily}l>{\ttfamily}l}
1209     Rechtschreibung & \normalfont Trennmusterdatei & \normalfont Manteldatei\\
1210     \addlinespace\toprule\addlinespace
1211     traditionell & dehypht-x-<datum>.pat & dehypht-x-<datum>.tex\\
1212     traditionell (Schweiz) & dehyphts-x-<datum>.pat & dehyphts-x-<datum>.tex\\
1213     reformiert & dehyphn-x-<datum>.pat & dehyphn-x-<datum>.tex\\
1214   \end{tabular}
1215 \end{table}
1216
1217 Bei der Installation werden die Manteldateien an die in
1218 \autoref{tab:varietaeten} gezeigten Trennmusterbezeichner gebunden.
1219 Diese Schritte werden für verschiedene \hologo{TeX}"=Verteilungen in
1220 der Datei \Datei{INSTALL} beschrieben.  Nach der Installation können
1221 die experimentellen Trennmuster wie in \autoref{sec:aktivieren}
1222 gezeigt verwendet werden.
1223
1224
1225 \section{Fragen \& Antworten}
1226 \label{sec:fragen}
1227
1228 \newcommand*{\fragefont}{\itshape}
1229 \newcommand*{\themenfont}{\large\normalfont}
1230 \newcounter{cntfrage}% Zähler für Fragen.
1231 \newcounter{thema}% Zähler für Themenüberschriften.
1232 \renewcommand*{\thethema}{\Roman{thema}.}
1233 \newcounter{frage}% Zähler für Fragen.
1234 \renewcommand*{\thefrage}{\arabic{frage}.}
1235 \newboolean{nextfrage}
1236
1237 \makeatletter
1238
1239 %%% Neue zref-Liste frage = (type, text, anchor).
1240 \zref@newlist{frage}
1241 \zref@newprop{type}{f}
1242 \zref@newprop{text}{??}
1243 \zref@addprop{frage}{type}
1244 \zref@addprop{frage}{text}
1245 \zref@addprop{frage}{anchor}
1246
1247 %%% Fügt eine neue Themenüberschrift ein.
1248 \newcommand*{\fragenthema}[1]{%
1249   \par
1250   \pagebreak[1]
1251   \vspace{1.5\baselineskip plus .6\baselineskip minus .6\baselineskip}
1252   \refstepcounter{cntfrage}
1253   \stepcounter{thema}
1254   \zref@setcurrent{type}{t}
1255   \zref@setcurrent{text}{\thethema~#1}
1256   \zref@labelbylist{frage:\thecntfrage}{frage}
1257   \noindent{\themenfont\thethema~#1\par}
1258 }
1259
1260 %%% Umgebung für eine Frage mit Antwort.
1261 \newenvironment{frageantwort}[1]{%
1262   \par
1263   \vspace{.25\baselineskip plus .1\baselineskip minus .1\baselineskip}
1264   \refstepcounter{cntfrage}
1265   \stepcounter{frage}
1266   % bei Aufzählungen innerhalb einer Frage römisch nummerieren
1267   \renewcommand{\labelenumi}{\roman{enumi}.}
1268   \zref@setcurrent{type}{f}
1269   \zref@setcurrent{text}{\thefrage~#1}
1270   \zref@labelbylist{frage:\thecntfrage}{frage}
1271   \noindent{\fragefont\thefrage~#1\par}
1272   \nobreak\noindent\ignorespaces
1273 }{%
1274   \vspace{.25\baselineskip plus .1\baselineskip minus .1\baselineskip}
1275 }
1276
1277 %%% Zeige alle Fragen in sortierter Reihenfolge.
1278 \newcommand{\zeigefragen}{%
1279   \par
1280   \zref@refused{frage:1}
1281   \setcounter{cntfrage}{1}
1282   \setboolean{nextfrage}{true}
1283   \whiledo{\boolean{nextfrage}}{
1284     \vspace{.25\baselineskip plus .1\baselineskip minus .1\baselineskip}
1285     \ifthenelse{\equal{\zref@extract{frage:\thecntfrage}{type}}{f}}{% Frage
1286       \noindent%
1287       \begingroup%
1288         \fragefont%
1289         \hyperlink{\zref@extract{frage:\thecntfrage}{anchor}}{%
1290           \zref@extract{frage:\thecntfrage}{text}%
1291         }%
1292         \par
1293       \endgroup
1294     }{% Themenüberschrift
1295       \noindent%
1296       \begingroup%
1297         \themenfont%
1298         \zref@extract{frage:\thecntfrage}{text}%
1299         \par
1300       \endgroup
1301       \nobreak
1302     }
1303     \stepcounter{cntfrage}
1304     \zref@ifrefundefined{frage:\thecntfrage}{\setboolean{nextfrage}{false}}{}
1305   }
1306   \vspace{.5\baselineskip plus .1\baselineskip minus .1\baselineskip}
1307   \setcounter{cntfrage}{0}
1308   \setcounter{frage}{0}
1309 }
1310
1311
1312 \zeigefragen
1313
1314
1315 \fragenthema{Verwenden der Trennmuster}
1316
1317 \begin{frageantwort}{Wie kann für die experimentellen Trennmuster aus
1318     dem Paket \Paket{dehyph-exptl} das Datum ermittelt werden, das
1319     Teil des Trennmusterbezeichners ist, wie in
1320     \autoref{sec:verwenden} erwähnt?}
1321
1322   Die Trennmusterbezeichner werden in der Datei \Datei{language.dat}
1323   definiert, wo auch die Verbindung zu den Manteldateien hergestellt
1324   wird.  Da ein Teil der Trennmusterbezeichner bereits bekannt ist,
1325   \verb+german-x+, vgl. \autoref{tab:varietaeten}, kann die Datei
1326   \Datei{language.dat} danach durchsucht werden.  Zunächst muss der
1327   Ort der Datei mit Hilfe des Kommandos \Programm{kpsewhich} ermittelt
1328   werden.  Es folgen die vollständigen Kommandos für unixähnliche
1329   Shells und die Windows-Kommandozeile \Datei{cmd.exe} (einzugeben
1330   ohne Zeilenumbruch).  Achtung, bei den einfachen Anführungszeichen
1331   handelt es sich um Gravis (»Backquotes«).
1332
1333 \begin{lstlisting}[style=shell, caption=Shell]
1334   grep -i german-x `kpsewhich language.dat`
1335 \end{lstlisting}
1336
1337 \begin{lstlisting}[style=shell, caption=\Datei{cmd.exe}]
1338   for /F "usebackq" %f in (`kpsewhich language.dat`)
1339     do find /i "german-x" "%f"
1340 \end{lstlisting}
1341
1342   Die Ausgabe dieser Kommandos sieht etwa wie folgt aus (das Datum
1343   kann abweichen):
1344
1345 \begin{lstlisting}
1346   german-x-2023-03-06 dehypht-x-2023-03-06.tex
1347   =german-x-latest
1348   ngerman-x-2023-03-06 dehyphn-x-2023-03-06.tex
1349   =ngerman-x-latest
1350 \end{lstlisting}
1351
1352   Die gesuchten Trennmusterbezeichner befinden sich in der ersten
1353   Spalte und lauten in diesem Beispiel
1354   \lstinline[style=LaTeX]{german-x-2023-03-06} und
1355   \lstinline[style=LaTeX]{ngerman-x-2023-03-06}.  In der zweiten
1356   Spalte kann man die Namen der Manteldateien erkennen
1357   (vgl. \autoref{tab:dateien}).  Die mit einem Gleichheitszeichen
1358   beginnenden Zeilen definieren ein Synonym für den
1359   Trennmusterbezeichner der unmittelbar vorangehenden Zeile in der
1360   Datei \Datei{language.dat}.
1361 \end{frageantwort}
1362
1363
1364 \begin{frageantwort}{Wie kann die Version der experimentellen Muster
1365     ermittelt werden, die im Paket \Paket{hyph-utf8} enthalten sind?}
1366
1367   Das Vorgehen ähnelt dem der vorherigen Antwort.  Zunächst wird der
1368   Ort einer bestimmten Datei ermittelt.  Diese wird dann nach einer
1369   hilfreichen Zeichenkette durchsucht.
1370
1371 \begin{lstlisting}[style=shell, caption=Shell]
1372   grep dehyph `kpsewhich hyph-de-1996.tex`
1373 \end{lstlisting}
1374
1375 \begin{lstlisting}[style=shell, caption=\Datei{cmd.exe}]
1376   for /F "usebackq" %f in (`kpsewhich hyph-de-1996.tex`)
1377     do find "dehyph" "%f"
1378 \end{lstlisting}
1379
1380   Die Ausgabe dieser Kommandos sieht etwa wie folgt aus (das Datum
1381   kann abweichen):
1382
1383 \begin{lstlisting}
1384   \message{German Hyphenation Patterns (Reformed Orthography, 2006)
1385     `dehyphn-x' 2023-03-06 (WL)}
1386 \end{lstlisting}
1387 \end{frageantwort}
1388
1389 \begin{frageantwort}{Wie kann die Version der experimentellen Muster
1390     ermittelt werden, die von \hologo{ConTeXt} verwendet werden?}
1391
1392   Derzeit (Stand Februar 2021) gibt es keine Möglichkeit, die Version direkt
1393   zu ermitteln.  Allerdings werden die \hologo{ConTeXt}-Muster automatisch
1394   aus den vorhandenen \Paket{hyph-utf8}-Mustern erzeugt; die Versionen sind
1395   daher ident zu den in \hologo{XeTeX} verwendeten Mustern.
1396 \end{frageantwort}
1397
1398 \begin{frageantwort}{Ich habe neue Trennmuster erstellt. Wie kann ich diese
1399 installieren?}
1400
1401   Die folgende Antwort richtet sich an Nutzer von \hologo{TeX} Live, die auf
1402   ihrem System über Administrationsrechte verfügen.
1403
1404   \begin{enumerate}
1405
1406   \item Überprüfen Sie, ob auf Ihrem System das Verzeichnis
1407   \Datei{TEXMFLOCAL\slash tex\slash generic\slash config}
1408   existiert.\footnote{Bei \Datei{TEXMFLOCAL} handelt es sich um den lokalen
1409   Baum der \hologo{TeX}-Installation, unter Unix in der Regel
1410   \Datei{/usr/local/texlive/texmf-local}, unter Windows \Datei{C:\textbackslash
1411   texlive\textbackslash texmf-local}.} Falls nicht, legen Sie es an.
1412
1413   \item Überprüfen Sie, ob im Verzeichnis \Datei{TEXMFLOCAL\slash tex\slash
1414   generic\slash config} die Dateien \Datei{language-local.dat} und
1415   \Datei{language-local.def} existieren. Falls nicht, legen Sie sie an.
1416
1417   \item Ergänzen Sie in der Datei \Datei{language-local.def} die folgende
1418   Zeile:\footnote{Als Vorbild für die erforderlichen Angaben können die
1419   vorhandenen Eintragungen in den Konfigurationsdateien \Datei{language.def}
1420   und \Datei{language.dat} der \hologo{TeX}-Installation dienen.}
1421
1422 \begin{lstlisting}[style=LaTeX]
1423   \addlanguage{<Name>}{<Datei>}{<Ausnahmedatei>}{<lmin>}{<rmin>}
1424 \end{lstlisting}
1425
1426   \noindent Dabei ist \texttt{<Name>} eine selbstgewählte Bezeichnung für die
1427   Trennmuster, \texttt{<Datei>} der Name der Trennmusterdatei bzw. der
1428   Manteldatei, wenn es eine solche gibt (vgl. \autoref{sec:installation}),
1429   \texttt{<Ausnahmedatei>} ggf. eine Datei mit Trennausnahmen (ansonsten leer),
1430   \texttt{<lmin>} die Mindestlänge einer am Wortanfang und
1431   \texttt{<rmin>} die Mindestlänge einer Wortende abgetrennten
1432   Silbe. Für deutsche Trennmuster setzt man die beiden letztgenannten Werte
1433   typischerweise auf \texttt{2}.
1434
1435   Ergänzen Sie entsprechend in der Datei \Datei{language-local.dat} die
1436   folgende Zeile:
1437
1438 \begin{lstlisting}
1439   <Name> <Datei>
1440 \end{lstlisting}
1441
1442   \item Verschieben Sie Ihre Trennmusterdateien in das Verzeichnis
1443   \Datei{TEXMFLOCAL\slash tex\slash generic}.
1444
1445   \item Führen Sie \emph{als Administrator} die Befehle
1446
1447 \begin{lstlisting}[style=shell]
1448   mktexlsr
1449 \end{lstlisting}
1450
1451   \noindent und
1452
1453 \begin{lstlisting}[style=shell]
1454   tlmgr generate --rebuild-sys language
1455 \end{lstlisting}
1456
1457   \noindent aus.
1458
1459   \end{enumerate}
1460
1461   Die so installierten Trennmuster können nun den Hinweisen in
1462   \autoref{sec:aktivieren} entsprechend aktiviert werden.
1463 \end{frageantwort}
1464
1465 \begin{frageantwort}{Um in bestimmten Dokumenten einen dauerhaft stabilen
1466 Umbruch zu erreichen, will ich verhindern, dass die zur Zeit vorhandenen
1467 Trennmuster bei einer Aktualisierung der \hologo{TeX}-Installation verloren
1468 gehen. Wie gehe ich vor?}
1469
1470   Suchen Sie auf Ihrem System nach der benötigten Trennmusterdatei und der
1471   zugehörigen Manteldatei gemäß \autoref{tab:dateien} und erstellen Sie Kopien
1472   dieser Dateien. Folgen Sie dann den Anweisungen der Antwort auf die vorige
1473   Frage.
1474
1475 \end{frageantwort}
1476
1477
1478 \fragenthema{Rechtschreibung}
1479
1480 \begin{frageantwort}{Verlag, Prüfer o.\,ä. bemängeln die Trennung der
1481     Trennmuster für die reformierte Rechtschreibung.  Zum Beispiel
1482     wird »In-dus-trie« getrennt, der Duden trennt jedoch
1483     »In-dust-rie«.}
1484
1485   Die amtlichen Regeln für die Rechtschreibung der deutschen Sprache
1486   lassen für viele Wörter mehrere Trennvarianten zu.  Die Trennmuster
1487   und ebenso Wörterverzeichnisse legen sich aus praktischen Gründen
1488   auf eine Trennvariante fest.  Sie können daher unterschiedliche
1489   Trennungen verwenden, ohne dass eine von beiden falsch ist.  Aus
1490   diesem Grund sind Wörterverzeichnisse nicht geeignet, eine bestimmte
1491   Trennung auf Richtigkeit zu prüfen.  Verbindlich sind einzig die
1492   amtlichen Regeln für die Rechtschreibung der deutschen
1493   Sprache~\cite{amtlRegeln:2006}.  Häufig sind diese im Anhang eines
1494   Wörterbuchs abgedruckt.  Die von den Trennmustern befolgten
1495   Konventionen können \autoref{sec:trennregeln} entnommen werden.
1496
1497   Wenn Unsicherheit darüber herrscht, wie die Rechtschreibung geprüft
1498   wird, sollte dies frühzeitig geklärt werden.  Nicht jedem Redakteur
1499   oder Prüfer ist bewusst, dass der Duden seine normative Stellung mit
1500   der Rechtschreibreform~1996 eingebüßt hat.
1501 \end{frageantwort}
1502
1503
1504 \begin{frageantwort}{Gibt es dudenkonforme Trennmuster für die
1505     reformierte Rechtschreibung?}
1506
1507   Zur Zeit nicht, es ist auch nicht geplant.  Dieses Projekt ist
1508   jedoch offen für Vorschläge und Mitarbeit.
1509 \end{frageantwort}
1510
1511
1512 \begin{frageantwort}{Weshalb werden noch Trennmuster für die
1513     traditionelle Rechtschreibung bereitgestellt?}
1514
1515   Die amtlichen Regeln für die Rechtschreibung der deutschen Sprache
1516   in der Fassung von 2006 sind nur für öffentliche Einrichtungen und
1517   Behörden verbindlich.  Im privaten Schriftverkehr kann man wahlweise
1518   die traditionelle oder die reformierte Rechtschreibung verwenden.%
1519   \footnote{Oder auch keine von beiden.}
1520 %
1521   Daher erfreut sich die traditionelle Rechtschreibung weiterhin
1522   großer Beliebtheit.
1523
1524   Für Texte in gebrochener Schrift ist die traditionelle
1525   Rechtschreibung sogar vorzuziehen.
1526 \end{frageantwort}
1527
1528 \begin{frageantwort}{In der Voreinstellung für die deutsche Sprache
1529     beträgt die Mindestlänge abgetrennter Silben zwei Buchstaben. Wie
1530     kann diese Mindestlänge verändert werden?}
1531
1532   Nehmen wir an, am Wortanfang sollen nicht weniger als drei und am
1533   Wortende nicht weniger als vier Buchstaben abgetrennt werden.  Dann
1534   sind folgende Befehle nötig:
1535
1536   \begin{itemize}
1537   \item Mit Plain-\hologo{TeX}:
1538
1539 \begin{lstlisting}[style=LaTeX]
1540   \uselanguage{<sprache>}
1541   \lefthyphenmin=3
1542   \righthyphenmin=4
1543 \end{lstlisting}
1544
1545     Ersetze dabei \texttt{<sprache>} durch eine der in
1546     \autoref{subsubsec:PlainTeX} erwähnten Trennmusterbezeichnungen,
1547     beispielsweise \texttt{ngerman}.
1548
1549   \item Mit \hologo{LaTeX} und \Paket{Babel}:
1550
1551 \begin{lstlisting}[style=LaTeX]
1552   \usepackage[<sprache>]{babel}
1553   \renewcommand*{\<sprache>hyphenmins}{34}
1554 \end{lstlisting}
1555
1556     Ersetze dabei \texttt{<sprache>} durch eine der in
1557     \autoref{subsubsec:LaTeX+Babel} erwähnten
1558     \Paket{Babel}-Sprachbezeichnungen, beispielsweise
1559     \texttt{ngerman}.
1560
1561   \item Mit \hologo{XeLaTeX}/\hologo{LuaLaTeX} und
1562     \Paket{Polyglossia} (Version 1.50 oder neuer):
1563
1564 \begin{lstlisting}[style=LaTeX]
1565   \usepackage{polyglossia}
1566   \setmainlanguage{german}
1567   \setlanghyphenmins[<option>]{<sprache>}{3}{4}
1568 \end{lstlisting}
1569
1570     Ersetze dabei \texttt{<option>} und \texttt{<sprache>} durch eine der in
1571     \autoref{subsubsec:LaTeX+PolyGlossia} erwähnten
1572     \Paket{Polyglossia}-Sprachbezeichnungen, beispielsweise
1573     \texttt{spelling=old} und \texttt{german}.
1574   \end{itemize}
1575 \end{frageantwort}
1576
1577 \begin{frageantwort}{Können Trennungen mit einer Silbenlänge von nur
1578     einem Buchstaben ermöglicht werden, zum Beispiel für den Satz in
1579     schmalen Kolumnen?}
1580
1581   Mit diesen Trennmustern ist das nicht möglich.  Die
1582   Abtrennung einzelner Vokale, zum Beispiel »A-bend«, war nur
1583   kurzzeitig zulässig; die entsprechende Regelung von 1996 wurde mit
1584   der Rechtschreibreform 2006 wieder zurückgenommen.  Wird die
1585   Silbenmindestlänge für die Worttrennung auf eins verringert, können
1586   falsche Trennungen auftreten.
1587 \end{frageantwort}
1588
1589
1590 \fragenthema{Mitarbeit}
1591
1592 \begin{frageantwort}{Wie kann ich mich über dieses Projekt
1593     informieren?}
1594
1595   Zentrale Anlaufstelle ist das Trennmuster-Wiki, welches sich
1596   momentan jedoch noch im Aufbau befindet.%
1597   \footnote{\url{https://projekte.dante.de/Trennmuster}}
1598 %
1599   Für Fragen und Hinweise kann nach Anmeldung die Mailingliste%
1600 %
1601   \footnote{\href{mailto:trennmuster@dante.de}{trennmuster@dante.de}}
1602 %
1603   genutzt werden.
1604
1605   \begin{itemize}
1606
1607   \item Die Datei \Datei{CHANGES} enthält bekannte, systematische
1608     Fehler der Trennmuster.
1609
1610   \item Das
1611     Entwicklerrepositorium%
1612 %
1613     \footnote{\url{https://repo.or.cz/wortliste.git/tree/HEAD:/dokumente}}
1614 %
1615     enthält im Verzeichnis \Datei{dokumente} eine Reihe von Dateien, welche
1616     u.\,a.  Trennregeln und Trennstile im Detail beschreibt.
1617
1618   \end{itemize}
1619 \end{frageantwort}
1620
1621
1622 \begin{frageantwort}{Wie kann ich helfen?}
1623
1624   Die deutschsprachige Trennmustermannschaft ist eine offene Gruppe
1625   und benötigt dringend weitere Mithilfe.  Interessenten sind daher
1626   hoch willkommen!  Zum Mitmachen gibt es mehrere Möglichkeiten:
1627
1628   \begin{itemize}
1629   \item Die einfachste ist, die experimentellen Trennmuster ausgiebig
1630     zu testen und Fehler zu melden (siehe \autoref{sec:trennfehler}).
1631
1632   \item Besonders hilfreich wäre Mitarbeit am Projekt.  Als Einstieg
1633     kann die (grobe) Aufgabenliste in der Projektbeschreibung dienen.
1634
1635     Obwohl schon experimentelle Trennmuster veröffentlicht wurden,
1636     steht dieses Projekt noch ziemlich am Anfang.  Ziel ist, die
1637     verwendete Wortliste von möglichst vielen Menschen in verteilter
1638     Arbeit auf Richtigkeit zu prüfen.  Bis dahin bleibt jedoch noch
1639     viel zu tun.
1640
1641   \item Mittelfristig -- nach Fertigstellung der Prüfmaske~-- kann
1642     auch durch systematische Durchsicht eines Teils der Wortliste
1643     geholfen werden.
1644
1645   \item Fragen, Hinweise und Ideen sind auf der Mailingliste immer
1646     willkommen!
1647   \end{itemize}
1648 \end{frageantwort}
1649
1650
1651 \begin{frageantwort}{Sollten Trennfehler einzeln oder gesammelt
1652     eingereicht werden?}
1653
1654   Das ist egal.  Es sollten allerdings die folgenden Hinweise beim
1655   Einreichen von Fehlern beachtet werden:
1656
1657   \begin{description}
1658     \setkomafont{descriptionlabel}{\normalfont\itshape}
1659
1660   \item[Aktualität] Wenn ältere Trennmusterdateien verwenden werden,
1661     bitte zuerst prüfen, ob der Fehler auch mit aktuellen Trennmustern
1662     auftritt.  Die aktuellen Trennmuster sind auf \Abk{ctan} im Paket
1663     \Paket{dehyph-exptl} oder im Dateibereich unter der
1664     Projekt-\Abk{url} erhältlich.  Im Repositorium befindet sich auch
1665     ein Makefile, mit dem jederzeit neue Trennmuster aus der aktuellen
1666     Wortliste erzeugt werden können.
1667
1668   \item[Informationen] In einem Fehlerbericht sollte für das
1669     betreffende Wort die richtige und bei einzelnen Worteinreichungen
1670     auch die falsche Trennung angegeben werden.  Außerdem die genaue
1671     Version der verwendeten Trennmuster (traditionelle oder
1672     reformierte Rechtschreibung, Datum der Trennmusterdatei).
1673
1674   \item[Listenformat] Es erleichtert die Korrektur, wenn
1675     Berichtigungsvorschläge in Form einer Liste eingereicht werden,
1676     die automatisch mit Skripten bearbeitet werden kann.  Die
1677     folgenden Konventionen sollten dabei eingehalten werden:
1678
1679     \begin{itemize}
1680     \item Die Spalten werden mit einem Semikolon \verb+;+ getrennt.
1681     \item Die erste Spalte enthält das betreffende Wort in
1682       ungetrennter Form.
1683     \item Die zweite Spalte enthält das Wort in der Trennvariante nach
1684       traditioneller Rechtschreibung.
1685     \item Falls die Trennung nach reformierter Rechtschreibung davon
1686       abweicht, steht diese in der dritten Spalte.
1687     \item Ab der vierten Spalte \emph{können} weitere Trennvarianten
1688       folgen, etwa die falsche Trennung.  Eine kurze Erklärung sollte
1689       dann darauf eingehen.
1690     \item Unerwünschte Trennungen werden mit einem Punkt \verb+.+
1691       markiert.
1692     \item Anfang und Ende der Liste sollten klar erkennbar sein.
1693     \end{itemize}
1694
1695     Eine Liste könnte beispielhaft so aussehen:
1696
1697 \begin{lstlisting}[style=Text]
1698   sonnendurchfluteten;son-nen-durch-flu-te-ten
1699   Talentwässerung;Tal-ent.wäs-se-rung
1700   Fensterplatz;Fen-ster-platz;Fens-ter-platz
1701 \end{lstlisting}
1702
1703     Dieses Format ist auch für einzeln eingereichte Korrekturen
1704     sinnvoll.
1705
1706   \item[Betreff] Der Betreff einer Fehlermeldung sollte aussagekräftig
1707     sein.  Daher sollten mehrere Trennfehler, sofern möglich,
1708     thematisch zusammengefasst werden.  Außerdem kann zur einfacheren
1709     Zuordnung das entsprechende Kriterium aus
1710     \autoref{sec:trennfehler} dem Betreff der E-Mail in eckigen
1711     Klammern vorangestellt werden, zum Beispiel:
1712
1713 \begin{lstlisting}[style=Text]
1714   Betreff: [A] sonnendurchfluteten
1715 \end{lstlisting}
1716
1717     \noindent für einen Trennfehler im Wortes
1718     \emph{sonnendurchfluteten}, der durch einen Fehler in der
1719     Wortliste hervorgerufen wird.
1720   \end{description}
1721 \end{frageantwort}
1722
1723 \end{document}
1724
1725 %%% Local Variables:
1726 %%% mode: latex
1727 %%% TeX-engine: default
1728 %%% TeX-PDF-mode: t
1729 %%% TeX-master: t
1730 %%% coding: utf-8
1731 %%% End: