dehyph-exptl/dehyph-exptl.tex

   1 %%% Artikelklasse mit:
   2 %%% * Grundschriftgröße 11 Punkt,
   3 %%% * klassischem Satzspiegel,
   4 %%% * flachem Inhaltsverzeichnis,
   5 %%% * Tabellenüberschriften.
   6 \documentclass[11pt,
   7                DIV=9,
   8                toc=flat,
   9                captions=tableheading,
  10                abstract=on]{scrartcl}
  11
  12 \emergencystretch 1em
  13
  14 %%% Eingabekodierung ist UTF-8.
  15 \usepackage[utf8]{inputenc}
  16
  17 %%% Schrifteinstellung:
  18 %%% * Grundschrift Palatino,
  19 %%% * Akzidenzschrift Bera Sans,
  20 %%% * Schreibmaschinenschrift Latin Modern Typewriter.
  21 \usepackage[T1]{fontenc}
  22 \usepackage[osf]{mathpazo}
  23 \usepackage[scaled=0.85]{berasans}
  24 \renewcommand*{\ttdefault}{lmtt}
  25 \usepackage{textcomp}
  26
  27 \linespread{1.1}
  28 \usepackage[expansion=true,
  29             letterspace=80]{microtype}
  30
  31 %%% Lade einige Pakete.
  32 \usepackage{ifthen}
  33 \usepackage{calc}
  34 \usepackage{multicol}
  35 \usepackage{paralist}
  36 \usepackage{fncylab}
  37 \usepackage{tabularx}
  38 \usepackage{booktabs}
  39 \usepackage{ragged2e}
  40 \usepackage{hologo}
  41 \usepackage[defaultlines=4,
  42             all]{nowidow}
  43
  44 \newcolumntype{L}{>{\raggedright\arraybackslash}X}
  45
  46 \usepackage{listings}
  47 \lstloadlanguages{[LaTeX]TeX, sh}
  48 \lstset{
  49   basicstyle=\ttfamily,
  50   keywordstyle={},
  51   commentstyle={},
  52   columns=flexible,
  53   showspaces=false,
  54   showstringspaces=false,
  55   % frame=tb,
  56   % framesep=8pt,
  57   % framerule=2pt,
  58   xleftmargin=6pt,
  59   xrightmargin=6pt,
  60   % framexleftmargin=6pt,
  61   % framexrightmargin=6pt,
  62   inputencoding=utf8,
  63   extendedchars=true,
  64   literate={ä}{{\"a}}1 {ö}{{\"o}}1 {ü}{{\"u}}1,
  65 }
  66 \lstdefinestyle{LaTeX}{
  67   language=[LaTeX]TeX,
  68   basicstyle=\ttfamily,
  69   keywordstyle={},
  70   commentstyle={\itshape}
  71 }
  72 \lstdefinestyle{shell}{
  73   language=sh,
  74   basicstyle=\ttfamily,
  75   keywordstyle={},
  76   commentstyle={\itshape},
  77   upquote=true % Gravis korrekt anzeigen
  78 }
  79 \lstdefinestyle{Text}{
  80   language=,
  81   basicstyle=\ttfamily,
  82   keywordstyle={},
  83   commentstyle={}
  84 }
  85
  86 \usepackage{needspace}
  87
  88 %%% Literaturverweise in runden Klammern mit Semikolon als Trenner.
  89 % \usepackage[round,semicolon]{natbib}
  90 % \renewcommand*{\bibnumfmt}[1]{(#1)}
  91
  92 %%% Literaturverzeichnis mit Sprachunterstützung.
  93 \usepackage[fixlanguage]{babelbib}
  94 \bibliographystyle{babalpha}
  95 %%% Babelbib fordert trotz fixlanguage zuviele Sprachen an.
  96 \usepackage[english,
  97             german,
  98             ngerman]{babel}
  99 \usepackage[ngerman=ngerman-x-latest]{hyphsubst}
 100
 101 %%% Einstellungen für interaktive PDF-Dokumente.
 102 \usepackage[rgb,x11names]{xcolor}
 103 \usepackage[hyperref]{zref}
 104 \usepackage{hyperref}
 105 \hypersetup{
 106   pdftitle={dehyph-exptl},
 107   pdfauthor={Die deutschsprachige Trennmustermannschaft},
 108   pdfkeywords={TeX,
 109                deutsche Rechtschreibung,
 110                Trennmuster,
 111                computergestützte Worttrennung}
 112 }
 113 \hypersetup{
 114   ngerman,% Für \autoref.
 115   pdfstartview={XYZ null null null},% Viewer bestimmt Zoomfaktor.
 116   colorlinks,
 117   linkcolor=RoyalBlue3,
 118   urlcolor=Chocolate4,
 119   citecolor=DeepPink2
 120 }
 121 \newcommand*{\regelref}[1]{%
 122   \begingroup
 123   \renewcommand*{\Itemautorefname}{Regel}%
 124   \autoref{#1}%
 125   \endgroup%
 126 }
 127
 128 %%% Schriftfestlegungen.
 129 \setkomafont{title}{\normalcolor\normalfont}
 130 \setkomafont{sectioning}{\normalcolor\normalfont}
 131 \setkomafont{section}{\Large}
 132 \setkomafont{subsection}{\Large\itshape}
 133 \setkomafont{descriptionlabel}{\normalfont\itshape}
 134
 135 %%% Einige Makros für logische Auszeichnungen definieren.
 136 \newcommand*{\Abk}[1]{\mbox{\textsc{\lsstyle#1}}}
 137 \newcommand*{\Paket}[1]{\textsf{#1}}
 138 \newcommand*{\Programm}[1]{\lstinline[style=shell]{#1}}
 139 \newcommand*{\Datei}[1]{\texttt{#1}}
 140
 141 \colorlet{falschcol}{red!80!black}
 142 \colorlet{tradcol}{green!50!black}
 143 \colorlet{reformcol}{green!75!black}
 144 \colorlet{unerwcol}{red!60!black}
 145
 146 \newcolumntype{T}{>{\color{tradcol}}l}
 147 \newcolumntype{R}{>{\color{reformcol}}l}
 148 \newcolumntype{U}{>{\color{unerwcol}}l}
 149
 150 \newcommand*{\trennung}[2]{%
 151   \makebox[0pt][l]{%
 152     \color{#1}%
 153     \smash{\rule[-3.5pt]{\widthof{#2}}{.7pt}}% Schriftabhängig.
 154   }%
 155   #2%
 156 }
 157 \newcommand*{\ftr}[1]{\trennung{falschcol}{#1}}% Falsche Trennung.
 158
 159 %%% Satzspiegel erneut berechnen.
 160 \typearea{last}
 161
 162
 163 %%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
 164
 165 \begin{document}
 166
 167 %%% Trennausnahmen definieren.
 168 \hyphenation{
 169   Back-end
 170   hyph-subst
 171   Ent-wick-ler-re-po-si-to-ri-um
 172   Wort-her-kunft
 173   Not-tren-nung
 174   Trenn-al-go-rith-mus
 175   um-bruch-in-kom-pa-tib-le
 176 }
 177
 178 %%% Protokollierung der Trennungen für findhyph.
 179 %\tracingparagraphs=1
 180
 181 %%% Dokumenttitel.
 182 \author{Die deutschsprachige Trennmustermannschaft}
 183 \title{\Paket{dehyph-exptl}\thanks{This document describes the
 184     \Paket{dehyph-exptl} package v1.0.}}
 185 \subtitle{Experimentelle Trennmuster für die deutsche Sprache}
 186 \maketitle
 187
 188 %%% Zweisprachige Zusammenfassung.
 189 \selectlanguage{english}
 190 \begin{abstract}
 191   This document describes the experimental hyphenation patterns for
 192   the German language, covering traditional and reformed orthography
 193   for several varieties of Standard German.  When using
 194   \hologo{XeTeX}/\hologo{LuaTeX}, these patterns are used
 195   automatically.  In other cases, they have to be loaded explicitly.
 196   More information can be found in the Trennmuster-Wiki%
 197   \footnote{\url{https://wiki.dante.de/doku.php?id=trennmuster:trennmuster}}
 198   (in German).
 199 \end{abstract}
 200
 201 \selectlanguage{ngerman}
 202 \begin{abstract}
 203   Dieses Dokument beschreibt die experimentellen Trennmuster für die
 204   deutsche Sprache, die das in Deutschland, Österreich und der Schweiz
 205   gebräuchliche Standarddeutsch in der traditionellen und reformierten
 206   Rechtschreibung abdecken.  Bei Nutzung von
 207   \hologo{XeTeX}/\hologo{LuaTeX} werden diese Muster automatisch
 208   verwendet; in anderen Fällen müssen sie i.\,d.\,R. ausdrücklich
 209   geladen werden.
 210 \end{abstract}
 211
 212 \vfill
 213 \begingroup
 214 \em\large
 215
 216 \begin{center}
 217   Warnung!
 218 \end{center}
 219
 220 Diese Trennmuster befinden sich im experimentellen Status.  Sie können
 221 auf \Abk{ctan} und in den \hologo{TeX}"=Verteilungen jederzeit
 222 durch umbruchinkompatible aktualisierte Versionen ersetzt werden.  Für
 223 Anwendungen, die einen dauerhaft stabilen Umbruch erfordern, sind sie
 224 nur geeignet, falls manuell eine feste Version installiert wird.
 225 \endgroup \vfill
 226
 227 \clearpage
 228 %%% Zweispaltiges Inhaltsverzeichnis.
 229 \begin{multicols}{2}
 230   \RaggedRight
 231   \small
 232   \selectlanguage{ngerman}
 233   \tableofcontents
 234 \end{multicols}
 235
 236
 237 \section{Einleitung}
 238 \label{sec:einleitung}
 239
 240 Der in \hologo{TeX} implementierte Trennalgorithmus arbeitet
 241 musterbasiert~\cite{liang:1983}.  Prinzipiell können mit einem solchen
 242 Algorithmus nicht alle möglichen Wörter korrekt getrennt werden.  Die
 243 Qualität der Worttrennung einer Sprache wird jedoch maßgeblich von der
 244 Qualität der Wortliste beeinflusst, aus der die verwendeten
 245 Trennmuster berechnet wurden.
 246
 247 Obwohl die herkömmlichen Trennmuster für die deutsche Sprache bei der
 248 Worttrennung in gewöhnlichen Texten eine akzeptable Fehlerrate
 249 erreichen, enthalten sie doch eine Reihe von Schwächen:%
 250 \footnote{Diese Liste bezieht sich auf die Trennmusterdateien
 251   \Datei{dehypht.tex}, Version~3.2a vom 3.\,3.\,1999, und
 252   \Datei{dehyphn.tex}, Version~31 vom 7.\,5.\,2001.}
 253
 254 \bigskip\smallskip
 255 \needspace{4\baselineskip}
 256 \noindent\textit{traditionelle und reformierte Rechtschreibung}
 257
 258 \begin{itemize}
 259 \item In zusammengesetzten Wörtern treten häufig Trennfehler an
 260   Wortfugen auf.
 261
 262 \item Fremdwörter mit akzentuierten Buchstaben werden mangelhaft
 263   getrennt: »C\ftr{af}é«, »Ci-tr\ftr{oë}n«, »F\ftr{aç}on«,
 264   »vo\ftr{il}à«.
 265
 266 \item Die Trennmusterdateien enthalten eine Mischung aus \Abk{t1}-
 267   sowie unvollständigen \Abk{ot1}-kodierten Mustern.  Mit Erscheinen
 268   von 16-Bit"=fähigen \hologo{TeX}"=Varianten werden sauber
 269   \Abk{utf-8}"=kodierte Trennmuster nötig~\cite{miklavec:2008}.
 270 \end{itemize}
 271
 272 \bigskip
 273 \needspace{4\baselineskip}
 274 \noindent\textit{traditionelle Rechtschreibung}
 275
 276 \begin{itemize}
 277 \item Die herkömmlichen Trennmuster für die traditionelle deutsche
 278   Rechtschreibung können mit \Programm{patgen} nicht reproduziert
 279   werden, da die zugrundeliegende Wortliste verschollen ist.  Die
 280   Pflege der Trennmuster ist daher schwierig bis unmöglich.  Für freie
 281   Software ist dies kein zufriedenstellender Zustand.
 282
 283 \item Umfang und Qualität der ursprünglichen Wortliste lassen sich
 284   nicht mehr einschätzen.  Für die Trennmuster in traditioneller
 285   Rechtschreibung existiert jedoch inzwischen eine Ausnahmeliste mit
 286   über 3500 korrigierten Trennungen einfacher Wörter
 287   \cite{lemberg:2003, lemberg:2005}.%
 288   \footnote{\url{https://mirrors.ctan.org/language/hyphenation/dehyph/dehyphtex.tex}}
 289
 290 \item Wird in der traditionellen Rechtschreibung \emph{ß} durch
 291   \emph{ss/SS} oder \emph{sz/SZ} ersetzt, so bleibt die Trennung davon
 292   unberührt.  Die herkömmlichen Trennmuster berücksichtigen diese
 293   Regel nicht und trennen häufig den Ersatz:
 294   \textls{»GR\ftr{ÖS"~S}E«}, \textls{»GR\ftr{ÜS"~S}E«},
 295   \textls{»M\ftr{AS"~S}ES«}.%
 296   \footnote{Die Trennung der herkömmlichen Muster entspricht den
 297     Regeln der deutschen Standardsprache in der Schweiz, obwohl diese
 298     Sprachvarietät vom Paket \Paket{Babel} bis 2013 nicht offiziell
 299     unterstützt wurde.  \Paket{Babel} versucht den Mangel mit Hilfe
 300     des Kürzels \lstinline[style=LaTeX]+\"S+ zu kompensieren.}
 301
 302 \item Abweichende Schreibweisen, die in der traditionellen
 303   Rechtschreibung in Österreich und der Schweiz verwendet werden,
 304   werden mangelhaft getrennt: »Gro\ftr{s"~so}n-kel«,
 305   »Ku\ftr{s"~sh}and«, »Ma\ftr{ssn}ah-me«, »mi\ftr{s"~sa}ch-ten«
 306   (nur Schweiz) und »Ex-pre\ftr{ssz}ug«, »Fit-ne\ftr{s"~sc}en-ter«,
 307   »Fit-ne\ftr{sst}rai-ner«.
 308 \end{itemize}
 309
 310 \bigskip
 311 \needspace{4\baselineskip}
 312 \noindent\textit{reformierte Rechtschreibung}
 313
 314 \begin{itemize}
 315 \item Die Trennmuster für die reformierte deutsche Rechtschreibung
 316   wurden nicht mit \Programm{patgen} aus einer Wortliste erstellt.
 317   Stattdessen wurden die Trennmuster für die traditionelle
 318   Rechtschreibung von Hand an die reformierten Regeln
 319   angepasst~\cite{schmidt:1998}.  Aus diesem Grund ist die
 320   Worttrennung mit den Trennmustern für die reformierte
 321   Rechtschreibung etwas schlechter als mit den Trennmustern für die
 322   traditionelle Rechtschreibung.
 323 \end{itemize}
 324
 325 Das Projekt \emph{Freie Wortlisten und Trennmuster für die deutsche
 326   Sprache} hat sich das Ziel gesetzt, neue Trennmuster hoher Qualität
 327 für die deutsche Sprache zu erstellen, die die genannten Probleme
 328 ausräumen.
 329
 330 Den experimentellen Trennmustern dieses Pakets liegt eine Wortliste
 331 mit den etwa fünfhunderttausend häufigsten Wörtern der deutschen
 332 Sprache zugrunde.  Vermutlich ist diese Liste erheblich umfangreicher
 333 als die ursprüngliche Wortliste, in der Worthäufigkeiten
 334 wahrscheinlich überhaupt nicht berücksichtigt wurden.  Die verwendete
 335 Wortliste deckt das in Deutschland, Österreich und der Schweiz
 336 gebräuchliche Standarddeutsch ab.
 337
 338 Mit den vorliegenden Trennmustern sollte für nicht"=fachsprachliche
 339 Wörter eine sehr gute Trennqualität erreicht werden.  Insbesondere
 340 sollte sich die Trennung häufig auftretender zusammengesetzter Wörter
 341 verbessern.
 342
 343
 344 \section{Verwenden der Trennmuster}
 345 \label{sec:verwenden}
 346
 347 Die experimentellen Trennmuster werden durch zwei verschiedene
 348 \hologo{TeX}"=Pakete zur Verfügung gestellt, die beide in einer
 349 vollständigen Installation einer aktuellen \hologo{TeX}"=Distribution
 350 enthalten sein sollten.
 351
 352 Das Paket \Paket{hyph-utf8} enthält Trennmuster für alle von
 353 \hologo{TeX} unterstützten Sprachen.  Für die deutsche Sprache sind
 354 die experimentellen Muster enthalten.  Diese werden standardmäßig nur
 355 von \hologo{XeTeX}, \hologo{LuaTeX} und p\TeX\footnote{Eine in Japan
 356   populäre \TeX-Variante.} sowie von allen \hologo{TeX}"=Varianten für
 357 die Schweizer Varietät der deutschen Sprache in traditioneller
 358 Rechtschreibung\footnote{Diese Varietät wird erst seit dem Jahr 2013
 359   unterstützt, sodass keine Abwärtskompatibilität erforderlich ist.}
 360 benutzt.  In den übrigen Fällen wird dagegen auf die herkömmlichen
 361 Trennmuster zurückgegriffen.
 362
 363 Das Paket \Paket{dehyph-exptl} enthält die experimentellen
 364 Trennmuster für die deutsche Sprache.  Es hat den Zweck, diese den
 365 Nutzern der älteren \hologo{TeX}"=Varianten wie \hologo{pdfTeX}
 366 zugänglich zu machen.  Die hierfür nötigen Vorkehrungen werden unten
 367 beschrieben.
 368
 369 Siehe \autoref{sec:fragen} für Hinweise, wie die Version der in beiden
 370 Paketen enthaltenen Muster ermittelt werden kann.
 371
 372 Zur manuellen Installation einer bestimmten Version der
 373 experimentellen Trennmuster siehe \autoref{sec:installation}.
 374
 375 Beachte, in den folgenden Abschnitten ist \verb+<datum>+ durch das bei
 376 der Installation angegebene Datum in \Abk{iso}"=Notation
 377 (\verb+JJJJ-MM-TT+) oder die Zeichenkette \verb+latest+ zu ersetzen.
 378
 379
 380 \subsection{Sprachvarietät und Rechtschreibung}
 381 \label{sec:varietaeten}
 382
 383 Experimentelle Trennmuster stehen für die Worttrennung der deutschen
 384 Sprache in der traditionellen und der reformierten Rechtschreibung zur
 385 Verfügung.  Die Trennmuster unterstützen die drei in Deutschland,
 386 Österreich und der Schweiz gebräuchlichen Hauptvarietäten der
 387 deutschen Standardsprache.  \autoref{tab:varietaeten} zeigt die
 388 Trennmuster, die abhängig von gewünschter Varietät und Rechtschreibung
 389 in einem Dokument zu aktivieren sind.
 390
 391 \begin{table}
 392   \centering
 393   \caption{Die unterstützten Varietäten und Rechtschreibungen}
 394   \label{tab:varietaeten}
 395   \begin{tabular}{l>{\ttfamily}l}
 396     \normalfont Sprachvarietät
 397     & Trennmusterbezeichner\\
 398     \addlinespace\toprule\addlinespace
 399     \hspace*{-\tabcolsep}\normalfont\emph{traditionelle Rechtschreibung}\\
 400     Deutschland, Österreich
 401     & german-x-<datum>\\
 402     Schweiz
 403     & gswiss-x-<datum>\\\addlinespace
 404     \hspace*{-\tabcolsep}\normalfont\emph{reformierte Rechtschreibung}\\
 405     Deutschland, Österreich, Schweiz
 406     & ngerman-x-<datum>\\
 407   \end{tabular}
 408 \end{table}
 409
 410 Varietäten, die sich nur in der Verwendung und Schreibung einzelner
 411 Wörter voneinander unterscheiden, können durch gemeinsame Trennmuster
 412 unterstützt werden.
 413 % Die Eingabewortliste für \Programm{patgen} ist dann eine Vereinigung
 414 % der den Varietäten entsprechenden Wortlisten.
 415 Zum Beispiel werden Besonderheiten der österreichischen
 416 Standardsprache in den Trennmustern für die Standardsprache
 417 Deutschlands berücksichtigt.  Österreichische und deutsche Anwender
 418 können daher dieselben Trennmuster verwenden (wie das auch schon bei
 419 den herkömmlichen Trennmustern der Fall war).
 420
 421 Aufgrund unvereinbarer Trennregeln in der traditionellen
 422 Rechtschreibung der Standardsprachen Deutschlands/""Österreichs und
 423 der Schweiz werden für die letztere Varietät eigene Trennmuster
 424 bereitgestellt.
 425
 426 Mit der Rechtschreibreform 1996 wurden die Trennregeln aller drei
 427 Standardsprachen so weit angeglichen, dass für die reformierte
 428 Rechtschreibung einheitliche Trennmuster für alle drei unterstützten
 429 Sprachvarietäten bereitgestellt werden können.
 430
 431 \subsection{Aktivieren der Trennmuster}
 432 \label{sec:aktivieren}
 433
 434 Im Folgenden wird dargestellt, wie die experimentellen Trennmuster bei
 435 Verwendung unterschiedlicher \hologo{TeX}"=Varianten geladen werden
 436 können.
 437
 438 Das Ergebnis für die traditionelle und reformierte Rechtschreibung mit
 439 herkömmlichen und experimentellen Trennmustern ist in
 440 \autoref{tab:trennvarianten} zusammengefasst.  Ob die experimentellen
 441 Trennmuster korrekt aktiviert werden, kann mit dem folgenden kleinen
 442 Dokument getestet werden, dessen Ausgabe in der \texttt{log}"=Datei
 443 erscheint.
 444
 445 \begin{lstlisting}[style=LaTeX]
 446   \begin{document}
 447   \showhyphens{löste Fassade modernste Abendstern Mordopfer}
 448   \end{document}
 449 \end{lstlisting}
 450
 451 %\suppressfloats[t]
 452 \begin{table*}
 453   \centering
 454   \caption{Trennvarianten}
 455   \label{tab:trennvarianten}
 456   \begin{tabular}{llll}
 457     \multicolumn{2}{c}{\itshape traditionelle Rechtschreibung} &
 458     \multicolumn{2}{c}{\itshape reformierte Rechtschreibung}\\
 459     herkömmlich & experimentell & herkömmlich & experimentell\\
 460     \addlinespace\toprule\addlinespace
 461     l\ftr{ös-t}e & lö-ste & lös-te & lös-te\\
 462     Fas-sa-de & Fas-sa-de & Fa\ftr{ss}a-de & Fas-sa-de\\
 463     mo-\ftr{d-e}rn-ste & mo-dern-ste & mo-\ftr{d-e}rns-te & mo-derns-te\\
 464     Abend-stern & Abend-stern & Aben\ftr{ds-t}ern & Abend-stern\\
 465     Mo\ftr{r-do}p-fer & Mord-op-fer & Mo\ftr{r-do}p-fer & Mord-op-fer\\
 466   \end{tabular}
 467 \end{table*}
 468
 469 \subsubsection{Plain-\TeX}
 470 \label{subsubsec:PlainTeX}
 471
 472 Bei Verwendung eines \hologo{eTeX}"=basierten Compilers
 473 (\Programm{etex}, \Programm{pdftex}, \Programm{xetex} oder
 474 \Programm{luatex}) steht der Befehl \verb+\uselanguage+ zum Laden von
 475 Trennmustern zur Verfügung.  Er akzeptiert neben anderen die Argumente
 476 \texttt{german}, \texttt{ngerman} und \texttt{swissgerman} (nicht
 477 jedoch \texttt{austrian}, \texttt{naustrian} und
 478 \texttt{nswissgerman}).\footnote{Die zulässigen Sprachbezeichnungen
 479   finden sich in der Datei \Datei{language.def} der
 480   \hologo{TeX}"=Installation.}  Um die Silbentrennung gemäß
 481 reformierter deutscher Rechtschreibung zu aktivieren, ist also
 482 folgender Befehl ausreichend:
 483
 484 \begin{lstlisting}[style=LaTeX]
 485   \uselanguage{ngerman}
 486 \end{lstlisting}
 487
 488 Die Compiler \Programm{xetex} und \Programm{luatex} verwenden für alle
 489 definierten Varietäten der deutschen Sprache die experimentellen
 490 Trennmuster, die mit dem Paket \Paket{hyph-utf8} installiert sind;
 491 \Programm{etex} und \Programm{pdftex} tun dies nur für
 492 \texttt{swissgerman}.
 493
 494 Für die Varietäten \texttt{german} und \texttt{ngerman} laden
 495 \Programm{etex} und \Programm{pdftex} hingegen aus Gründen der
 496 Abwärtskompatibilität die herkömmlichen Trennmuster.  Die
 497 experimentellen Trennmuster können am einfachsten aktiviert werden,
 498 indem etwa \lstinline[style=LaTeX]+\uselanguage{ngerman}+ durch den
 499 folgenden Befehl ersetzt wird:
 500
 501 \begin{lstlisting}[style=LaTeX]
 502   \uselanguage{ngerman-x-latest}
 503 \end{lstlisting}
 504
 505 Auf entsprechende Weise ist es mit allen Compilern möglich, eine
 506 alternative, manuell installierte Trennmusterversion zu verwenden:
 507
 508 \begin{lstlisting}[style=LaTeX]
 509   \uselanguage{ngerman-x-<datum>}
 510 \end{lstlisting}
 511
 512 Vorausgesetzt ist dabei, dass ein entsprechender Eintrag in der
 513 Konfigurationsdatei \Datei{language.def} oder einer lokalen Version
 514 derselben existiert.
 515
 516 Soll der \verb+\uselanguage+-Befehl seine gewohnte Form behalten, ist
 517 zum Laden alternativer Trennmuster auch folgendes Vorgehen mit Hilfe
 518 des Pakets \Paket{hyphsubst} möglich:
 519
 520 \begin{lstlisting}[style=LaTeX]
 521   \input hyphsubst.sty
 522   \HyphSubstLet{ngerman}{ngerman-x-<datum>}
 523   \uselanguage{ngerman}
 524 \end{lstlisting}
 525
 526 Zu beachten ist, dass in Plain-\hologo{TeX} unabhängig vom verwendeten
 527 Compiler Wörter mit Umlauten, \emph{ß} oder Akzentbuchstaben an vielen
 528 Trennstellen nicht automatisiert getrennt werden können.
 529
 530 \subsubsection{\LaTeX{} mit dem Sprachenpaket \Paket{Babel}}
 531 \label{subsubsec:LaTeX+Babel}
 532
 533 Das Paket \Paket{Babel} kennt für die traditionelle Rechtschreibung
 534 die Sprachbezeichnungen \texttt{german}, \texttt{austrian} und
 535 \texttt{swissgerman}, für die reformierte Rechtschreibung
 536 \texttt{ngerman}, \texttt{naustrian} und \texttt{nswissgerman}, wobei
 537 diese sechs Varietäten durch drei Trennmustersätze abgedeckt werden
 538 können (\autoref{tab:varietaeten}).
 539
 540 Die Compiler \Programm{xelatex} und \Programm{lualatex} verwenden für
 541 alle definierten Varietäten der deutschen Sprache die experimentellen
 542 Trennmuster, die mit dem Paket \Paket{hyph-utf8} installiert sind;
 543 \Programm{latex} und \Programm{pdflatex} tun dies nur für
 544 \texttt{swissgerman}.
 545
 546 Für die übrigen fünf Varietäten laden \Programm{latex} und
 547 \Programm{pdflatex} hingegen aus Gründen der Abwärtskompatibilität
 548 standardmäßig die herkömmlichen Trennmuster.  Um stattdessen die
 549 experimentellen Trennmuster zu aktivieren, sind für die reformierte
 550 Rechtschreibung folgende Zeilen in die Präambel des Dokuments
 551 aufzunehmen.
 552
 553 \begin{lstlisting}[style=LaTeX]
 554   \usepackage[T1]{fontenc}
 555   \usepackage[ngerman]{babel}
 556   \babelprovide[hyphenrules=ngerman-x-latest]{ngerman}
 557 \end{lstlisting}
 558
 559 Für die österreichische Varietät:
 560
 561 \begin{lstlisting}[style=LaTeX]
 562   \usepackage[T1]{fontenc}
 563   \usepackage[naustrian]{babel}
 564   \babelprovide[hyphenrules=ngerman-x-latest]{naustrian}
 565 \end{lstlisting}
 566
 567 Auf entsprechende Weise ist es mit allen \hologo{LaTeX}"=Compilern
 568 möglich, eine alternative, manuell installierte Trennmusterversion zu
 569 aktivieren:
 570
 571 \begin{lstlisting}[style=LaTeX]
 572   \usepackage[T1]{fontenc}
 573   \usepackage[ngerman]{babel}
 574   \babelprovide[hyphenrules=ngerman-x-<datum>]{ngerman}
 575 \end{lstlisting}
 576
 577 Der Befehl \verb+\babelprovide+ erlaubt auch innerhalb eines Dokuments
 578 das mehrfache Umschalten der Trennmuster.
 579
 580 \subsubsection{\hologo{XeLaTeX}/\hologo{LuaLaTeX} mit dem
 581   Sprachenpaket \Paket{Polyglossia}}
 582 \label{subsubsec:LaTeX+PolyGlossia}
 583
 584 Für \hologo{XeLaTeX} und \hologo{LuaLaTeX} steht als Alternative zu
 585 \Paket{Babel} das Paket
 586 \Paket{Polyglossia}\footnote{\url{https://ctan.org/pkg/polyglossia}}
 587 zur Verfügung.  Mit den Zeilen
 588
 589 \begin{lstlisting}[style=LaTeX]
 590   \usepackage{polyglossia}
 591   \setmainlanguage{german}
 592 \end{lstlisting}
 593
 594 \noindent in der Präambel werden die mit dem Paket \Paket{hyph-utf8}
 595 installierten Trennmuster für die \emph{reformierte} Rechtschreibung
 596 geladen.  Mit den Optionen \texttt{variant=""austrian},
 597 \texttt{variant=""swiss} und \texttt{spelling=""old} können wahlweise
 598 die österreichische Varietät, die Schweizer Varietät sowie die
 599 traditionelle Rechtschreibung gewählt werden, beispielsweise:
 600
 601 \begin{lstlisting}[style=LaTeX]
 602   \usepackage{polyglossia}
 603   \setmainlanguage[variant=swiss, spelling=old]{german}
 604 \end{lstlisting}
 605
 606 Um Trennhilfen wie \verb+""+, \verb+"ff+ oder \verb+"ck+ verwenden zu
 607 können, muss zusätzlich die Option \texttt{babelshorthands=""true}
 608 gesetzt werden.
 609
 610 Mit \hologo{XeLaTeX} ist es außerdem möglich, manuell installierte
 611 statt der voreingestellten Trennmuster zu verwenden.  Hierzu kommt das
 612 Paket \Paket{hyphsubst} wie folgt zum Einsatz.  Für die reformierte
 613 Rechtschreibung:
 614
 615 \begin{lstlisting}[style=LaTeX]
 616   \usepackage{polyglossia}
 617   \setmainlanguage{german} % ggf. variant=austrian/swiss
 618   \usepackage[ngerman=ngerman-x-<datum>]{hyphsubst}
 619 \end{lstlisting}
 620
 621 Für die traditionelle Rechtschreibung in Deutschland und Österreich:
 622
 623 \begin{lstlisting}[style=LaTeX]
 624   \usepackage{polyglossia}
 625   \setmainlanguage[spelling=old]{german} % ggf. variant=austrian
 626   \usepackage[german=german-x-<datum>]{hyphsubst}
 627 \end{lstlisting}
 628
 629 Für die traditionelle Rechtschreibung in der Schweiz:
 630
 631 \begin{lstlisting}[style=LaTeX]
 632   \usepackage{polyglossia}
 633   \setmainlanguage[variant=swiss, spelling=old]{german}
 634   \usepackage[swissgerman=gswiss-x-<datum>]{hyphsubst}
 635 \end{lstlisting}
 636
 637 Mit \hologo{LuaLaTeX} in Verbindung mit \Paket{Polyglossia} ist das
 638 Ersetzen der Trennmuster auf diese Weise nicht möglich.
 639
 640 \subsubsection{p\TeX/up\TeX}
 641
 642 Die in Japan gebräuchlichen \hologo{TeX}"=Varianten p\TeX{} und
 643 up\TeX{} verwenden für deutschsprachige Texte die experimentellen
 644 Trennmuster, die mit dem Paket \Paket{hyph-utf8} installiert sind.
 645
 646 \subsubsection{\hologo{ConTeXt}}
 647
 648 \hologo{ConTeXt} besitzt eigene Trennmusterdateien.  Die Trennmuster
 649 werden aus dem Paket \Paket{hyph-utf8} übernommen; Unterstützung für
 650 die traditionelle deutsche Rechtschreibung in der Schweiz fehlt
 651 allerdings zur Zeit.
 652
 653 Siehe \autoref{sec:fragen} für Hinweise, wie die Version der
 654 \hologo{ConTeXt}-Trennmuster bestimmt werden kann.
 655
 656 \section{Trennregeln und Konventionen}
 657 \label{sec:trennregeln}
 658
 659 Die Trennmuster für die traditionelle Rechtschreibung in Deutschland
 660 und Österreich orientieren sich an den verbindlichen Regeln des Dudens
 661 in der Fassung von 1991~\cite{duden:1991}.  Dasselbe gilt für die
 662 Trennmuster für die traditionelle Rechtschreibung in der Schweiz,
 663 jedoch mit einer unten beschriebenen Abweichung.  Die Trennmuster für
 664 die reformierte Rechtschreibung orientieren sich an den amtlichen
 665 Regeln für die Rechtschreibung der deutschen Sprache in der Fassung
 666 von 2006~\cite{amtlRegeln:2006, amtlRegeln:2006:duden}.
 667
 668 Die Regeln lassen gewisse Freiheiten bei der Schreibung und Trennung
 669 von Wörtern zu.  Da sich solche Freiheiten nicht ohne weiteres auf die
 670 maschinelle Worttrennung übertragen lassen, wurden die im folgenden
 671 beschriebenen Konventionen getroffen.  Hauptsächlich betreffen diese
 672 die reformierte Rechtschreibung, die zusätzliche Freiheiten eingeführt
 673 hat.\footnote{%
 674   Im Ergebnis weicht in reformierter Rechtschreibung die Trennung zum
 675   Beispiel des Dudens (nach Sprechsilben) von der Trennung mit diesen
 676   Trennmustern (bevorzugt etymologisch) ab, siehe auch
 677   \regelref{enum:reformEtymo} und \regelref{enum:reformClusterLR}
 678   sowie \autoref{sec:fragen}.}  Beziehen sich die Konventionen für die
 679 reformierte Rechtschreibung auf die traditionelle Rechtschreibung, so
 680 werden die entsprechenden Regeln etwas ausführlicher dargestellt.  Die
 681 folgenden Abschnitte enthalten jedoch keine vollständige Aufstellung
 682 der Silbentrennregeln.  Diese sind den entsprechenden Regelwerken zu
 683 entnehmen.  Es folgen zunächst einige allgemeine Hinweise:
 684
 685 \begin{itemize}
 686
 687 \item In Liangs Trennalgorithmus werden Groß- und Kleinschreibung
 688   nicht unterschieden~\cite{liang:1983}.  Die Schreibweisen
 689   \emph{Nachtritt} und \emph{nachtritt} werden aus Sicht des
 690   Trennalgorithmus gleich behandelt (siehe auch
 691   \regelref{enum:tradDoppeld} und \regelref{enum:reformDoppeld}).
 692
 693 \item Die von einem Programm aus diesen Mustern abgeleiteten möglichen
 694   Trennstellen können (u.\,a. durch Programmfehler) durchaus von denen
 695   der zugrundeliegenden Wortliste abweichen.  So führt zum Beispiel
 696   die Eingabe \lstinline[style=LaTeX]+Meta"llegierung+
 697   (Dreikonsonantenregel in der traditionellen Rechtschreibung) mit dem
 698   Paket \Paket{Babel} zu den in \autoref{tab:trennung-dreik} gezeigten
 699   Trennmöglichkeiten.
 700
 701   \begin{table}
 702     \centering
 703     \caption{Unterschiedlich ermittelte Trennmöglichkeiten.}
 704     \label{tab:trennung-dreik}
 705     \begin{tabular}{ll}
 706       Quelle & Trennmöglichkeiten\\
 707       \addlinespace
 708       \toprule
 709       \addlinespace
 710       \hologo{pdfLaTeX} mit \Paket{Babel}~3.8 & Me-tall(-l)egierung\\
 711       \hologo{pdfLaTeX} mit \Paket{Babel}~3.9 & Me-tall(-l)e-gie-rung\\
 712       erwünscht \emph{(vgl. \regelref{enum:tradnstd})} & Me-tall(-l)egie-rung\\
 713     \end{tabular}
 714   \end{table}
 715
 716 \item Die von \hologo{TeX} gewählte Trennung kann in Einzelfällen mit
 717   den \hologo{TeX}- und \Paket{Babel}"=Kürzeln
 718   \lstinline[style=LaTeX]+\-+ und \lstinline[style=LaTeX]+"-+ geändert
 719   werden.  Für dokumentweite Änderungen der Trennung eignet sich das
 720   Kommando \lstinline[style=LaTeX]+\hyphenation+.
 721
 722 \item Die Datei \Datei{CHANGES} beschreibt bekannte, systematische
 723   Fehler der Trennmuster.
 724
 725 \item In den Beispielen zeigt die linke (grüne) Spalte jeweils die
 726   Trennung mit den experimentellen Trennmustern, die rechten (roten)
 727   Spalten zeigen alternative oder unerwünschte Trennungen.
 728
 729 \end{itemize}
 730
 731 \subsection{Traditionelle Rechtschreibung in Deutschland und
 732   Österreich}
 733 \label{sec:tradRS}
 734
 735 \begin{enumerate}[\hspace{1em}\itshape{T}1]
 736 \labelformat{enumi}{\textit{T#1}}
 737
 738 \item\label{enum:tradhyphenmin} Die minimale unterstützte Silbenlänge
 739   am Wortanfang und "~ende beträgt zwei Buchstaben
 740   \cite[R~178]{duden:1991}.
 741
 742   Siehe \autoref{sec:fragen} für Hinweise, wie sich diese Länge
 743   abweichend einstellen lässt.  Wird die Mindestlänge auf weniger als
 744   zwei Buchstaben verringert, so können fehlerhafte Trennungen
 745   auftreten.
 746
 747 \item\label{enum:tradSinn} Sinnentstellende und irreführende
 748   Trennungen werden möglichst vermieden \cite[R~181]{duden:1991}
 749   (siehe auch \regelref{enum:tradnstd}):
 750
 751   \begin{tabular}[t]{TU}
 752     An-alpha-bet & Anal-phabet\\
 753     Kaf-ka-kenner & Kafkaken-ner\\
 754     Tal-entwäs-se-rung & Talent-wässerung\\
 755   \end{tabular}
 756
 757   Beachte, dass derzeit die Unterdrückung von solchen Trennstellen bis
 758   zu einem gewissen Grade willkürlich und subjektiv ist.  Außerdem ist
 759   die Erfassung weit davon entfernt, vollständig zu sein.  Um diesen
 760   Problemen abzuhelfen, ist für zukünftige Versionen der Trennmuster
 761   ein anderer, automatisierter Ansatz geplant, welcher die Anzahl
 762   manuell zu erfassender Fälle sehr stark reduzieren wird.
 763
 764 \item\label{enum:tradDoppeld} In mehrdeutigen Wörtern werden
 765   Trennungen nur an übereinstimmenden Trennstellen zugelassen.
 766
 767   \begin{tabular}[t]{TUU}
 768     nachtritt & nach-tritt & Nacht-ritt\\
 769     Wachstu-be & Wach-stube & Wachs-tube\\
 770     Druckerzeug-nis & Druck-erzeugnis & Drucker-zeugnis\\
 771     Mu-sikerle-ben & Musik-erleben & Musi-ker-leben\\
 772     Fuß-balleh-re & Fußball-ehre & Fußball-lehre\\
 773   \end{tabular}
 774
 775   Beachte, die Trennstellen »Drucker-zeugnis« und »Musiker-leben«
 776   sind in den Interpretationen \emph{Druck-Erzeugnis} und
 777   \emph{Musik-Erleben} irreführend.  Sie entfallen nach
 778   \regelref{enum:tradSinn} und sind nicht als übereinstimmende
 779   Trennstellen anzusehen.  Zur Spezialtrennung »Fußball-lehre« siehe
 780   auch \regelref{enum:tradnstd}.
 781
 782   Für diese Regel gelten die folgenden Einschränkungen:
 783
 784   \begin{itemize}
 785
 786   \item Bei mehrdeutigen Wörtern endend auf \emph{"~ende},
 787     \emph{"~enden}, \emph{"~endes} wird stets die Trennung der
 788     Partizipform des Verbs verwendet.
 789
 790     \begin{tabular}[t]{TUU}
 791       fu-ßen-de & Fuß-ende & fußende\\
 792       spie-len-de & Spiel-ende & spielende
 793     \end{tabular}
 794
 795   \item Mehrdeutigkeiten, die durch die Ersatzschreibweise von Wörtern
 796     mit~\emph{ß} auftreten, werden nicht berücksichtigt (vergleiche
 797     \regelref{enum:tradEszett}).
 798
 799     \begin{tabular}[t]{TUU}
 800       Mas-se & \textls{M\kern-.4ptA-SSE} & \textls{M\kern-.4ptA\kern-.6ptSSE}
 801     \end{tabular}
 802
 803   \end{itemize}
 804
 805 \item\label{enum:tradEszett} Wird der Buchstabe~\emph{ß} durch
 806   \emph{ss/SS} ersetzt, so bleibt die Trennung davon unberührt
 807   \cite[R~179]{duden:1991}:
 808
 809   \begin{tabular}[t]{T}
 810     \textls{GRÖSS-TE}\\
 811     \textls{GRÜ-SSE}\\
 812     \textls{M\kern-.4ptA\kern-.4pt-SSES}\\
 813   \end{tabular}
 814
 815   Für diese Regel gilt die folgende Einschränkung:
 816   \begin{itemize}
 817
 818   \item Wenn durch den Ersatz von~\emph{ß} an dieser Stelle keine
 819     eindeutige Trennung möglich ist, so wird zugunsten der Bedeutung
 820     des Wortes in der normalen Schreibweise getrennt (siehe auch
 821     \regelref{enum:tradDoppeld}).
 822
 823     \begin{tabular}[t]{TTU}
 824       \textls{FLÖS-SE} & (wegen flös-se) & \textls{FLÖ-SSE}\\
 825       \textls{MAS-SE} & (wegen Mas-se) & \textls{MA-SSE}\\
 826     \end{tabular}
 827
 828     Beachte:
 829     \begin{itemize}
 830
 831     \item Wird \emph{ß} mit \lstinline[style=LaTeX]+\MakeUppercase+
 832       durch~\emph{SS} ersetzt, so bleibt \emph{SS} stets ungetrennt.
 833       Die Trennung richtet sich dann nach der Schreibweise
 834       mit~\emph{ß} im Quelldokument.
 835
 836     \item Existiert ein Wort in verschiedenen Varietäten in der
 837       Schreibweise mit~\emph{ß} und mit~\emph{ss}, so wird aufgrund
 838       dieser Einschränkung \emph{s-s} stets getrennt:
 839
 840       \begin{tabular}[t]{TTUU}
 841         Ge-scho-ße  & (AT)\\
 842         Ge-schos-se & (D) & \textls{GESCHO-SSE} & (AT)\\
 843       \end{tabular}
 844
 845     \item Wenn durch den Ersatz des~\emph{ß} an entfernten Stellen
 846       keine eindeutige Trennung möglich wird, zum Beispiel an
 847       Wortfugen, so werden die betroffenen Trennungen gemäß
 848       \regelref{enum:tradDoppeld} unterdrückt.  In der Folge wird
 849       gegebenenfalls auch die Trennung von \emph{ss/SS} unterdrückt.
 850
 851       \begin{tabular}[t]{TU}
 852         \textls{BAHN-HOFSTRASSE} & \textls{BAHNHOF-STRA-SSE}\\
 853                                  & \textls{BAHNHOFS-TRAS-SE}\\
 854       \end{tabular}
 855
 856     \end{itemize}
 857
 858   \end{itemize}
 859
 860 \item\label{enum:tradOW} In Ableitungen von Namen auf \emph{"~ow} wird
 861   die Nottrennung der Ableitungssilben \emph{"~er}, \emph{"~ern},
 862   \emph{"~ers} unterdrückt \cite[R~180]{duden:1991}:
 863
 864   \begin{tabular}[t]{TU}
 865     Tel-tower & Teltow-er\\
 866     Trep-towern & Treptow-ern\\
 867     Pan-kowers & Pankow-ers\\
 868   \end{tabular}
 869
 870 \item\label{enum:tradnstd} Spezialtrennungen (\emph{engl.:}
 871   non-standard hyphenation), die nach Regeln erfolgen, die über das
 872   bloße Einfügen eines Trennstrichs hinausgehen, wie die \emph{ck}"~
 873   oder die Dreikonsonantenregel, kann \hologo{TeX} nicht automatisch
 874   behandeln.  Aus diesem Grund sind solche Trennstellen in diesen
 875   Trennmustern nicht berücksichtigt.
 876
 877   \begin{tabular}[t]{lTUU}
 878     \lstinline[style=LaTeX]+drucken+ & drucken & druk-ken\\
 879     \lstinline[style=LaTeX]+Zuckerbäcker+ & Zucker-bäcker & Zuk-kerbäk-ker\\
 880     \lstinline[style=LaTeX]+Brennessel+ & Brennes-sel & Brenn-nessel\\
 881     \lstinline[style=LaTeX]+Stoffetzen+ & Stoffet-zen & Stoff-fetzen\\
 882   \end{tabular}
 883
 884   Die Dreikonsonantenregel birgt aufgrund des ausgefallenen
 885   Konsonanten die Gefahr irreführender und sinnentstellender
 886   Trennungen (siehe auch \regelref{enum:tradSinn}).  Trennstellen, die
 887   in einem Abstand von zwei Lauten auf eine Wortfuge mit Anwendung der
 888   Dreikonsonantenregel folgen, werden daher grundsätzlich unterdrückt.
 889
 890   \begin{tabular}[t]{lTUU}
 891     \lstinline[style=LaTeX]+Metallegierung+ & Me-tallegie-rung & Metall-legierung & Metalle-gierung\\
 892     \lstinline[style=LaTeX]+schnellebige+ & schnellebi-ge & schnell-lebige & schnelle-bige\\
 893     \lstinline[style=LaTeX]+Stilleben+ & Stilleben & Still-leben & Stille-ben\\
 894   \end{tabular}
 895   \par\nobreak
 896   \textit{auch:}
 897
 898   \begin{tabular}[t]{lTUU}
 899     \lstinline[style=LaTeX]+Abfallager+ & Ab-fallager & Abfall-lager & Abfalla-ger\\
 900     \lstinline[style=LaTeX]+Zellstoffabrik+ & Zell-stoffabrik & Zellstoff-fabrik & Zellstoffa-brik\\
 901   \end{tabular}
 902
 903   Das Paket \Paket{Babel} stellt verschiedene Kürzel zur Verfügung,
 904   u.\,a. \lstinline[style=LaTeX]+"ck+%
 905   \footnote{Spezialtrennungen werden in \hologo{TeX} mit Hilfe des
 906     Kommandos \lstinline[style=LaTeX]+\\discretionary+ kodiert.  So
 907     wird zum Beispiel das \Paket{Babel}-Kürzel
 908     \lstinline[style=LaTeX]+\"ck+ in der Eingabe während der
 909     Kompilation durch
 910     \lstinline[style=LaTeX]+\\discretionary\{k-\}\{k\}\{ck\}+ ersetzt,
 911     wodurch \emph{k-k}-Trennungen möglich werden.}
 912 %
 913   oder \lstinline[style=LaTeX]+"ff+ \emph{etc.}, mit denen
 914   Spezialtrennungen im Quelldokument ausgezeichnet werden können
 915   (siehe auch \autoref{tab:trennung-dreik}).  Das Alternativpaket
 916   \Paket{Polyglossia} stellt diese Kürzel ebenfalls zur Verfügung,
 917   falls beim Laden der deutschen Sprache (in der Regel mit dem Befehl
 918   \lstinline[style=LaTeX]+\setmainlanguage+) die Option
 919   \lstinline[style=LaTeX]+babelshorthands=true+ angegeben wird.
 920
 921   \hologo{LuaTeX}%
 922   \footnote{\url{http://www.luatex.org/}}
 923 %
 924   soll in einer zukünftigen Version Mechanismen zur automatischen
 925   Behandlung von Spezialtrennungen bereitstellen.  Eine physische
 926   Auszeichnung im Quelltext ist dann nicht mehr erforderlich.  Die
 927   entsprechenden Spezialtrennmuster für die deutsche Sprache werden
 928   ebenfalls im Rahmen dieses Projekts erstellt.
 929
 930 \end{enumerate}
 931
 932 \subsection{Traditionelle Rechtschreibung in der Schweiz}
 933 \label{sec:tradchRS}
 934
 935 Die Trennmuster für die traditionelle Rechtschreibung in der Schweiz
 936 folgen weitgehend den Konventionen für die traditionelle
 937 Rechtschreibung in Deutschland (siehe \autoref{sec:tradRS}).  Die
 938 folgende Liste enthält daher nur Fälle, in denen davon abgewichen wird
 939 oder deren Beschreibung aus anderen Gründen sinnvoll erscheint.
 940
 941 \begin{enumerate}[\hspace{1em}\itshape{TS}1]
 942 \labelformat{enumi}{\textit{TS#1}}
 943
 944 \item\label{enum:tradchEszett} Wörter mit \emph{ß} werden gemäß den
 945   Regeln für die traditionelle Rechtschreibung in Deutschland
 946   getrennt.
 947
 948 \item\label{enum:tradchSS} Abweichend von \regelref{enum:tradEszett}
 949   wird \emph{ss/SS} immer als Doppelkonsonant behandelt und
 950   gegebenenfalls getrennt:
 951
 952   \begin{tabular}[t]{T}
 953     grös-ste\\
 954     Grüs-se\\
 955     Mas-ses\\
 956   \end{tabular}
 957
 958   Beachte, wird \emph{ß} jedoch mit
 959   \lstinline[style=LaTeX]+\MakeUppercase+ durch~\emph{SS} ersetzt, so
 960   bleibt~\emph{SS} stets ungetrennt.  Die Trennung richtet sich dann
 961   nach der Schreibweise mit~\emph{ß} im Quelldokument (siehe
 962   \regelref{enum:tradchEszett}).
 963
 964 \end{enumerate}
 965
 966 \subsection{Reformierte Rechtschreibung}
 967 \label{sec:reformRS}
 968
 969 \begin{enumerate}[\hspace{1em}\itshape{R}1]
 970 \labelformat{enumi}{\textit{R#1}}
 971
 972 \item\label{enum:reformhyphenmin} Die minimale unterstützte Silbenlänge
 973   am Wortanfang und "~ende beträgt zwei Buchstaben
 974   \cite[\S~107]{amtlRegeln:2006, amtlRegeln:2006:duden}.
 975
 976   Siehe \autoref{sec:fragen} für Hinweise, wie sich diese Länge
 977   abweichend einstellen lässt.  Wird die Mindestlänge auf weniger als
 978   zwei Buchstaben verringert, so können fehlerhafte Trennungen
 979   auftreten.
 980
 981 \item\label{enum:reformEtymo} Falls die Trennung nach Sprechsilben und
 982   die etymologische (sprachgeschichtliche) Trennung kollidieren, wird
 983   weitgehend die etymologische Trennung gewählt
 984   \cite[\S~113]{amtlRegeln:2006, amtlRegeln:2006:duden}:
 985
 986   \begin{tabular}[t]{RUU}
 987 %    Heli-ko-pter & Helikop-ter\\
 988 %    in-ter-view-en & intervie-wen\\
 989     in-ter-es-sant & inte-ressant\\
 990     Lin-ole-um & Li-noleum & Lino-leum\\
 991     Päd-ago-ge & Pä-dagoge & Päda-goge\\
 992   \end{tabular}
 993
 994 \item\label{enum:reformClusterLR} In Fremdwörtern bleiben die
 995   Buchstabengruppen \emph{bl}, \emph{pl}, \emph{fl}, \emph{gl},
 996   \emph{cl}, \emph{kl}, \emph{phl}; \emph{br}, \emph{pr}, \emph{dr},
 997   \emph{tr}, \emph{fr}, \emph{vr}, \emph{gr}, \emph{cr}, \emph{kr},
 998   \emph{phr}, \emph{thr}; \emph{chth}; \emph{gn}, \emph{kn} im
 999   allgemeinen ungetrennt, nicht jedoch \emph{str}
1000   \cite[\S~112]{amtlRegeln:2006, amtlRegeln:2006:duden}
1001   i.\,V.\,m.~\cite[R~179]{duden:1991}:
1002
1003   \begin{tabular}[t]{RU}
1004     Ar-thri-tis & Arth-ritis\\
1005 %    Co-gnac & Cog-nac\\
1006     Di-plom & Dip-lom\\
1007 %    Fe-bru-ar & Feb-ruar\\
1008     igno-rie-re & ig-noriere\\
1009     In-te-gral & Integ-ral\\
1010   \end{tabular}
1011   \par\nobreak
1012   \textit{aber:}
1013
1014   \begin{tabular}[t]{RUU}
1015     In-dus-trie & Indu-strie & Indust-rie\\
1016 %    Ma-gis-tra-le & Magi-strale\\
1017     de-struk-tiv\\
1018     sub-lim\\
1019   \end{tabular}
1020
1021 \item\label{enum:reformSinn} Sinnentstellende und irreführende
1022   Trennungen werden möglichst vermieden \cite[\S~107]{amtlRegeln:2006,
1023     amtlRegeln:2006:duden}:
1024
1025   \begin{tabular}[t]{RU}
1026     An-alpha-bet & Anal-phabet\\
1027     Kaf-ka-kenner & Kafkaken-ner\\
1028     Tal-entwäs-se-rung & Talent-wässerung\\
1029   \end{tabular}
1030
1031 \item\label{enum:reformDoppeld} In mehrdeutigen Wörtern werden
1032   Trennungen nur an übereinstimmenden Trennstellen zugelassen:
1033
1034   % Das »@{}« entfernt den rechten Rand der Tabelle und verhindert
1035   % so eine »overfull«-Warnung.
1036   \begin{tabular}[t]{RUUU@{}}
1037     Druckerzeug-nis & Dru-ckerzeugnis & Druck-erzeugnis &
1038     Drucker-zeugnis\\
1039     Mu-sikerle-ben & Musi-kerleben & Musik-erleben & Musiker-leben\\
1040     nachtritt & nach-tritt & Nacht-ritt\\
1041     Wachstu-be & Wach-stube & Wachs-tube\\
1042   \end{tabular}
1043
1044   Beachte, die Trennstellen »Drucker-zeugnis« und »Musiker-leben«
1045   sind in den Interpretationen \emph{Druck-Erzeugnis} und
1046   \emph{Musik-Erleben} irreführend.  Sie entfallen nach
1047   \regelref{enum:reformSinn} und sind nicht als übereinstimmende
1048   Trennstellen anzusehen.
1049
1050   Für diese Regel gilt die folgende Einschränkung:
1051
1052   \begin{itemize}
1053
1054   \item Bei mehrdeutigen Wörtern endend auf \emph{"~ende},
1055     \emph{"~enden}, \emph{"~endes} wird stets die Trennung der
1056     Partizipform des Verbs verwendet.
1057
1058     \begin{tabular}[t]{RUU}
1059       fu-ßen-de & Fuß-ende & fußende\\
1060       spie-len-de & Spiel-ende & spielende
1061     \end{tabular}
1062
1063   \end{itemize}
1064
1065 \item\label{enum:reformEszett} Wird der Buchstabe~\emph{ß} durch
1066   \emph{ss/SS} ersetzt, so wird \emph{s"~s} getrennt \cite[\S\S~25~E3,
1067   110]{amtlRegeln:2006, amtlRegeln:2006:duden}:
1068
1069   \begin{tabular}[t]{R}
1070     \textls{GRÖS-STE}\\
1071     \textls{GRÜS-SE}\\
1072     \textls{M\kern-.4ptA\kern-.6ptS-SES}\\
1073   \end{tabular}
1074
1075   Wird~\emph{ß} mit \lstinline[style=LaTeX]+\MakeUppercase+ oder in
1076   Kapitälchen in~\emph{SS} gewandelt, so bleibt~\emph{SS} ungetrennt.
1077   Dies ist kein Fehler in den Trennmustern, sondern im
1078   \hologo{LaTeX}-Kern fest implementiert.
1079
1080 % \item\label{enum:reformOW} In Ableitungen von Namen auf \emph{"~ow}
1081 %   bleibt \emph{"~ow} ungetrennt, wenn es den Laut [o\,:] bezeichnet.
1082 %   Die Nottrennung der Ableitungssilben \emph{"~er}, \emph{"~ern},
1083 %   \emph{"~ers} wird unterdrückt \cite[\S~113]{amtlRegeln:2006,
1084 %     amtlRegeln:2006:duden}
1085 %   i.\,V.\,m.~\cite[R~180]{duden:1991}:
1086
1087 %   \begin{tabular}[t]{RUU}
1088 %     Tel-tower & Telto-wer & Teltow-er\\
1089 %     Trep-towern & Trepto-wern & Treptow-ern\\
1090 %     Pan-kowers & Panko-wers & Pankow-ers\\
1091 %   \end{tabular}
1092
1093 \end{enumerate}
1094
1095
1096 \section{Trennfehler}
1097 \label{sec:trennfehler}
1098
1099 Mit den vorliegenden Trennmustern können sämtliche Wörter der
1100 zugrundeliegenden Wortliste fehlerfrei getrennt werden.  Technisch
1101 gesprochen endet der letzte \Programm{patgen}-Lauf mit der Meldung
1102
1103 \begin{lstlisting}[style=shell]
1104   1783028 good, 0 bad, 0 missed
1105   100.00 %, 0.00 %, 0.00 %
1106 \end{lstlisting}
1107
1108 \noindent (der Wert vor \lstinline[style=shell]+good+ ist vom
1109 Listenumfang abhängig).  Trotz des großen Umfangs der Wortliste lassen
1110 sich Trennfehler in Wörtern, die nicht in der Liste enthalten sind,
1111 nicht vermeiden.  Der Umfang der Wortliste kann allerdings nicht
1112 beliebig erweitert werden.%
1113 \footnote{Liangs Schema sieht nur einen begrenzten Bereich für die
1114   Trennstellenbewertungen vor (0--9).  Die derzeitigen Trennmuster
1115   vewenden Bewertungen bis zur Höhe~7.}
1116 %
1117 In den folgenden Fällen sollten fehlerhafte Trennungen der Trennmuster
1118 jedoch gemeldet werden:
1119
1120 \begin{enumerate}[\hspace{1em}A.]
1121
1122 \item\label{enum:kritWLfehlerhaft} Das Wort ist bereits in der
1123   Wortliste enthalten.  Der Eintrag ist jedoch fehlerhaft.
1124
1125 \end{enumerate}
1126
1127 Falls das Wort nicht in der Wortliste enthalten ist, bestehen sehr
1128 gute Chancen, dass es aufgenommen wird, wenn eines der folgenden
1129 Kriterien erfüllt ist:
1130
1131 \begin{enumerate}[\hspace{1em}A.]
1132   \refstepcounter{enumi}% Fortsetzung der obigen Aufzählung.
1133
1134 \item\label{enum:kritHerkTM} Das betreffende Wort wird mit den
1135   \emph{herkömmlichen} Trennmustern für die traditionelle oder
1136   reformierte Rechtschreibung korrekt getrennt.  Korrekt bedeutet
1137   hier: Nicht alle möglichen Trennstellen müssen erkannt werden; es
1138   werden jedoch in keinem Fall falsche Trennstellen ermittelt.  Zum
1139   Testen kann in \TeX\ der folgende Aufruf verwendet werden (die
1140   Ausgabe erfolgt in der \texttt{log}-Datei):
1141
1142 \begin{lstlisting}[style=LaTeX]
1143   \showhyphens{durch Leerzeichen getrennte Wörter}
1144 \end{lstlisting}
1145
1146 \item\label{enum:kritSinn} Es handelt es sich um eine orthographisch
1147   richtige, aber sinnentstellende oder irreführende Trennung.
1148   Berücksichtigt werden allerdings nur Wörter, die aus höchstens zwei
1149   (gegebenenfalls prä- und suffigierten) Wörtern zusammengesetzt sind,
1150   zum Beispiel »Talent-wässerung«.  Nicht berücksichtigt wird
1151   hingegen die »Talent-wässerungsanlage«.
1152
1153 \end{enumerate}
1154
1155 Einige bekannte Fehler in den Trennmustern sind in der Datei
1156 \Datei{CHANGES} verzeichnet.  Noch nicht bekannte falsche, fehlende
1157 und unerwünschte Worttrennungen können an die E-Mail-Adresse
1158 \href{mailto:trennmuster@dante.de}{trennmuster@dante.de} gerichtet
1159 werden.
1160
1161 Trennfehler, die in den Trennmustern nicht korrigiert werden können,
1162 können mit Hilfe einer privaten Ausnahmeliste behandelt werden:
1163
1164 \begin{lstlisting}[style=LaTeX]
1165   \hyphenation{Tal-entwäs-se-rungs-an-la-ge Kaf-ka-kenner-klub}
1166 \end{lstlisting}
1167
1168 Die aktuelle und ältere Ausgaben der Trennmuster sind im Dateibereich
1169 des Trennmuster-Wikis erhältlich.%
1170 \footnote{\url{https://wiki.dante.de/doku.php?id=trennmuster:trennmuster}}
1171 %
1172 Im Entwicklerrepositorium\footnote{%
1173   siehe \url{https://wiki.dante.de/doku.php?id=trennmuster:projekt-trennmuster}}
1174 befindet sich ein Makefile, mit dem jederzeit neue Trennmuster erzeugt
1175 werden können.
1176
1177 \nobreak
1178 \noindent\parbox{\linewidth}{%
1179   \vspace*{\baselineskip}
1180   \raggedright
1181   \itshape
1182   Happy \TeX ing!\newline
1183   Die deutschsprachige Trennmustermannschaft
1184 }
1185
1186
1187 \begingroup
1188   \RaggedRight
1189   \bibliography{dehyph-exptl}
1190 \endgroup
1191
1192
1193 \appendix
1194 \section{Dateien und Installation}
1195 \label{sec:installation}
1196
1197 Die eigentlichen Trennmusterdateien liegen in \Abk{utf-8}"=Kodierung
1198 vor (siehe \autoref{tab:dateien}, Endung \texttt{.pat}).  Sie werden
1199 von \hologo{TeX} nicht direkt geladen, sondern durch Manteldateien,
1200 die ebenfalls Teil des Pakets sind (Endung \texttt{.tex}).  Wird eine
1201 8-Bit-fähige \hologo{TeX}"=Variante erkannt, übernehmen diese
1202 Manteldateien die Konvertierung der Trennmuster in die
1203 \Abk{t1}-Kodierung.
1204
1205 \begin{table}
1206   \centering
1207   \caption{Trennmuster- und Manteldateien}
1208   \label{tab:dateien}
1209   \begin{tabular}{l>{\ttfamily}l>{\ttfamily}l}
1210     Rechtschreibung & \normalfont Trennmusterdatei & \normalfont Manteldatei\\
1211     \addlinespace\toprule\addlinespace
1212     traditionell & dehypht-x-<datum>.pat & dehypht-x-<datum>.tex\\
1213     traditionell (Schweiz) & dehyphts-x-<datum>.pat & dehyphts-x-<datum>.tex\\
1214     reformiert & dehyphn-x-<datum>.pat & dehyphn-x-<datum>.tex\\
1215   \end{tabular}
1216 \end{table}
1217
1218 Bei der Installation werden die Manteldateien an die in
1219 \autoref{tab:varietaeten} gezeigten Trennmusterbezeichner gebunden.
1220 Diese Schritte werden für verschiedene \hologo{TeX}"=Verteilungen in
1221 der Datei \Datei{INSTALL} beschrieben.  Nach der Installation können
1222 die experimentellen Trennmuster wie in \autoref{sec:aktivieren}
1223 gezeigt verwendet werden.
1224
1225
1226 \section{Fragen \& Antworten}
1227 \label{sec:fragen}
1228
1229 \newcommand*{\fragefont}{\itshape}
1230 \newcommand*{\themenfont}{\large\normalfont}
1231 \newcounter{cntfrage}% Zähler für Fragen.
1232 \newcounter{thema}% Zähler für Themenüberschriften.
1233 \renewcommand*{\thethema}{\Roman{thema}.}
1234 \newcounter{frage}% Zähler für Fragen.
1235 \renewcommand*{\thefrage}{\arabic{frage}.}
1236 \newboolean{nextfrage}
1237
1238 \makeatletter
1239
1240 %%% Neue zref-Liste frage = (type, text, anchor).
1241 \zref@newlist{frage}
1242 \zref@newprop{type}{f}
1243 \zref@newprop{text}{??}
1244 \zref@addprop{frage}{type}
1245 \zref@addprop{frage}{text}
1246 \zref@addprop{frage}{anchor}
1247
1248 %%% Fügt eine neue Themenüberschrift ein.
1249 \newcommand*{\fragenthema}[1]{%
1250   \par
1251   \pagebreak[1]
1252   \vspace{1.5\baselineskip plus .6\baselineskip minus .6\baselineskip}
1253   \refstepcounter{cntfrage}
1254   \stepcounter{thema}
1255   \zref@setcurrent{type}{t}
1256   \zref@setcurrent{text}{\thethema~#1}
1257   \zref@labelbylist{frage:\thecntfrage}{frage}
1258   \noindent{\themenfont\thethema~#1\par}
1259 }
1260
1261 %%% Umgebung für eine Frage mit Antwort.
1262 \newenvironment{frageantwort}[1]{%
1263   \par
1264   \vspace{.25\baselineskip plus .1\baselineskip minus .1\baselineskip}
1265   \refstepcounter{cntfrage}
1266   \stepcounter{frage}
1267   % bei Aufzählungen innerhalb einer Frage römisch nummerieren
1268   \renewcommand{\labelenumi}{\roman{enumi}.}
1269   \zref@setcurrent{type}{f}
1270   \zref@setcurrent{text}{\thefrage~#1}
1271   \zref@labelbylist{frage:\thecntfrage}{frage}
1272   \noindent{\fragefont\thefrage~#1\par}
1273   \nobreak\noindent\ignorespaces
1274 }{%
1275   \vspace{.25\baselineskip plus .1\baselineskip minus .1\baselineskip}
1276 }
1277
1278 %%% Zeige alle Fragen in sortierter Reihenfolge.
1279 \newcommand{\zeigefragen}{%
1280   \par
1281   \zref@refused{frage:1}
1282   \setcounter{cntfrage}{1}
1283   \setboolean{nextfrage}{true}
1284   \whiledo{\boolean{nextfrage}}{
1285     \vspace{.25\baselineskip plus .1\baselineskip minus .1\baselineskip}
1286     \ifthenelse{\equal{\zref@extract{frage:\thecntfrage}{type}}{f}}{% Frage
1287       \noindent%
1288       \begingroup%
1289         \fragefont%
1290         \hyperlink{\zref@extract{frage:\thecntfrage}{anchor}}{%
1291           \zref@extract{frage:\thecntfrage}{text}%
1292         }%
1293         \par
1294       \endgroup
1295     }{% Themenüberschrift
1296       \noindent%
1297       \begingroup%
1298         \themenfont%
1299         \zref@extract{frage:\thecntfrage}{text}%
1300         \par
1301       \endgroup
1302       \nobreak
1303     }
1304     \stepcounter{cntfrage}
1305     \zref@ifrefundefined{frage:\thecntfrage}{\setboolean{nextfrage}{false}}{}
1306   }
1307   \vspace{.5\baselineskip plus .1\baselineskip minus .1\baselineskip}
1308   \setcounter{cntfrage}{0}
1309   \setcounter{frage}{0}
1310 }
1311
1312
1313 \zeigefragen
1314
1315
1316 \fragenthema{Verwenden der Trennmuster}
1317
1318 \begin{frageantwort}{Wie kann für die experimentellen Trennmuster aus
1319     dem Paket \Paket{dehyph-exptl} das Datum ermittelt werden, das
1320     Teil des Trennmusterbezeichners ist, wie in
1321     \autoref{sec:verwenden} erwähnt?}
1322
1323   Die Trennmusterbezeichner werden in der Datei \Datei{language.dat}
1324   definiert, wo auch die Verbindung zu den Manteldateien hergestellt
1325   wird.  Da ein Teil der Trennmusterbezeichner bereits bekannt ist,
1326   \verb+german-x+, vgl. \autoref{tab:varietaeten}, kann die Datei
1327   \Datei{language.dat} danach durchsucht werden.  Zunächst muss der
1328   Ort der Datei mit Hilfe des Kommandos \Programm{kpsewhich} ermittelt
1329   werden.  Es folgen die vollständigen Kommandos für unixähnliche
1330   Shells und die Windows-Kommandozeile \Datei{cmd.exe} (einzugeben
1331   ohne Zeilenumbruch).  Achtung, bei den einfachen Anführungszeichen
1332   handelt es sich um Gravis (»Backquotes«).
1333
1334 \begin{lstlisting}[style=shell, caption=Shell]
1335   grep -i german-x `kpsewhich language.dat`
1336 \end{lstlisting}
1337
1338 \begin{lstlisting}[style=shell, caption=\Datei{cmd.exe}]
1339   for /F "usebackq" %f in (`kpsewhich language.dat`)
1340     do find /i "german-x" "%f"
1341 \end{lstlisting}
1342
1343   Die Ausgabe dieser Kommandos sieht etwa wie folgt aus (das Datum
1344   kann abweichen):
1345
1346 \begin{lstlisting}
1347   german-x-2024-02-28 dehypht-x-2024-02-28.tex
1348   =german-x-latest
1349   ngerman-x-2024-02-28 dehyphn-x-2024-02-28.tex
1350   =ngerman-x-latest
1351 \end{lstlisting}
1352
1353   Die gesuchten Trennmusterbezeichner befinden sich in der ersten
1354   Spalte und lauten in diesem Beispiel
1355   \lstinline[style=LaTeX]{german-x-2024-02-28} und
1356   \lstinline[style=LaTeX]{ngerman-x-2024-02-28}.  In der zweiten
1357   Spalte kann man die Namen der Manteldateien erkennen
1358   (vgl. \autoref{tab:dateien}).  Die mit einem Gleichheitszeichen
1359   beginnenden Zeilen definieren ein Synonym für den
1360   Trennmusterbezeichner der unmittelbar vorangehenden Zeile in der
1361   Datei \Datei{language.dat}.
1362 \end{frageantwort}
1363
1364
1365 \begin{frageantwort}{Wie kann die Version der experimentellen Muster
1366     ermittelt werden, die im Paket \Paket{hyph-utf8} enthalten sind?}
1367
1368   Das Vorgehen ähnelt dem der vorherigen Antwort.  Zunächst wird der
1369   Ort einer bestimmten Datei ermittelt.  Diese wird dann nach einer
1370   hilfreichen Zeichenkette durchsucht.
1371
1372 \begin{lstlisting}[style=shell, caption=Shell]
1373   grep dehyph `kpsewhich hyph-de-1996.tex`
1374 \end{lstlisting}
1375
1376 \begin{lstlisting}[style=shell, caption=\Datei{cmd.exe}]
1377   for /F "usebackq" %f in (`kpsewhich hyph-de-1996.tex`)
1378     do find "dehyph" "%f"
1379 \end{lstlisting}
1380
1381   Die Ausgabe dieser Kommandos sieht etwa wie folgt aus (das Datum
1382   kann abweichen):
1383
1384 \begin{lstlisting}
1385   \message{German Hyphenation Patterns (Reformed Orthography, 2006)
1386     `dehyphn-x' 2024-02-28 (WL)}
1387 \end{lstlisting}
1388 \end{frageantwort}
1389
1390 \begin{frageantwort}{Wie kann die Version der experimentellen Muster
1391     ermittelt werden, die von \hologo{ConTeXt} verwendet werden?}
1392
1393   Derzeit (Stand Februar 2021) gibt es keine Möglichkeit, die Version direkt
1394   zu ermitteln.  Allerdings werden die \hologo{ConTeXt}-Muster automatisch
1395   aus den vorhandenen \Paket{hyph-utf8}-Mustern erzeugt; die Versionen sind
1396   daher ident zu den in \hologo{XeTeX} verwendeten Mustern.
1397 \end{frageantwort}
1398
1399 \begin{frageantwort}{Ich habe neue Trennmuster erstellt. Wie kann ich diese
1400 installieren?}
1401
1402   Die folgende Antwort richtet sich an Nutzer von \hologo{TeX} Live, die auf
1403   ihrem System über Administrationsrechte verfügen.
1404
1405   \begin{enumerate}
1406
1407   \item Überprüfen Sie, ob auf Ihrem System das Verzeichnis
1408   \Datei{TEXMFLOCAL\slash tex\slash generic\slash config}
1409   existiert.\footnote{Bei \Datei{TEXMFLOCAL} handelt es sich um den lokalen
1410   Baum der \hologo{TeX}-Installation, unter Unix in der Regel
1411   \Datei{/usr/local/texlive/texmf-local}, unter Windows \Datei{C:\textbackslash
1412   texlive\textbackslash texmf-local}.} Falls nicht, legen Sie es an.
1413
1414   \item Überprüfen Sie, ob im Verzeichnis \Datei{TEXMFLOCAL\slash tex\slash
1415   generic\slash config} die Dateien \Datei{language-local.dat} und
1416   \Datei{language-local.def} existieren. Falls nicht, legen Sie sie an.
1417
1418   \item Ergänzen Sie in der Datei \Datei{language-local.def} die folgende
1419   Zeile:\footnote{Als Vorbild für die erforderlichen Angaben können die
1420   vorhandenen Eintragungen in den Konfigurationsdateien \Datei{language.def}
1421   und \Datei{language.dat} der \hologo{TeX}-Installation dienen.}
1422
1423 \begin{lstlisting}[style=LaTeX]
1424   \addlanguage{<Name>}{<Datei>}{<Ausnahmedatei>}{<lmin>}{<rmin>}
1425 \end{lstlisting}
1426
1427   \noindent Dabei ist \texttt{<Name>} eine selbstgewählte Bezeichnung für die
1428   Trennmuster, \texttt{<Datei>} der Name der Trennmusterdatei bzw. der
1429   Manteldatei, wenn es eine solche gibt (vgl. \autoref{sec:installation}),
1430   \texttt{<Ausnahmedatei>} ggf. eine Datei mit Trennausnahmen (ansonsten leer),
1431   \texttt{<lmin>} die Mindestlänge einer am Wortanfang und
1432   \texttt{<rmin>} die Mindestlänge einer Wortende abgetrennten
1433   Silbe. Für deutsche Trennmuster setzt man die beiden letztgenannten Werte
1434   typischerweise auf \texttt{2}.
1435
1436   Ergänzen Sie entsprechend in der Datei \Datei{language-local.dat} die
1437   folgende Zeile:
1438
1439 \begin{lstlisting}
1440   <Name> <Datei>
1441 \end{lstlisting}
1442
1443   \item Verschieben Sie Ihre Trennmusterdateien in das Verzeichnis
1444   \Datei{TEXMFLOCAL\slash tex\slash generic}.
1445
1446   \item Führen Sie \emph{als Administrator} die Befehle
1447
1448 \begin{lstlisting}[style=shell]
1449   mktexlsr
1450 \end{lstlisting}
1451
1452   \noindent und
1453
1454 \begin{lstlisting}[style=shell]
1455   tlmgr generate --rebuild-sys language
1456 \end{lstlisting}
1457
1458   \noindent aus.
1459
1460   \end{enumerate}
1461
1462   Die so installierten Trennmuster können nun den Hinweisen in
1463   \autoref{sec:aktivieren} entsprechend aktiviert werden.
1464 \end{frageantwort}
1465
1466 \begin{frageantwort}{Um in bestimmten Dokumenten einen dauerhaft stabilen
1467 Umbruch zu erreichen, will ich verhindern, dass die zur Zeit vorhandenen
1468 Trennmuster bei einer Aktualisierung der \hologo{TeX}-Installation verloren
1469 gehen. Wie gehe ich vor?}
1470
1471   Suchen Sie auf Ihrem System nach der benötigten Trennmusterdatei und der
1472   zugehörigen Manteldatei gemäß \autoref{tab:dateien} und erstellen Sie Kopien
1473   dieser Dateien. Folgen Sie dann den Anweisungen der Antwort auf die vorige
1474   Frage.
1475
1476 \end{frageantwort}
1477
1478
1479 \fragenthema{Rechtschreibung}
1480
1481 \begin{frageantwort}{Verlag, Prüfer o.\,ä. bemängeln die Trennung der
1482     Trennmuster für die reformierte Rechtschreibung.  Zum Beispiel
1483     wird »In-dus-trie« getrennt, der Duden trennt jedoch
1484     »In-dust-rie«.}
1485
1486   Die amtlichen Regeln für die Rechtschreibung der deutschen Sprache
1487   lassen für viele Wörter mehrere Trennvarianten zu.  Die Trennmuster
1488   und ebenso Wörterverzeichnisse legen sich aus praktischen Gründen
1489   auf eine Trennvariante fest.  Sie können daher unterschiedliche
1490   Trennungen verwenden, ohne dass eine von beiden falsch ist.  Aus
1491   diesem Grund sind Wörterverzeichnisse nicht geeignet, eine bestimmte
1492   Trennung auf Richtigkeit zu prüfen.  Verbindlich sind einzig die
1493   amtlichen Regeln für die Rechtschreibung der deutschen
1494   Sprache~\cite{amtlRegeln:2006}.  Häufig sind diese im Anhang eines
1495   Wörterbuchs abgedruckt.  Die von den Trennmustern befolgten
1496   Konventionen können \autoref{sec:trennregeln} entnommen werden.
1497
1498   Wenn Unsicherheit darüber herrscht, wie die Rechtschreibung geprüft
1499   wird, sollte dies frühzeitig geklärt werden.  Nicht jedem Redakteur
1500   oder Prüfer ist bewusst, dass der Duden seine normative Stellung mit
1501   der Rechtschreibreform~1996 eingebüßt hat.
1502 \end{frageantwort}
1503
1504
1505 \begin{frageantwort}{Gibt es dudenkonforme Trennmuster für die
1506     reformierte Rechtschreibung?}
1507
1508   Zur Zeit nicht, es ist auch nicht geplant.  Dieses Projekt ist
1509   jedoch offen für Vorschläge und Mitarbeit.
1510 \end{frageantwort}
1511
1512
1513 \begin{frageantwort}{Weshalb werden noch Trennmuster für die
1514     traditionelle Rechtschreibung bereitgestellt?}
1515
1516   Die amtlichen Regeln für die Rechtschreibung der deutschen Sprache
1517   in der Fassung von 2006 sind nur für öffentliche Einrichtungen und
1518   Behörden verbindlich.  Im privaten Schriftverkehr kann man wahlweise
1519   die traditionelle oder die reformierte Rechtschreibung verwenden.%
1520   \footnote{Oder auch keine von beiden.}
1521 %
1522   Daher erfreut sich die traditionelle Rechtschreibung weiterhin
1523   großer Beliebtheit.
1524
1525   Für Texte in gebrochener Schrift ist die traditionelle
1526   Rechtschreibung sogar vorzuziehen.
1527 \end{frageantwort}
1528
1529 \begin{frageantwort}{In der Voreinstellung für die deutsche Sprache
1530     beträgt die Mindestlänge abgetrennter Silben zwei Buchstaben. Wie
1531     kann diese Mindestlänge verändert werden?}
1532
1533   Nehmen wir an, am Wortanfang sollen nicht weniger als drei und am
1534   Wortende nicht weniger als vier Buchstaben abgetrennt werden.  Dann
1535   sind folgende Befehle nötig:
1536
1537   \begin{itemize}
1538   \item Mit Plain-\hologo{TeX}:
1539
1540 \begin{lstlisting}[style=LaTeX]
1541   \uselanguage{<sprache>}
1542   \lefthyphenmin=3
1543   \righthyphenmin=4
1544 \end{lstlisting}
1545
1546     Ersetze dabei \texttt{<sprache>} durch eine der in
1547     \autoref{subsubsec:PlainTeX} erwähnten Trennmusterbezeichnungen,
1548     beispielsweise \texttt{ngerman}.
1549
1550   \item Mit \hologo{LaTeX} und \Paket{Babel}:
1551
1552 \begin{lstlisting}[style=LaTeX]
1553   \usepackage[<sprache>]{babel}
1554   \renewcommand*{\<sprache>hyphenmins}{34}
1555 \end{lstlisting}
1556
1557     Ersetze dabei \texttt{<sprache>} durch eine der in
1558     \autoref{subsubsec:LaTeX+Babel} erwähnten
1559     \Paket{Babel}-Sprachbezeichnungen, beispielsweise
1560     \texttt{ngerman}.
1561
1562   \item Mit \hologo{XeLaTeX}/\hologo{LuaLaTeX} und
1563     \Paket{Polyglossia} (Version 1.50 oder neuer):
1564
1565 \begin{lstlisting}[style=LaTeX]
1566   \usepackage{polyglossia}
1567   \setmainlanguage{german}
1568   \setlanghyphenmins[<option>]{<sprache>}{3}{4}
1569 \end{lstlisting}
1570
1571     Ersetze dabei \texttt{<option>} und \texttt{<sprache>} durch eine der in
1572     \autoref{subsubsec:LaTeX+PolyGlossia} erwähnten
1573     \Paket{Polyglossia}-Sprachbezeichnungen, beispielsweise
1574     \texttt{spelling=old} und \texttt{german}.
1575   \end{itemize}
1576 \end{frageantwort}
1577
1578 \begin{frageantwort}{Können Trennungen mit einer Silbenlänge von nur
1579     einem Buchstaben ermöglicht werden, zum Beispiel für den Satz in
1580     schmalen Kolumnen?}
1581
1582   Mit diesen Trennmustern ist das nicht möglich.  Die
1583   Abtrennung einzelner Vokale, zum Beispiel »A-bend«, war nur
1584   kurzzeitig zulässig; die entsprechende Regelung von 1996 wurde mit
1585   der Rechtschreibreform 2006 wieder zurückgenommen.  Wird die
1586   Silbenmindestlänge für die Worttrennung auf eins verringert, können
1587   falsche Trennungen auftreten.
1588 \end{frageantwort}
1589
1590
1591 \fragenthema{Mitarbeit}
1592
1593 \begin{frageantwort}{Wie kann ich mich über dieses Projekt
1594     informieren?}
1595
1596   Zentrale Anlaufstelle ist das Trennmuster-Wiki, welches sich
1597   momentan jedoch noch im Aufbau befindet.%
1598   \footnote{\url{https://wiki.dante.de/doku.php?id=trennmuster:trennmuster}}
1599 %
1600   Für Fragen und Hinweise kann nach Anmeldung die Mailingliste%
1601 %
1602   \footnote{\href{mailto:trennmuster@dante.de}{trennmuster@dante.de}}
1603 %
1604   genutzt werden.
1605
1606   \begin{itemize}
1607
1608   \item Die Datei \Datei{CHANGES} enthält bekannte, systematische
1609     Fehler der Trennmuster.
1610
1611   \item Das
1612     Entwicklerrepositorium%
1613 %
1614     \footnote{\url{https://repo.or.cz/wortliste.git/tree/HEAD:/dokumente}}
1615 %
1616     enthält im Verzeichnis \Datei{dokumente} eine Reihe von Dateien, welche
1617     u.\,a.  Trennregeln und Trennstile im Detail beschreibt.
1618
1619   \end{itemize}
1620 \end{frageantwort}
1621
1622
1623 \begin{frageantwort}{Wie kann ich helfen?}
1624
1625   Die deutschsprachige Trennmustermannschaft ist eine offene Gruppe
1626   und benötigt dringend weitere Mithilfe.  Interessenten sind daher
1627   hoch willkommen!  Zum Mitmachen gibt es mehrere Möglichkeiten:
1628
1629   \begin{itemize}
1630   \item Die einfachste ist, die experimentellen Trennmuster ausgiebig
1631     zu testen und Fehler zu melden (siehe \autoref{sec:trennfehler}).
1632
1633   \item Besonders hilfreich wäre Mitarbeit am Projekt.  Als Einstieg
1634     kann die (grobe) Aufgabenliste in der Projektbeschreibung dienen.
1635
1636     Obwohl schon experimentelle Trennmuster veröffentlicht wurden,
1637     steht dieses Projekt noch ziemlich am Anfang.  Ziel ist, die
1638     verwendete Wortliste von möglichst vielen Menschen in verteilter
1639     Arbeit auf Richtigkeit zu prüfen.  Bis dahin bleibt jedoch noch
1640     viel zu tun.
1641
1642   \item Mittelfristig -- nach Fertigstellung der Prüfmaske~-- kann
1643     auch durch systematische Durchsicht eines Teils der Wortliste
1644     geholfen werden.
1645
1646   \item Fragen, Hinweise und Ideen sind auf der Mailingliste immer
1647     willkommen!
1648   \end{itemize}
1649 \end{frageantwort}
1650
1651
1652 \begin{frageantwort}{Sollten Trennfehler einzeln oder gesammelt
1653     eingereicht werden?}
1654
1655   Das ist egal.  Es sollten allerdings die folgenden Hinweise beim
1656   Einreichen von Fehlern beachtet werden:
1657
1658   \begin{description}
1659     \setkomafont{descriptionlabel}{\normalfont\itshape}
1660
1661   \item[Aktualität] Wenn ältere Trennmusterdateien verwenden werden,
1662     bitte zuerst prüfen, ob der Fehler auch mit aktuellen Trennmustern
1663     auftritt.  Die aktuellen Trennmuster sind auf \Abk{ctan} im Paket
1664     \Paket{dehyph-exptl} oder im Dateibereich unter der
1665     Projekt-\Abk{url} erhältlich.  Im Repositorium befindet sich auch
1666     ein Makefile, mit dem jederzeit neue Trennmuster aus der aktuellen
1667     Wortliste erzeugt werden können.
1668
1669   \item[Informationen] In einem Fehlerbericht sollte für das
1670     betreffende Wort die richtige und bei einzelnen Worteinreichungen
1671     auch die falsche Trennung angegeben werden.  Außerdem die genaue
1672     Version der verwendeten Trennmuster (traditionelle oder
1673     reformierte Rechtschreibung, Datum der Trennmusterdatei).
1674
1675   \item[Listenformat] Es erleichtert die Korrektur, wenn
1676     Berichtigungsvorschläge in Form einer Liste eingereicht werden,
1677     die automatisch mit Skripten bearbeitet werden kann.  Die
1678     folgenden Konventionen sollten dabei eingehalten werden:
1679
1680     \begin{itemize}
1681     \item Die Spalten werden mit einem Semikolon \verb+;+ getrennt.
1682     \item Die erste Spalte enthält das betreffende Wort in
1683       ungetrennter Form.
1684     \item Die zweite Spalte enthält das Wort in der Trennvariante nach
1685       traditioneller Rechtschreibung.
1686     \item Falls die Trennung nach reformierter Rechtschreibung davon
1687       abweicht, steht diese in der dritten Spalte.
1688     \item Ab der vierten Spalte \emph{können} weitere Trennvarianten
1689       folgen, etwa die falsche Trennung.  Eine kurze Erklärung sollte
1690       dann darauf eingehen.
1691     \item Unerwünschte Trennungen werden mit einem Punkt \verb+.+
1692       markiert.
1693     \item Anfang und Ende der Liste sollten klar erkennbar sein.
1694     \end{itemize}
1695
1696     Eine Liste könnte beispielhaft so aussehen:
1697
1698 \begin{lstlisting}[style=Text]
1699   sonnendurchfluteten;son-nen-durch-flu-te-ten
1700   Talentwässerung;Tal-ent.wäs-se-rung
1701   Fensterplatz;Fen-ster-platz;Fens-ter-platz
1702 \end{lstlisting}
1703
1704     Dieses Format ist auch für einzeln eingereichte Korrekturen
1705     sinnvoll.
1706
1707   \item[Betreff] Der Betreff einer Fehlermeldung sollte aussagekräftig
1708     sein.  Daher sollten mehrere Trennfehler, sofern möglich,
1709     thematisch zusammengefasst werden.  Außerdem kann zur einfacheren
1710     Zuordnung das entsprechende Kriterium aus
1711     \autoref{sec:trennfehler} dem Betreff der E-Mail in eckigen
1712     Klammern vorangestellt werden, zum Beispiel:
1713
1714 \begin{lstlisting}[style=Text]
1715   Betreff: [A] sonnendurchfluteten
1716 \end{lstlisting}
1717
1718     \noindent für einen Trennfehler im Wortes
1719     \emph{sonnendurchfluteten}, der durch einen Fehler in der
1720     Wortliste hervorgerufen wird.
1721   \end{description}
1722 \end{frageantwort}
1723
1724 \end{document}
1725
1726 %%% Local Variables:
1727 %%% mode: latex
1728 %%% TeX-engine: default
1729 %%% TeX-PDF-mode: t
1730 %%% TeX-master: t
1731 %%% coding: utf-8
1732 %%% End: