s2long-s.py: Korrigiere Sonderfälle
[wortliste.git] / dehyph-exptl / dehyph-exptl.tex
blob1aaa1b30eb9869ffad40292b117f43744746a03b
1 %%% Artikelklasse mit:
2 %%% * Grundschriftgröße 11 Punkt,
3 %%% * klassischem Satzspiegel,
4 %%% * flachem Inhaltsverzeichnis,
5 %%% * Tabellenüberschriften.
6 \documentclass[11pt,
7 DIV=9,
8 toc=flat,
9 captions=tableheading,
10 abstract=on]{scrartcl}
12 \emergencystretch 1em
14 %%% Eingabekodierung ist UTF-8.
15 \usepackage[utf8]{inputenc}
17 %%% Schrifteinstellung:
18 %%% * Grundschrift Palatino,
19 %%% * Akzidenzschrift Bera Sans,
20 %%% * Schreibmaschinenschrift Latin Modern Typewriter.
21 \usepackage[T1]{fontenc}
22 \usepackage[osf]{mathpazo}
23 \usepackage[scaled=0.85]{berasans}
24 \renewcommand*{\ttdefault}{lmtt}
25 \usepackage{textcomp}
27 \linespread{1.1}
28 \usepackage[expansion=true,
29 letterspace=80]{microtype}
31 %%% Lade einige Pakete.
32 \usepackage{ifthen}
33 \usepackage{calc}
34 \usepackage{multicol}
35 \usepackage{paralist}
36 \usepackage{fncylab}
37 \usepackage{tabularx}
38 \usepackage{booktabs}
39 \usepackage{ragged2e}
40 \usepackage{hologo}
41 \usepackage[defaultlines=4,
42 all]{nowidow}
44 \newcolumntype{L}{>{\raggedright\arraybackslash}X}
46 \usepackage{listings}
47 \lstloadlanguages{[LaTeX]TeX, sh}
48 \lstset{
49 basicstyle=\ttfamily,
50 keywordstyle={},
51 commentstyle={},
52 columns=flexible,
53 showspaces=false,
54 showstringspaces=false,
55 % frame=tb,
56 % framesep=8pt,
57 % framerule=2pt,
58 xleftmargin=6pt,
59 xrightmargin=6pt,
60 % framexleftmargin=6pt,
61 % framexrightmargin=6pt,
62 inputencoding=utf8,
63 extendedchars=true,
64 literate={ä}{{\"a}}1 {ö}{{\"o}}1 {ü}{{\"u}}1,
66 \lstdefinestyle{LaTeX}{
67 language=[LaTeX]TeX,
68 basicstyle=\ttfamily,
69 keywordstyle={},
70 commentstyle={\itshape}
72 \lstdefinestyle{shell}{
73 language=sh,
74 basicstyle=\ttfamily,
75 keywordstyle={},
76 commentstyle={\itshape},
77 upquote=true % Gravis korrekt anzeigen
79 \lstdefinestyle{Text}{
80 language=,
81 basicstyle=\ttfamily,
82 keywordstyle={},
83 commentstyle={}
86 \usepackage{needspace}
88 %%% Literaturverweise in runden Klammern mit Semikolon als Trenner.
89 % \usepackage[round,semicolon]{natbib}
90 % \renewcommand*{\bibnumfmt}[1]{(#1)}
92 %%% Literaturverzeichnis mit Sprachunterstützung.
93 \usepackage[fixlanguage]{babelbib}
94 \bibliographystyle{babalpha}
95 %%% Babelbib fordert trotz fixlanguage zuviele Sprachen an.
96 \usepackage[english,
97 german,
98 ngerman]{babel}
99 \usepackage[ngerman=ngerman-x-latest]{hyphsubst}
101 %%% Einstellungen für interaktive PDF-Dokumente.
102 \usepackage[rgb,x11names]{xcolor}
103 \usepackage[hyperref]{zref}
104 \usepackage{hyperref}
105 \hypersetup{
106 pdftitle={dehyph-exptl},
107 pdfauthor={Die deutschsprachige Trennmustermannschaft},
108 pdfkeywords={TeX,
109 deutsche Rechtschreibung,
110 Trennmuster,
111 computergestützte Worttrennung}
113 \hypersetup{
114 ngerman,% Für \autoref.
115 pdfstartview={XYZ null null null},% Viewer bestimmt Zoomfaktor.
116 colorlinks,
117 linkcolor=RoyalBlue3,
118 urlcolor=Chocolate4,
119 citecolor=DeepPink2
121 \newcommand*{\regelref}[1]{%
122 \begingroup
123 \renewcommand*{\Itemautorefname}{Regel}%
124 \autoref{#1}%
125 \endgroup%
128 %%% Schriftfestlegungen.
129 \setkomafont{title}{\normalcolor\normalfont}
130 \setkomafont{sectioning}{\normalcolor\normalfont}
131 \setkomafont{section}{\Large}
132 \setkomafont{subsection}{\Large\itshape}
133 \setkomafont{descriptionlabel}{\normalfont\itshape}
135 %%% Einige Makros für logische Auszeichnungen definieren.
136 \newcommand*{\Abk}[1]{\mbox{\textsc{\lsstyle#1}}}
137 \newcommand*{\Paket}[1]{\textsf{#1}}
138 \newcommand*{\Programm}[1]{\lstinline[style=shell]{#1}}
139 \newcommand*{\Datei}[1]{\texttt{#1}}
141 \colorlet{falschcol}{red!80!black}
142 \colorlet{tradcol}{green!50!black}
143 \colorlet{reformcol}{green!75!black}
144 \colorlet{unerwcol}{red!60!black}
146 \newcolumntype{T}{>{\color{tradcol}}l}
147 \newcolumntype{R}{>{\color{reformcol}}l}
148 \newcolumntype{U}{>{\color{unerwcol}}l}
150 \newcommand*{\trennung}[2]{%
151 \makebox[0pt][l]{%
152 \color{#1}%
153 \smash{\rule[-3.5pt]{\widthof{#2}}{.7pt}}% Schriftabhängig.
157 \newcommand*{\ftr}[1]{\trennung{falschcol}{#1}}% Falsche Trennung.
159 %%% Satzspiegel erneut berechnen.
160 \typearea{last}
163 %%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
165 \begin{document}
167 %%% Trennausnahmen definieren.
168 \hyphenation{
169 Back-end
170 hyph-subst
171 Ent-wick-ler-re-po-si-to-ri-um
172 Wort-her-kunft
173 Not-tren-nung
174 Trenn-al-go-rith-mus
175 um-bruch-in-kom-pa-tib-le
178 %%% Protokollierung der Trennungen für findhyph.
179 %\tracingparagraphs=1
181 %%% Dokumenttitel.
182 \author{Die deutschsprachige Trennmustermannschaft}
183 \title{\Paket{dehyph-exptl}\thanks{This document describes the
184 \Paket{dehyph-exptl} package v0.9.}}
185 \subtitle{Experimentelle Trennmuster für die deutsche Sprache}
186 \maketitle
188 %%% Zweisprachige Zusammenfassung.
189 \selectlanguage{english}
190 \begin{abstract}
191 This document describes the experimental hyphenation patterns for
192 the German language, covering traditional and reformed orthography
193 for several varieties of Standard German. When using
194 \hologo{XeTeX}/\hologo{LuaTeX}, these patterns are used
195 automatically. In other cases, they have to be loaded explicitly.
196 More information can be found in the Trennmuster-Wiki%
197 \footnote{\url{https://projekte.dante.de/Trennmuster}} (in German).
198 \end{abstract}
200 \selectlanguage{ngerman}
201 \begin{abstract}
202 Dieses Dokument beschreibt die experimentellen Trennmuster für die
203 deutsche Sprache, die das in Deutschland, Österreich und der Schweiz
204 gebräuchliche Standarddeutsch in der traditionellen und reformierten
205 Rechtschreibung abdecken. Bei Nutzung von
206 \hologo{XeTeX}/\hologo{LuaTeX} werden diese Muster automatisch
207 verwendet; in anderen Fällen müssen sie i.\,d.\,R. ausdrücklich
208 geladen werden.
209 \end{abstract}
211 \vfill
212 \begingroup
213 \em\large
215 \begin{center}
216 Warnung!
217 \end{center}
219 Diese Trennmuster befinden sich im experimentellen Status. Sie können
220 auf \Abk{ctan} und in den \hologo{TeX}"=Verteilungen jederzeit
221 durch umbruchinkompatible aktualisierte Versionen ersetzt werden. Für
222 Anwendungen, die einen dauerhaft stabilen Umbruch erfordern, sind sie
223 nur geeignet, falls manuell eine feste Version installiert wird.
224 \endgroup \vfill
226 \clearpage
227 %%% Zweispaltiges Inhaltsverzeichnis.
228 \begin{multicols}{2}
229 \RaggedRight
230 \small
231 \selectlanguage{ngerman}
232 \tableofcontents
233 \end{multicols}
236 \section{Einleitung}
237 \label{sec:einleitung}
239 Der in \hologo{TeX} implementierte Trennalgorithmus arbeitet
240 musterbasiert~\cite{liang:1983}. Prinzipiell können mit einem solchen
241 Algorithmus nicht alle möglichen Wörter korrekt getrennt werden. Die
242 Qualität der Worttrennung einer Sprache wird jedoch maßgeblich von der
243 Qualität der Wortliste beeinflusst, aus der die verwendeten
244 Trennmuster berechnet wurden.
246 Obwohl die herkömmlichen Trennmuster für die deutsche Sprache bei der
247 Worttrennung in gewöhnlichen Texten eine akzeptable Fehlerrate
248 erreichen, enthalten sie doch eine Reihe von Schwächen:%
249 \footnote{Diese Liste bezieht sich auf die Trennmusterdateien
250 \Datei{dehypht.tex}, Version~3.2a vom 3.\,3.\,1999, und
251 \Datei{dehyphn.tex}, Version~31 vom 7.\,5.\,2001.}
253 \bigskip\smallskip
254 \needspace{4\baselineskip}
255 \noindent\textit{traditionelle und reformierte Rechtschreibung}
257 \begin{itemize}
258 \item In zusammengesetzten Wörtern treten häufig Trennfehler an
259 Wortfugen auf.
261 \item Fremdwörter mit akzentuierten Buchstaben werden mangelhaft
262 getrennt: »C\ftr{af}é«, »Ci-tr\ftr{}n«, »F\ftr{}on«,
263 »vo\ftr{il}à«.
265 \item Die Trennmusterdateien enthalten eine Mischung aus \Abk{t1}-
266 sowie unvollständigen \Abk{ot1}-kodierten Mustern. Mit Erscheinen
267 von 16-Bit"=fähigen \hologo{TeX}"=Varianten werden sauber
268 \Abk{utf-8}"=kodierte Trennmuster nötig~\cite{miklavec:2008}.
269 \end{itemize}
271 \bigskip
272 \needspace{4\baselineskip}
273 \noindent\textit{traditionelle Rechtschreibung}
275 \begin{itemize}
276 \item Die herkömmlichen Trennmuster für die traditionelle deutsche
277 Rechtschreibung können mit \Programm{patgen} nicht reproduziert
278 werden, da die zugrundeliegende Wortliste verschollen ist. Die
279 Pflege der Trennmuster ist daher schwierig bis unmöglich. Für freie
280 Software ist dies kein zufriedenstellender Zustand.
282 \item Umfang und Qualität der ursprünglichen Wortliste lassen sich
283 nicht mehr einschätzen. Für die Trennmuster in traditioneller
284 Rechtschreibung existiert jedoch inzwischen eine Ausnahmeliste mit
285 über 3500 korrigierten Trennungen einfacher Wörter
286 \cite{lemberg:2003, lemberg:2005}.%
287 \footnote{\url{https://mirrors.ctan.org/language/hyphenation/dehyph/dehyphtex.tex}}
289 \item Wird in der traditionellen Rechtschreibung \emph{ß} durch
290 \emph{ss/SS} oder \emph{sz/SZ} ersetzt, so bleibt die Trennung davon
291 unberührt. Die herkömmlichen Trennmuster berücksichtigen diese
292 Regel nicht und trennen häufig den Ersatz:
293 \textls{»GR\ftr{ÖS"~S}}, \textls{»GR\ftr{ÜS"~S}},
294 \textls{»M\ftr{AS"~S}ES«}.%
295 \footnote{Die Trennung der herkömmlichen Muster entspricht den
296 Regeln der deutschen Standardsprache in der Schweiz, obwohl diese
297 Sprachvarietät vom Paket \Paket{Babel} bis 2013 nicht offiziell
298 unterstützt wurde. \Paket{Babel} versucht den Mangel mit Hilfe
299 des Kürzels \lstinline[style=LaTeX]+\"S+ zu kompensieren.}
301 \item Abweichende Schreibweisen, die in der traditionellen
302 Rechtschreibung in Österreich und der Schweiz verwendet werden,
303 werden mangelhaft getrennt: »Gro\ftr{s"~so}n-kel«,
304 »Ku\ftr{s"~sh}and«, »Ma\ftr{ssn}ah-me«, »mi\ftr{s"~sa}ch-ten«
305 (nur Schweiz) und »Ex-pre\ftr{ssz}ug«, »Fit-ne\ftr{s"~sc}en-ter«,
306 »Fit-ne\ftr{sst}rai-ner«.
307 \end{itemize}
309 \bigskip
310 \needspace{4\baselineskip}
311 \noindent\textit{reformierte Rechtschreibung}
313 \begin{itemize}
314 \item Die Trennmuster für die reformierte deutsche Rechtschreibung
315 wurden nicht mit \Programm{patgen} aus einer Wortliste erstellt.
316 Stattdessen wurden die Trennmuster für die traditionelle
317 Rechtschreibung von Hand an die reformierten Regeln
318 angepasst~\cite{schmidt:1998}. Aus diesem Grund ist die
319 Worttrennung mit den Trennmustern für die reformierte
320 Rechtschreibung etwas schlechter als mit den Trennmustern für die
321 traditionelle Rechtschreibung.
322 \end{itemize}
324 Das Projekt \emph{Freie Wortlisten und Trennmuster für die deutsche
325 Sprache} hat sich das Ziel gesetzt, neue Trennmuster hoher Qualität
326 für die deutsche Sprache zu erstellen, die die genannten Probleme
327 ausräumen.
329 Den experimentellen Trennmustern dieses Pakets liegt eine Wortliste
330 mit den etwa fünfhunderttausend häufigsten Wörtern der deutschen
331 Sprache zugrunde. Vermutlich ist diese Liste erheblich umfangreicher
332 als die ursprüngliche Wortliste, in der Worthäufigkeiten
333 wahrscheinlich überhaupt nicht berücksichtigt wurden. Die verwendete
334 Wortliste deckt das in Deutschland, Österreich und der Schweiz
335 gebräuchliche Standarddeutsch ab.
337 Mit den vorliegenden Trennmustern sollte für nicht"=fachsprachliche
338 Wörter eine sehr gute Trennqualität erreicht werden. Insbesondere
339 sollte sich die Trennung häufig auftretender zusammengesetzter Wörter
340 verbessern.
343 \section{Verwenden der Trennmuster}
344 \label{sec:verwenden}
346 Die experimentellen Trennmuster werden durch zwei verschiedene
347 \hologo{TeX}"=Pakete zur Verfügung gestellt, die beide in einer
348 vollständigen Installation einer aktuellen \hologo{TeX}"=Distribution
349 enthalten sein sollten.
351 Das Paket \Paket{hyph-utf8} enthält Trennmuster für alle von
352 \hologo{TeX} unterstützten Sprachen. Für die deutsche Sprache sind
353 die experimentellen Muster enthalten. Diese werden standardmäßig nur
354 von \hologo{XeTeX}, \hologo{LuaTeX} und p\TeX\footnote{Eine in Japan
355 populäre \TeX-Variante.} sowie von allen \hologo{TeX}"=Varianten für
356 die Schweizer Varietät der deutschen Sprache in traditioneller
357 Rechtschreibung\footnote{Diese Varietät wird erst seit dem Jahr 2013
358 unterstützt, sodass keine Abwärtskompatibilität erforderlich ist.}
359 benutzt. In den übrigen Fällen wird dagegen auf die herkömmlichen
360 Trennmuster zurückgegriffen.
362 Das Paket \Paket{dehyph-exptl} enthält die experimentellen
363 Trennmuster für die deutsche Sprache. Es hat den Zweck, diese den
364 Nutzern der älteren \hologo{TeX}"=Varianten wie \hologo{pdfTeX}
365 zugänglich zu machen. Die hierfür nötigen Vorkehrungen werden unten
366 beschrieben.
368 Siehe \autoref{sec:fragen} für Hinweise, wie die Version der in beiden
369 Paketen enthaltenen Muster ermittelt werden kann.
371 Zur manuellen Installation einer bestimmten Version der
372 experimentellen Trennmuster siehe \autoref{sec:installation}.
374 Beachte, in den folgenden Abschnitten ist \verb+<datum>+ durch das bei
375 der Installation angegebene Datum in \Abk{iso}"=Notation
376 (\verb+JJJJ-MM-TT+) oder die Zeichenkette \verb+latest+ zu ersetzen.
379 \subsection{Sprachvarietät und Rechtschreibung}
380 \label{sec:varietaeten}
382 Experimentelle Trennmuster stehen für die Worttrennung der deutschen
383 Sprache in der traditionellen und der reformierten Rechtschreibung zur
384 Verfügung. Die Trennmuster unterstützen die drei in Deutschland,
385 Österreich und der Schweiz gebräuchlichen Hauptvarietäten der
386 deutschen Standardsprache. \autoref{tab:varietaeten} zeigt die
387 Trennmuster, die abhängig von gewünschter Varietät und Rechtschreibung
388 in einem Dokument zu aktivieren sind.
390 \begin{table}
391 \centering
392 \caption{Die unterstützten Varietäten und Rechtschreibungen}
393 \label{tab:varietaeten}
394 \begin{tabular}{l>{\ttfamily}l}
395 \normalfont Sprachvarietät
396 & Trennmusterbezeichner\\
397 \addlinespace\toprule\addlinespace
398 \hspace*{-\tabcolsep}\normalfont\emph{traditionelle Rechtschreibung}\\
399 Deutschland, Österreich
400 & german-x-<datum>\\
401 Schweiz
402 & gswiss-x-<datum>\\\addlinespace
403 \hspace*{-\tabcolsep}\normalfont\emph{reformierte Rechtschreibung}\\
404 Deutschland, Österreich, Schweiz
405 & ngerman-x-<datum>\\
406 \end{tabular}
407 \end{table}
409 Varietäten, die sich nur in der Verwendung und Schreibung einzelner
410 Wörter voneinander unterscheiden, können durch gemeinsame Trennmuster
411 unterstützt werden.
412 % Die Eingabewortliste für \Programm{patgen} ist dann eine Vereinigung
413 % der den Varietäten entsprechenden Wortlisten.
414 Zum Beispiel werden Besonderheiten der österreichischen
415 Standardsprache in den Trennmustern für die Standardsprache
416 Deutschlands berücksichtigt. Österreichische und deutsche Anwender
417 können daher dieselben Trennmuster verwenden (wie das auch schon bei
418 den herkömmlichen Trennmustern der Fall war).
420 Aufgrund unvereinbarer Trennregeln in der traditionellen
421 Rechtschreibung der Standardsprachen Deutschlands/""Österreichs und
422 der Schweiz werden für die letztere Varietät eigene Trennmuster
423 bereitgestellt.
425 Mit der Rechtschreibreform 1996 wurden die Trennregeln aller drei
426 Standardsprachen so weit angeglichen, dass für die reformierte
427 Rechtschreibung einheitliche Trennmuster für alle drei unterstützten
428 Sprachvarietäten bereitgestellt werden können.
430 \subsection{Aktivieren der Trennmuster}
431 \label{sec:aktivieren}
433 Im Folgenden wird dargestellt, wie die experimentellen Trennmuster bei
434 Verwendung unterschiedlicher \hologo{TeX}"=Varianten geladen werden
435 können.
437 Das Ergebnis für die traditionelle und reformierte Rechtschreibung mit
438 herkömmlichen und experimentellen Trennmustern ist in
439 \autoref{tab:trennvarianten} zusammengefasst. Ob die experimentellen
440 Trennmuster korrekt aktiviert werden, kann mit dem folgenden kleinen
441 Dokument getestet werden, dessen Ausgabe in der \texttt{log}"=Datei
442 erscheint.
444 \begin{lstlisting}[style=LaTeX]
445 \begin{document}
446 \showhyphens{löste Fassade modernste Abendstern Mordopfer}
447 \end{document}
448 \end{lstlisting}
450 %\suppressfloats[t]
451 \begin{table*}
452 \centering
453 \caption{Trennvarianten}
454 \label{tab:trennvarianten}
455 \begin{tabular}{llll}
456 \multicolumn{2}{c}{\itshape traditionelle Rechtschreibung} &
457 \multicolumn{2}{c}{\itshape reformierte Rechtschreibung}\\
458 herkömmlich & experimentell & herkömmlich & experimentell\\
459 \addlinespace\toprule\addlinespace
460 l\ftr{ös-t}e & lö-ste & lös-te & lös-te\\
461 Fas-sa-de & Fas-sa-de & Fa\ftr{ss}a-de & Fas-sa-de\\
462 mo-\ftr{d-e}rn-ste & mo-dern-ste & mo-\ftr{d-e}rns-te & mo-derns-te\\
463 Abend-stern & Abend-stern & Aben\ftr{ds-t}ern & Abend-stern\\
464 Mo\ftr{r-do}p-fer & Mord-op-fer & Mo\ftr{r-do}p-fer & Mord-op-fer\\
465 \end{tabular}
466 \end{table*}
468 \subsubsection{Plain-\TeX}
469 \label{subsubsec:PlainTeX}
471 Bei Verwendung eines \hologo{eTeX}"=basierten Compilers
472 (\Programm{etex}, \Programm{pdftex}, \Programm{xetex} oder
473 \Programm{luatex}) steht der Befehl \verb+\uselanguage+ zum Laden von
474 Trennmustern zur Verfügung. Er akzeptiert neben anderen die Argumente
475 \texttt{german}, \texttt{ngerman} und \texttt{swissgerman} (nicht
476 jedoch \texttt{austrian}, \texttt{naustrian} und
477 \texttt{nswissgerman}).\footnote{Die zulässigen Sprachbezeichnungen
478 finden sich in der Datei \Datei{language.def} der
479 \hologo{TeX}"=Installation.} Um die Silbentrennung gemäß
480 reformierter deutscher Rechtschreibung zu aktivieren, ist also
481 folgender Befehl ausreichend:
483 \begin{lstlisting}[style=LaTeX]
484 \uselanguage{ngerman}
485 \end{lstlisting}
487 Die Compiler \Programm{xetex} und \Programm{luatex} verwenden für alle
488 definierten Varietäten der deutschen Sprache die experimentellen
489 Trennmuster, die mit dem Paket \Paket{hyph-utf8} installiert sind;
490 \Programm{etex} und \Programm{pdftex} tun dies nur für
491 \texttt{swissgerman}.
493 Für die Varietäten \texttt{german} und \texttt{ngerman} laden
494 \Programm{etex} und \Programm{pdftex} hingegen aus Gründen der
495 Abwärtskompatibilität die herkömmlichen Trennmuster. Die
496 experimentellen Trennmuster können am einfachsten aktiviert werden,
497 indem etwa \lstinline[style=LaTeX]+\uselanguage{ngerman}+ durch den
498 folgenden Befehl ersetzt wird:
500 \begin{lstlisting}[style=LaTeX]
501 \uselanguage{ngerman-x-latest}
502 \end{lstlisting}
504 Auf entsprechende Weise ist es mit allen Compilern möglich, eine
505 alternative, manuell installierte Trennmusterversion zu verwenden:
507 \begin{lstlisting}[style=LaTeX]
508 \uselanguage{ngerman-x-<datum>}
509 \end{lstlisting}
511 Vorausgesetzt ist dabei, dass ein entsprechender Eintrag in der
512 Konfigurationsdatei \Datei{language.def} oder einer lokalen Version
513 derselben existiert.
515 Soll der \verb+\uselanguage+-Befehl seine gewohnte Form behalten, ist
516 zum Laden alternativer Trennmuster auch folgendes Vorgehen mit Hilfe
517 des Pakets \Paket{hyphsubst} möglich:
519 \begin{lstlisting}[style=LaTeX]
520 \input hyphsubst.sty
521 \HyphSubstLet{ngerman}{ngerman-x-<datum>}
522 \uselanguage{ngerman}
523 \end{lstlisting}
525 Zu beachten ist, dass in Plain-\hologo{TeX} unabhängig vom verwendeten
526 Compiler Wörter mit Umlauten, \emph{ß} oder Akzentbuchstaben an vielen
527 Trennstellen nicht automatisiert getrennt werden können.
529 \subsubsection{\LaTeX{} mit dem Sprachenpaket \Paket{Babel}}
530 \label{subsubsec:LaTeX+Babel}
532 Das Paket \Paket{Babel} kennt für die traditionelle Rechtschreibung
533 die Sprachbezeichnungen \texttt{german}, \texttt{austrian} und
534 \texttt{swissgerman}, für die reformierte Rechtschreibung
535 \texttt{ngerman}, \texttt{naustrian} und \texttt{nswissgerman}, wobei
536 diese sechs Varietäten durch drei Trennmustersätze abgedeckt werden
537 können (\autoref{tab:varietaeten}).
539 Die Compiler \Programm{xelatex} und \Programm{lualatex} verwenden für
540 alle definierten Varietäten der deutschen Sprache die experimentellen
541 Trennmuster, die mit dem Paket \Paket{hyph-utf8} installiert sind;
542 \Programm{latex} und \Programm{pdflatex} tun dies nur für
543 \texttt{swissgerman}.
545 Für die übrigen fünf Varietäten laden \Programm{latex} und
546 \Programm{pdflatex} hingegen aus Gründen der Abwärtskompatibilität
547 standardmäßig die herkömmlichen Trennmuster. Um stattdessen die
548 experimentellen Trennmuster zu aktivieren, sind für die reformierte
549 Rechtschreibung folgende Zeilen in die Präambel des Dokuments
550 aufzunehmen.
552 \begin{lstlisting}[style=LaTeX]
553 \usepackage[T1]{fontenc}
554 \usepackage[ngerman]{babel}
555 \babelprovide[hyphenrules=ngerman-x-latest]{ngerman}
556 \end{lstlisting}
558 Für die österreichische Varietät:
560 \begin{lstlisting}[style=LaTeX]
561 \usepackage[T1]{fontenc}
562 \usepackage[naustrian]{babel}
563 \babelprovide[hyphenrules=ngerman-x-latest]{naustrian}
564 \end{lstlisting}
566 Auf entsprechende Weise ist es mit allen \hologo{LaTeX}"=Compilern
567 möglich, eine alternative, manuell installierte Trennmusterversion zu
568 aktivieren:
570 \begin{lstlisting}[style=LaTeX]
571 \usepackage[T1]{fontenc}
572 \usepackage[ngerman]{babel}
573 \babelprovide[hyphenrules=ngerman-x-<datum>]{ngerman}
574 \end{lstlisting}
576 Der Befehl \verb+\babelprovide+ erlaubt auch innerhalb eines Dokuments
577 das mehrfache Umschalten der Trennmuster.
579 \subsubsection{\hologo{XeLaTeX}/\hologo{LuaLaTeX} mit dem
580 Sprachenpaket \Paket{Polyglossia}}
581 \label{subsubsec:LaTeX+PolyGlossia}
583 Für \hologo{XeLaTeX} und \hologo{LuaLaTeX} steht als Alternative zu
584 \Paket{Babel} das Paket
585 \Paket{Polyglossia}\footnote{\url{https://ctan.org/pkg/polyglossia}}
586 zur Verfügung. Mit den Zeilen
588 \begin{lstlisting}[style=LaTeX]
589 \usepackage{polyglossia}
590 \setmainlanguage{german}
591 \end{lstlisting}
593 \noindent in der Präambel werden die mit dem Paket \Paket{hyph-utf8}
594 installierten Trennmuster für die \emph{reformierte} Rechtschreibung
595 geladen. Mit den Optionen \texttt{variant=""austrian},
596 \texttt{variant=""swiss} und \texttt{spelling=""old} können wahlweise
597 die österreichische Varietät, die Schweizer Varietät sowie die
598 traditionelle Rechtschreibung gewählt werden, beispielsweise:
600 \begin{lstlisting}[style=LaTeX]
601 \usepackage{polyglossia}
602 \setmainlanguage[variant=swiss, spelling=old]{german}
603 \end{lstlisting}
605 Um Trennhilfen wie \verb+""+, \verb+"ff+ oder \verb+"ck+ verwenden zu
606 können, muss zusätzlich die Option \texttt{babelshorthands=""true}
607 gesetzt werden.
609 Mit \hologo{XeLaTeX} ist es außerdem möglich, manuell installierte
610 statt der voreingestellten Trennmuster zu verwenden. Hierzu kommt das
611 Paket \Paket{hyphsubst} wie folgt zum Einsatz. Für die reformierte
612 Rechtschreibung:
614 \begin{lstlisting}[style=LaTeX]
615 \usepackage{polyglossia}
616 \setmainlanguage{german} % ggf. variant=austrian/swiss
617 \usepackage[ngerman=ngerman-x-<datum>]{hyphsubst}
618 \end{lstlisting}
620 Für die traditionelle Rechtschreibung in Deutschland und Österreich:
622 \begin{lstlisting}[style=LaTeX]
623 \usepackage{polyglossia}
624 \setmainlanguage[spelling=old]{german} % ggf. variant=austrian
625 \usepackage[german=german-x-<datum>]{hyphsubst}
626 \end{lstlisting}
628 Für die traditionelle Rechtschreibung in der Schweiz:
630 \begin{lstlisting}[style=LaTeX]
631 \usepackage{polyglossia}
632 \setmainlanguage[variant=swiss, spelling=old]{german}
633 \usepackage[swissgerman=gswiss-x-<datum>]{hyphsubst}
634 \end{lstlisting}
636 Mit \hologo{LuaLaTeX} in Verbindung mit \Paket{Polyglossia} ist das
637 Ersetzen der Trennmuster auf diese Weise nicht möglich.
639 \subsubsection{p\TeX/up\TeX}
641 Die in Japan gebräuchlichen \hologo{TeX}"=Varianten p\TeX{} und
642 up\TeX{} verwenden für deutschsprachige Texte die experimentellen
643 Trennmuster, die mit dem Paket \Paket{hyph-utf8} installiert sind.
645 \subsubsection{\hologo{ConTeXt}}
647 \hologo{ConTeXt} besitzt eigene Trennmusterdateien. Die Trennmuster
648 werden aus dem Paket \Paket{hyph-utf8} übernommen; Unterstützung für
649 die traditionelle deutsche Rechtschreibung in der Schweiz fehlt
650 allerdings zur Zeit.
652 Siehe \autoref{sec:fragen} für Hinweise, wie die Version der
653 \hologo{ConTeXt}-Trennmuster bestimmt werden kann.
655 \section{Trennregeln und Konventionen}
656 \label{sec:trennregeln}
658 Die Trennmuster für die traditionelle Rechtschreibung in Deutschland
659 und Österreich orientieren sich an den verbindlichen Regeln des Dudens
660 in der Fassung von 1991~\cite{duden:1991}. Dasselbe gilt für die
661 Trennmuster für die traditionelle Rechtschreibung in der Schweiz,
662 jedoch mit einer unten beschriebenen Abweichung. Die Trennmuster für
663 die reformierte Rechtschreibung orientieren sich an den amtlichen
664 Regeln für die Rechtschreibung der deutschen Sprache in der Fassung
665 von 2006~\cite{amtlRegeln:2006, amtlRegeln:2006:duden}.
667 Die Regeln lassen gewisse Freiheiten bei der Schreibung und Trennung
668 von Wörtern zu. Da sich solche Freiheiten nicht ohne weiteres auf die
669 maschinelle Worttrennung übertragen lassen, wurden die im folgenden
670 beschriebenen Konventionen getroffen. Hauptsächlich betreffen diese
671 die reformierte Rechtschreibung, die zusätzliche Freiheiten eingeführt
672 hat.\footnote{%
673 Im Ergebnis weicht in reformierter Rechtschreibung die Trennung zum
674 Beispiel des Dudens (nach Sprechsilben) von der Trennung mit diesen
675 Trennmustern (bevorzugt etymologisch) ab, siehe auch
676 \regelref{enum:reformEtymo} und \regelref{enum:reformClusterLR}
677 sowie \autoref{sec:fragen}.} Beziehen sich die Konventionen für die
678 reformierte Rechtschreibung auf die traditionelle Rechtschreibung, so
679 werden die entsprechenden Regeln etwas ausführlicher dargestellt. Die
680 folgenden Abschnitte enthalten jedoch keine vollständige Aufstellung
681 der Silbentrennregeln. Diese sind den entsprechenden Regelwerken zu
682 entnehmen. Es folgen zunächst einige allgemeine Hinweise:
684 \begin{itemize}
686 \item In Liangs Trennalgorithmus werden Groß- und Kleinschreibung
687 nicht unterschieden~\cite{liang:1983}. Die Schreibweisen
688 \emph{Nachtritt} und \emph{nachtritt} werden aus Sicht des
689 Trennalgorithmus gleich behandelt (siehe auch
690 \regelref{enum:tradDoppeld} und \regelref{enum:reformDoppeld}).
692 \item Die von einem Programm aus diesen Mustern abgeleiteten möglichen
693 Trennstellen können (u.\,a. durch Programmfehler) durchaus von denen
694 der zugrundeliegenden Wortliste abweichen. So führt zum Beispiel
695 die Eingabe \lstinline[style=LaTeX]+Meta"llegierung+
696 (Dreikonsonantenregel in der traditionellen Rechtschreibung) mit dem
697 Paket \Paket{Babel} zu den in \autoref{tab:trennung-dreik} gezeigten
698 Trennmöglichkeiten.
700 \begin{table}
701 \centering
702 \caption{Unterschiedlich ermittelte Trennmöglichkeiten.}
703 \label{tab:trennung-dreik}
704 \begin{tabular}{ll}
705 Quelle & Trennmöglichkeiten\\
706 \addlinespace
707 \toprule
708 \addlinespace
709 \hologo{pdfLaTeX} mit \Paket{Babel}~3.8 & Me-tall(-l)egierung\\
710 \hologo{pdfLaTeX} mit \Paket{Babel}~3.9 & Me-tall(-l)e-gie-rung\\
711 erwünscht \emph{(vgl. \regelref{enum:tradnstd})} & Me-tall(-l)egie-rung\\
712 \end{tabular}
713 \end{table}
715 \item Die von \hologo{TeX} gewählte Trennung kann in Einzelfällen mit
716 den \hologo{TeX}- und \Paket{Babel}"=Kürzeln
717 \lstinline[style=LaTeX]+\-+ und \lstinline[style=LaTeX]+"-+ geändert
718 werden. Für dokumentweite Änderungen der Trennung eignet sich das
719 Kommando \lstinline[style=LaTeX]+\hyphenation+.
721 \item Die Datei \Datei{CHANGES} beschreibt bekannte, systematische
722 Fehler der Trennmuster.
724 \item In den Beispielen zeigt die linke (grüne) Spalte jeweils die
725 Trennung mit den experimentellen Trennmustern, die rechten (roten)
726 Spalten zeigen alternative oder unerwünschte Trennungen.
728 \end{itemize}
730 \subsection{Traditionelle Rechtschreibung in Deutschland und
731 Österreich}
732 \label{sec:tradRS}
734 \begin{enumerate}[\hspace{1em}\itshape{T}1]
735 \labelformat{enumi}{\textit{T#1}}
737 \item\label{enum:tradhyphenmin} Die minimale unterstützte Silbenlänge
738 am Wortanfang und "~ende beträgt zwei Buchstaben
739 \cite[R~178]{duden:1991}.
741 Siehe \autoref{sec:fragen} für Hinweise, wie sich diese Länge
742 abweichend einstellen lässt. Wird die Mindestlänge auf weniger als
743 zwei Buchstaben verringert, so können fehlerhafte Trennungen
744 auftreten.
746 \item\label{enum:tradSinn} Sinnentstellende und irreführende
747 Trennungen werden möglichst vermieden \cite[R~181]{duden:1991}
748 (siehe auch \regelref{enum:tradnstd}):
750 \begin{tabular}[t]{TU}
751 An-alpha-bet & Anal-phabet\\
752 Kaf-ka-kenner & Kafkaken-ner\\
753 Tal-entwäs-se-rung & Talent-wässerung\\
754 \end{tabular}
756 Beachte, dass derzeit die Unterdrückung von solchen Trennstellen bis
757 zu einem gewissen Grade willkürlich und subjektiv ist. Außerdem ist
758 die Erfassung weit davon entfernt, vollständig zu sein. Um diesen
759 Problemen abzuhelfen, ist für zukünftige Versionen der Trennmuster
760 ein anderer, automatisierter Ansatz geplant, welcher die Anzahl
761 manuell zu erfassender Fälle sehr stark reduzieren wird.
763 \item\label{enum:tradDoppeld} In mehrdeutigen Wörtern werden
764 Trennungen nur an übereinstimmenden Trennstellen zugelassen.
766 \begin{tabular}[t]{TUU}
767 nachtritt & nach-tritt & Nacht-ritt\\
768 Wachstu-be & Wach-stube & Wachs-tube\\
769 Druckerzeug-nis & Druck-erzeugnis & Drucker-zeugnis\\
770 Mu-sikerle-ben & Musik-erleben & Musi-ker-leben\\
771 Fuß-balleh-re & Fußball-ehre & Fußball-lehre\\
772 \end{tabular}
774 Beachte, die Trennstellen »Drucker-zeugnis« und »Musiker-leben«
775 sind in den Interpretationen \emph{Druck-Erzeugnis} und
776 \emph{Musik-Erleben} irreführend. Sie entfallen nach
777 \regelref{enum:tradSinn} und sind nicht als übereinstimmende
778 Trennstellen anzusehen. Zur Spezialtrennung »Fußball-lehre« siehe
779 auch \regelref{enum:tradnstd}.
781 Für diese Regel gelten die folgenden Einschränkungen:
783 \begin{itemize}
785 \item Bei mehrdeutigen Wörtern endend auf \emph{"~ende},
786 \emph{"~enden}, \emph{"~endes} wird stets die Trennung der
787 Partizipform des Verbs verwendet.
789 \begin{tabular}[t]{TUU}
790 fu-ßen-de & Fuß-ende & fußende\\
791 spie-len-de & Spiel-ende & spielende
792 \end{tabular}
794 \item Mehrdeutigkeiten, die durch die Ersatzschreibweise von Wörtern
795 mit~\emph{ß} auftreten, werden nicht berücksichtigt (vergleiche
796 \regelref{enum:tradEszett}).
798 \begin{tabular}[t]{TUU}
799 Mas-se & \textls{M\kern-.4ptA-SSE} & \textls{M\kern-.4ptA\kern-.6ptSSE}
800 \end{tabular}
802 \end{itemize}
804 \item\label{enum:tradEszett} Wird der Buchstabe~\emph{ß} durch
805 \emph{ss/SS} ersetzt, so bleibt die Trennung davon unberührt
806 \cite[R~179]{duden:1991}:
808 \begin{tabular}[t]{T}
809 \textls{GRÖSS-TE}\\
810 \textls{GRÜ-SSE}\\
811 \textls{M\kern-.4ptA\kern-.4pt-SSES}\\
812 \end{tabular}
814 Für diese Regel gilt die folgende Einschränkung:
815 \begin{itemize}
817 \item Wenn durch den Ersatz von~\emph{ß} an dieser Stelle keine
818 eindeutige Trennung möglich ist, so wird zugunsten der Bedeutung
819 des Wortes in der normalen Schreibweise getrennt (siehe auch
820 \regelref{enum:tradDoppeld}).
822 \begin{tabular}[t]{TTU}
823 \textls{FLÖS-SE} & (wegen flös-se) & \textls{FLÖ-SSE}\\
824 \textls{MAS-SE} & (wegen Mas-se) & \textls{MA-SSE}\\
825 \end{tabular}
827 Beachte:
828 \begin{itemize}
830 \item Wird \emph{ß} mit \lstinline[style=LaTeX]+\MakeUppercase+
831 durch~\emph{SS} ersetzt, so bleibt \emph{SS} stets ungetrennt.
832 Die Trennung richtet sich dann nach der Schreibweise
833 mit~\emph{ß} im Quelldokument.
835 \item Existiert ein Wort in verschiedenen Varietäten in der
836 Schreibweise mit~\emph{ß} und mit~\emph{ss}, so wird aufgrund
837 dieser Einschränkung \emph{s-s} stets getrennt:
839 \begin{tabular}[t]{TTUU}
840 Ge-scho-ße & (AT)\\
841 Ge-schos-se & (D) & \textls{GESCHO-SSE} & (AT)\\
842 \end{tabular}
844 \item Wenn durch den Ersatz des~\emph{ß} an entfernten Stellen
845 keine eindeutige Trennung möglich wird, zum Beispiel an
846 Wortfugen, so werden die betroffenen Trennungen gemäß
847 \regelref{enum:tradDoppeld} unterdrückt. In der Folge wird
848 gegebenenfalls auch die Trennung von \emph{ss/SS} unterdrückt.
850 \begin{tabular}[t]{TU}
851 \textls{BAHN-HOFSTRASSE} & \textls{BAHNHOF-STRA-SSE}\\
852 & \textls{BAHNHOFS-TRAS-SE}\\
853 \end{tabular}
855 \end{itemize}
857 \end{itemize}
859 \item\label{enum:tradOW} In Ableitungen von Namen auf \emph{"~ow} wird
860 die Nottrennung der Ableitungssilben \emph{"~er}, \emph{"~ern},
861 \emph{"~ers} unterdrückt \cite[R~180]{duden:1991}:
863 \begin{tabular}[t]{TU}
864 Tel-tower & Teltow-er\\
865 Trep-towern & Treptow-ern\\
866 Pan-kowers & Pankow-ers\\
867 \end{tabular}
869 \item\label{enum:tradnstd} Spezialtrennungen (\emph{engl.:}
870 non-standard hyphenation), die nach Regeln erfolgen, die über das
871 bloße Einfügen eines Trennstrichs hinausgehen, wie die \emph{ck}"~
872 oder die Dreikonsonantenregel, kann \hologo{TeX} nicht automatisch
873 behandeln. Aus diesem Grund sind solche Trennstellen in diesen
874 Trennmustern nicht berücksichtigt.
876 \begin{tabular}[t]{lTUU}
877 \lstinline[style=LaTeX]+drucken+ & drucken & druk-ken\\
878 \lstinline[style=LaTeX]+Zuckerbäcker+ & Zucker-bäcker & Zuk-kerbäk-ker\\
879 \lstinline[style=LaTeX]+Brennessel+ & Brennes-sel & Brenn-nessel\\
880 \lstinline[style=LaTeX]+Stoffetzen+ & Stoffet-zen & Stoff-fetzen\\
881 \end{tabular}
883 Die Dreikonsonantenregel birgt aufgrund des ausgefallenen
884 Konsonanten die Gefahr irreführender und sinnentstellender
885 Trennungen (siehe auch \regelref{enum:tradSinn}). Trennstellen, die
886 in einem Abstand von zwei Lauten auf eine Wortfuge mit Anwendung der
887 Dreikonsonantenregel folgen, werden daher grundsätzlich unterdrückt.
889 \begin{tabular}[t]{lTUU}
890 \lstinline[style=LaTeX]+Metallegierung+ & Me-tallegie-rung & Metall-legierung & Metalle-gierung\\
891 \lstinline[style=LaTeX]+schnellebige+ & schnellebi-ge & schnell-lebige & schnelle-bige\\
892 \lstinline[style=LaTeX]+Stilleben+ & Stilleben & Still-leben & Stille-ben\\
893 \end{tabular}
894 \par\nobreak
895 \textit{auch:}
897 \begin{tabular}[t]{lTUU}
898 \lstinline[style=LaTeX]+Abfallager+ & Ab-fallager & Abfall-lager & Abfalla-ger\\
899 \lstinline[style=LaTeX]+Zellstoffabrik+ & Zell-stoffabrik & Zellstoff-fabrik & Zellstoffa-brik\\
900 \end{tabular}
902 Das Paket \Paket{Babel} stellt verschiedene Kürzel zur Verfügung,
903 u.\,a. \lstinline[style=LaTeX]+"ck+%
904 \footnote{Spezialtrennungen werden in \hologo{TeX} mit Hilfe des
905 Kommandos \lstinline[style=LaTeX]+\\discretionary+ kodiert. So
906 wird zum Beispiel das \Paket{Babel}-Kürzel
907 \lstinline[style=LaTeX]+\"ck+ in der Eingabe während der
908 Kompilation durch
909 \lstinline[style=LaTeX]+\\discretionary\{k-\}\{k\}\{ck\}+ ersetzt,
910 wodurch \emph{k-k}-Trennungen möglich werden.}
912 oder \lstinline[style=LaTeX]+"ff+ \emph{etc.}, mit denen
913 Spezialtrennungen im Quelldokument ausgezeichnet werden können
914 (siehe auch \autoref{tab:trennung-dreik}). Das Alternativpaket
915 \Paket{Polyglossia} stellt diese Kürzel ebenfalls zur Verfügung,
916 falls beim Laden der deutschen Sprache (in der Regel mit dem Befehl
917 \lstinline[style=LaTeX]+\setmainlanguage+) die Option
918 \lstinline[style=LaTeX]+babelshorthands=true+ angegeben wird.
920 \hologo{LuaTeX}%
921 \footnote{\url{http://www.luatex.org/}}
923 soll in einer zukünftigen Version Mechanismen zur automatischen
924 Behandlung von Spezialtrennungen bereitstellen. Eine physische
925 Auszeichnung im Quelltext ist dann nicht mehr erforderlich. Die
926 entsprechenden Spezialtrennmuster für die deutsche Sprache werden
927 ebenfalls im Rahmen dieses Projekts erstellt.
929 \end{enumerate}
931 \subsection{Traditionelle Rechtschreibung in der Schweiz}
932 \label{sec:tradchRS}
934 Die Trennmuster für die traditionelle Rechtschreibung in der Schweiz
935 folgen weitgehend den Konventionen für die traditionelle
936 Rechtschreibung in Deutschland (siehe \autoref{sec:tradRS}). Die
937 folgende Liste enthält daher nur Fälle, in denen davon abgewichen wird
938 oder deren Beschreibung aus anderen Gründen sinnvoll erscheint.
940 \begin{enumerate}[\hspace{1em}\itshape{TS}1]
941 \labelformat{enumi}{\textit{TS#1}}
943 \item\label{enum:tradchEszett} Wörter mit \emph{ß} werden gemäß den
944 Regeln für die traditionelle Rechtschreibung in Deutschland
945 getrennt.
947 \item\label{enum:tradchSS} Abweichend von \regelref{enum:tradEszett}
948 wird \emph{ss/SS} immer als Doppelkonsonant behandelt und
949 gegebenenfalls getrennt:
951 \begin{tabular}[t]{T}
952 grös-ste\\
953 Grüs-se\\
954 Mas-ses\\
955 \end{tabular}
957 Beachte, wird \emph{ß} jedoch mit
958 \lstinline[style=LaTeX]+\MakeUppercase+ durch~\emph{SS} ersetzt, so
959 bleibt~\emph{SS} stets ungetrennt. Die Trennung richtet sich dann
960 nach der Schreibweise mit~\emph{ß} im Quelldokument (siehe
961 \regelref{enum:tradchEszett}).
963 \end{enumerate}
965 \subsection{Reformierte Rechtschreibung}
966 \label{sec:reformRS}
968 \begin{enumerate}[\hspace{1em}\itshape{R}1]
969 \labelformat{enumi}{\textit{R#1}}
971 \item\label{enum:reformhyphenmin} Die minimale unterstützte Silbenlänge
972 am Wortanfang und "~ende beträgt zwei Buchstaben
973 \cite[\S~107]{amtlRegeln:2006, amtlRegeln:2006:duden}.
975 Siehe \autoref{sec:fragen} für Hinweise, wie sich diese Länge
976 abweichend einstellen lässt. Wird die Mindestlänge auf weniger als
977 zwei Buchstaben verringert, so können fehlerhafte Trennungen
978 auftreten.
980 \item\label{enum:reformEtymo} Falls die Trennung nach Sprechsilben und
981 die etymologische (sprachgeschichtliche) Trennung kollidieren, wird
982 weitgehend die etymologische Trennung gewählt
983 \cite[\S~113]{amtlRegeln:2006, amtlRegeln:2006:duden}:
985 \begin{tabular}[t]{RUU}
986 % Heli-ko-pter & Helikop-ter\\
987 % in-ter-view-en & intervie-wen\\
988 in-ter-es-sant & inte-ressant\\
989 Lin-ole-um & Li-noleum & Lino-leum\\
990 Päd-ago-ge & Pä-dagoge & Päda-goge\\
991 \end{tabular}
993 \item\label{enum:reformClusterLR} In Fremdwörtern bleiben die
994 Buchstabengruppen \emph{bl}, \emph{pl}, \emph{fl}, \emph{gl},
995 \emph{cl}, \emph{kl}, \emph{phl}; \emph{br}, \emph{pr}, \emph{dr},
996 \emph{tr}, \emph{fr}, \emph{vr}, \emph{gr}, \emph{cr}, \emph{kr},
997 \emph{phr}, \emph{thr}; \emph{chth}; \emph{gn}, \emph{kn} im
998 allgemeinen ungetrennt, nicht jedoch \emph{str}
999 \cite[\S~112]{amtlRegeln:2006, amtlRegeln:2006:duden}
1000 i.\,V.\,m.~\cite[R~179]{duden:1991}:
1002 \begin{tabular}[t]{RU}
1003 Ar-thri-tis & Arth-ritis\\
1004 % Co-gnac & Cog-nac\\
1005 Di-plom & Dip-lom\\
1006 % Fe-bru-ar & Feb-ruar\\
1007 igno-rie-re & ig-noriere\\
1008 In-te-gral & Integ-ral\\
1009 \end{tabular}
1010 \par\nobreak
1011 \textit{aber:}
1013 \begin{tabular}[t]{RUU}
1014 In-dus-trie & Indu-strie & Indust-rie\\
1015 % Ma-gis-tra-le & Magi-strale\\
1016 de-struk-tiv\\
1017 sub-lim\\
1018 \end{tabular}
1020 \item\label{enum:reformSinn} Sinnentstellende und irreführende
1021 Trennungen werden möglichst vermieden \cite[\S~107]{amtlRegeln:2006,
1022 amtlRegeln:2006:duden}:
1024 \begin{tabular}[t]{RU}
1025 An-alpha-bet & Anal-phabet\\
1026 Kaf-ka-kenner & Kafkaken-ner\\
1027 Tal-entwäs-se-rung & Talent-wässerung\\
1028 \end{tabular}
1030 \item\label{enum:reformDoppeld} In mehrdeutigen Wörtern werden
1031 Trennungen nur an übereinstimmenden Trennstellen zugelassen:
1033 % Das »@{}« entfernt den rechten Rand der Tabelle und verhindert
1034 % so eine »overfull«-Warnung.
1035 \begin{tabular}[t]{RUUU@{}}
1036 Druckerzeug-nis & Dru-ckerzeugnis & Druck-erzeugnis &
1037 Drucker-zeugnis\\
1038 Mu-sikerle-ben & Musi-kerleben & Musik-erleben & Musiker-leben\\
1039 nachtritt & nach-tritt & Nacht-ritt\\
1040 Wachstu-be & Wach-stube & Wachs-tube\\
1041 \end{tabular}
1043 Beachte, die Trennstellen »Drucker-zeugnis« und »Musiker-leben«
1044 sind in den Interpretationen \emph{Druck-Erzeugnis} und
1045 \emph{Musik-Erleben} irreführend. Sie entfallen nach
1046 \regelref{enum:reformSinn} und sind nicht als übereinstimmende
1047 Trennstellen anzusehen.
1049 Für diese Regel gilt die folgende Einschränkung:
1051 \begin{itemize}
1053 \item Bei mehrdeutigen Wörtern endend auf \emph{"~ende},
1054 \emph{"~enden}, \emph{"~endes} wird stets die Trennung der
1055 Partizipform des Verbs verwendet.
1057 \begin{tabular}[t]{RUU}
1058 fu-ßen-de & Fuß-ende & fußende\\
1059 spie-len-de & Spiel-ende & spielende
1060 \end{tabular}
1062 \end{itemize}
1064 \item\label{enum:reformEszett} Wird der Buchstabe~\emph{ß} durch
1065 \emph{ss/SS} ersetzt, so wird \emph{s"~s} getrennt \cite[\S\S~25~E3,
1066 110]{amtlRegeln:2006, amtlRegeln:2006:duden}:
1068 \begin{tabular}[t]{R}
1069 \textls{GRÖS-STE}\\
1070 \textls{GRÜS-SE}\\
1071 \textls{M\kern-.4ptA\kern-.6ptS-SES}\\
1072 \end{tabular}
1074 Wird~\emph{ß} mit \lstinline[style=LaTeX]+\MakeUppercase+ oder in
1075 Kapitälchen in~\emph{SS} gewandelt, so bleibt~\emph{SS} ungetrennt.
1076 Dies ist kein Fehler in den Trennmustern, sondern im
1077 \hologo{LaTeX}-Kern fest implementiert.
1079 % \item\label{enum:reformOW} In Ableitungen von Namen auf \emph{"~ow}
1080 % bleibt \emph{"~ow} ungetrennt, wenn es den Laut [o\,:] bezeichnet.
1081 % Die Nottrennung der Ableitungssilben \emph{"~er}, \emph{"~ern},
1082 % \emph{"~ers} wird unterdrückt \cite[\S~113]{amtlRegeln:2006,
1083 % amtlRegeln:2006:duden}
1084 % i.\,V.\,m.~\cite[R~180]{duden:1991}:
1086 % \begin{tabular}[t]{RUU}
1087 % Tel-tower & Telto-wer & Teltow-er\\
1088 % Trep-towern & Trepto-wern & Treptow-ern\\
1089 % Pan-kowers & Panko-wers & Pankow-ers\\
1090 % \end{tabular}
1092 \end{enumerate}
1095 \section{Trennfehler}
1096 \label{sec:trennfehler}
1098 Mit den vorliegenden Trennmustern können sämtliche Wörter der
1099 zugrundeliegenden Wortliste fehlerfrei getrennt werden. Technisch
1100 gesprochen endet der letzte \Programm{patgen}-Lauf mit der Meldung
1102 \begin{lstlisting}[style=shell]
1103 1783028 good, 0 bad, 0 missed
1104 100.00 %, 0.00 %, 0.00 %
1105 \end{lstlisting}
1107 \noindent (der Wert vor \lstinline[style=shell]+good+ ist vom
1108 Listenumfang abhängig). Trotz des großen Umfangs der Wortliste lassen
1109 sich Trennfehler in Wörtern, die nicht in der Liste enthalten sind,
1110 nicht vermeiden. Der Umfang der Wortliste kann allerdings nicht
1111 beliebig erweitert werden.%
1112 \footnote{Liangs Schema sieht nur einen begrenzten Bereich für die
1113 Trennstellenbewertungen vor (0--9). Die derzeitigen Trennmuster
1114 vewenden Bewertungen bis zur Höhe~7.}
1116 In den folgenden Fällen sollten fehlerhafte Trennungen der Trennmuster
1117 jedoch gemeldet werden:
1119 \begin{enumerate}[\hspace{1em}A.]
1121 \item\label{enum:kritWLfehlerhaft} Das Wort ist bereits in der
1122 Wortliste enthalten. Der Eintrag ist jedoch fehlerhaft.
1124 \end{enumerate}
1126 Falls das Wort nicht in der Wortliste enthalten ist, bestehen sehr
1127 gute Chancen, dass es aufgenommen wird, wenn eines der folgenden
1128 Kriterien erfüllt ist:
1130 \begin{enumerate}[\hspace{1em}A.]
1131 \refstepcounter{enumi}% Fortsetzung der obigen Aufzählung.
1133 \item\label{enum:kritHerkTM} Das betreffende Wort wird mit den
1134 \emph{herkömmlichen} Trennmustern für die traditionelle oder
1135 reformierte Rechtschreibung korrekt getrennt. Korrekt bedeutet
1136 hier: Nicht alle möglichen Trennstellen müssen erkannt werden; es
1137 werden jedoch in keinem Fall falsche Trennstellen ermittelt. Zum
1138 Testen kann in \TeX\ der folgende Aufruf verwendet werden (die
1139 Ausgabe erfolgt in der \texttt{log}-Datei):
1141 \begin{lstlisting}[style=LaTeX]
1142 \showhyphens{durch Leerzeichen getrennte Wörter}
1143 \end{lstlisting}
1145 \item\label{enum:kritSinn} Es handelt es sich um eine orthographisch
1146 richtige, aber sinnentstellende oder irreführende Trennung.
1147 Berücksichtigt werden allerdings nur Wörter, die aus höchstens zwei
1148 (gegebenenfalls prä- und suffigierten) Wörtern zusammengesetzt sind,
1149 zum Beispiel »Talent-wässerung«. Nicht berücksichtigt wird
1150 hingegen die »Talent-wässerungsanlage«.
1152 \end{enumerate}
1154 Einige bekannte Fehler in den Trennmustern sind in der Datei
1155 \Datei{CHANGES} verzeichnet. Noch nicht bekannte falsche, fehlende
1156 und unerwünschte Worttrennungen können an die E-Mail-Adresse
1157 \href{mailto:trennmuster@dante.de}{trennmuster@dante.de} gerichtet
1158 werden.
1160 Trennfehler, die in den Trennmustern nicht korrigiert werden können,
1161 können mit Hilfe einer privaten Ausnahmeliste behandelt werden:
1163 \begin{lstlisting}[style=LaTeX]
1164 \hyphenation{Tal-entwäs-se-rungs-an-la-ge Kaf-ka-kenner-klub}
1165 \end{lstlisting}
1167 Die aktuelle und ältere Ausgaben der Trennmuster sind im Dateibereich
1168 des Trennmuster-Wikis erhältlich.%
1169 \footnote{\url{https://projekte.dante.de/Trennmuster}}
1171 Im Entwicklerrepositorium\footnote{%
1172 siehe \url{https://projekte.dante.de/Trennmuster/Entwickler}}
1173 befindet sich ein Makefile, mit dem jederzeit neue Trennmuster erzeugt
1174 werden können.
1176 \nobreak
1177 \noindent\parbox{\linewidth}{%
1178 \vspace*{\baselineskip}
1179 \raggedright
1180 \itshape
1181 Happy \TeX ing!\newline
1182 Die deutschsprachige Trennmustermannschaft
1186 \begingroup
1187 \RaggedRight
1188 \bibliography{dehyph-exptl}
1189 \endgroup
1192 \appendix
1193 \section{Dateien und Installation}
1194 \label{sec:installation}
1196 Die eigentlichen Trennmusterdateien liegen in \Abk{utf-8}"=Kodierung
1197 vor (siehe \autoref{tab:dateien}, Endung \texttt{.pat}). Sie werden
1198 von \hologo{TeX} nicht direkt geladen, sondern durch Manteldateien,
1199 die ebenfalls Teil des Pakets sind (Endung \texttt{.tex}). Wird eine
1200 8-Bit-fähige \hologo{TeX}"=Variante erkannt, übernehmen diese
1201 Manteldateien die Konvertierung der Trennmuster in die
1202 \Abk{t1}-Kodierung.
1204 \begin{table}
1205 \centering
1206 \caption{Trennmuster- und Manteldateien}
1207 \label{tab:dateien}
1208 \begin{tabular}{l>{\ttfamily}l>{\ttfamily}l}
1209 Rechtschreibung & \normalfont Trennmusterdatei & \normalfont Manteldatei\\
1210 \addlinespace\toprule\addlinespace
1211 traditionell & dehypht-x-<datum>.pat & dehypht-x-<datum>.tex\\
1212 traditionell (Schweiz) & dehyphts-x-<datum>.pat & dehyphts-x-<datum>.tex\\
1213 reformiert & dehyphn-x-<datum>.pat & dehyphn-x-<datum>.tex\\
1214 \end{tabular}
1215 \end{table}
1217 Bei der Installation werden die Manteldateien an die in
1218 \autoref{tab:varietaeten} gezeigten Trennmusterbezeichner gebunden.
1219 Diese Schritte werden für verschiedene \hologo{TeX}"=Verteilungen in
1220 der Datei \Datei{INSTALL} beschrieben. Nach der Installation können
1221 die experimentellen Trennmuster wie in \autoref{sec:aktivieren}
1222 gezeigt verwendet werden.
1225 \section{Fragen \& Antworten}
1226 \label{sec:fragen}
1228 \newcommand*{\fragefont}{\itshape}
1229 \newcommand*{\themenfont}{\large\normalfont}
1230 \newcounter{cntfrage}% Zähler für Fragen.
1231 \newcounter{thema}% Zähler für Themenüberschriften.
1232 \renewcommand*{\thethema}{\Roman{thema}.}
1233 \newcounter{frage}% Zähler für Fragen.
1234 \renewcommand*{\thefrage}{\arabic{frage}.}
1235 \newboolean{nextfrage}
1237 \makeatletter
1239 %%% Neue zref-Liste frage = (type, text, anchor).
1240 \zref@newlist{frage}
1241 \zref@newprop{type}{f}
1242 \zref@newprop{text}{??}
1243 \zref@addprop{frage}{type}
1244 \zref@addprop{frage}{text}
1245 \zref@addprop{frage}{anchor}
1247 %%% Fügt eine neue Themenüberschrift ein.
1248 \newcommand*{\fragenthema}[1]{%
1249 \par
1250 \pagebreak[1]
1251 \vspace{1.5\baselineskip plus .6\baselineskip minus .6\baselineskip}
1252 \refstepcounter{cntfrage}
1253 \stepcounter{thema}
1254 \zref@setcurrent{type}{t}
1255 \zref@setcurrent{text}{\thethema~#1}
1256 \zref@labelbylist{frage:\thecntfrage}{frage}
1257 \noindent{\themenfont\thethema~#1\par}
1260 %%% Umgebung für eine Frage mit Antwort.
1261 \newenvironment{frageantwort}[1]{%
1262 \par
1263 \vspace{.25\baselineskip plus .1\baselineskip minus .1\baselineskip}
1264 \refstepcounter{cntfrage}
1265 \stepcounter{frage}
1266 % bei Aufzählungen innerhalb einer Frage römisch nummerieren
1267 \renewcommand{\labelenumi}{\roman{enumi}.}
1268 \zref@setcurrent{type}{f}
1269 \zref@setcurrent{text}{\thefrage~#1}
1270 \zref@labelbylist{frage:\thecntfrage}{frage}
1271 \noindent{\fragefont\thefrage~#1\par}
1272 \nobreak\noindent\ignorespaces
1274 \vspace{.25\baselineskip plus .1\baselineskip minus .1\baselineskip}
1277 %%% Zeige alle Fragen in sortierter Reihenfolge.
1278 \newcommand{\zeigefragen}{%
1279 \par
1280 \zref@refused{frage:1}
1281 \setcounter{cntfrage}{1}
1282 \setboolean{nextfrage}{true}
1283 \whiledo{\boolean{nextfrage}}{
1284 \vspace{.25\baselineskip plus .1\baselineskip minus .1\baselineskip}
1285 \ifthenelse{\equal{\zref@extract{frage:\thecntfrage}{type}}{f}}{% Frage
1286 \noindent%
1287 \begingroup%
1288 \fragefont%
1289 \hyperlink{\zref@extract{frage:\thecntfrage}{anchor}}{%
1290 \zref@extract{frage:\thecntfrage}{text}%
1292 \par
1293 \endgroup
1294 }{% Themenüberschrift
1295 \noindent%
1296 \begingroup%
1297 \themenfont%
1298 \zref@extract{frage:\thecntfrage}{text}%
1299 \par
1300 \endgroup
1301 \nobreak
1303 \stepcounter{cntfrage}
1304 \zref@ifrefundefined{frage:\thecntfrage}{\setboolean{nextfrage}{false}}{}
1306 \vspace{.5\baselineskip plus .1\baselineskip minus .1\baselineskip}
1307 \setcounter{cntfrage}{0}
1308 \setcounter{frage}{0}
1312 \zeigefragen
1315 \fragenthema{Verwenden der Trennmuster}
1317 \begin{frageantwort}{Wie kann für die experimentellen Trennmuster aus
1318 dem Paket \Paket{dehyph-exptl} das Datum ermittelt werden, das
1319 Teil des Trennmusterbezeichners ist, wie in
1320 \autoref{sec:verwenden} erwähnt?}
1322 Die Trennmusterbezeichner werden in der Datei \Datei{language.dat}
1323 definiert, wo auch die Verbindung zu den Manteldateien hergestellt
1324 wird. Da ein Teil der Trennmusterbezeichner bereits bekannt ist,
1325 \verb+german-x+, vgl. \autoref{tab:varietaeten}, kann die Datei
1326 \Datei{language.dat} danach durchsucht werden. Zunächst muss der
1327 Ort der Datei mit Hilfe des Kommandos \Programm{kpsewhich} ermittelt
1328 werden. Es folgen die vollständigen Kommandos für unixähnliche
1329 Shells und die Windows-Kommandozeile \Datei{cmd.exe} (einzugeben
1330 ohne Zeilenumbruch). Achtung, bei den einfachen Anführungszeichen
1331 handelt es sich um Gravis (»Backquotes«).
1333 \begin{lstlisting}[style=shell, caption=Shell]
1334 grep -i german-x `kpsewhich language.dat`
1335 \end{lstlisting}
1337 \begin{lstlisting}[style=shell, caption=\Datei{cmd.exe}]
1338 for /F "usebackq" %f in (`kpsewhich language.dat`)
1339 do find /i "german-x" "%f"
1340 \end{lstlisting}
1342 Die Ausgabe dieser Kommandos sieht etwa wie folgt aus (das Datum
1343 kann abweichen):
1345 \begin{lstlisting}
1346 german-x-2023-03-06 dehypht-x-2023-03-06.tex
1347 =german-x-latest
1348 ngerman-x-2023-03-06 dehyphn-x-2023-03-06.tex
1349 =ngerman-x-latest
1350 \end{lstlisting}
1352 Die gesuchten Trennmusterbezeichner befinden sich in der ersten
1353 Spalte und lauten in diesem Beispiel
1354 \lstinline[style=LaTeX]{german-x-2023-03-06} und
1355 \lstinline[style=LaTeX]{ngerman-x-2023-03-06}. In der zweiten
1356 Spalte kann man die Namen der Manteldateien erkennen
1357 (vgl. \autoref{tab:dateien}). Die mit einem Gleichheitszeichen
1358 beginnenden Zeilen definieren ein Synonym für den
1359 Trennmusterbezeichner der unmittelbar vorangehenden Zeile in der
1360 Datei \Datei{language.dat}.
1361 \end{frageantwort}
1364 \begin{frageantwort}{Wie kann die Version der experimentellen Muster
1365 ermittelt werden, die im Paket \Paket{hyph-utf8} enthalten sind?}
1367 Das Vorgehen ähnelt dem der vorherigen Antwort. Zunächst wird der
1368 Ort einer bestimmten Datei ermittelt. Diese wird dann nach einer
1369 hilfreichen Zeichenkette durchsucht.
1371 \begin{lstlisting}[style=shell, caption=Shell]
1372 grep dehyph `kpsewhich hyph-de-1996.tex`
1373 \end{lstlisting}
1375 \begin{lstlisting}[style=shell, caption=\Datei{cmd.exe}]
1376 for /F "usebackq" %f in (`kpsewhich hyph-de-1996.tex`)
1377 do find "dehyph" "%f"
1378 \end{lstlisting}
1380 Die Ausgabe dieser Kommandos sieht etwa wie folgt aus (das Datum
1381 kann abweichen):
1383 \begin{lstlisting}
1384 \message{German Hyphenation Patterns (Reformed Orthography, 2006)
1385 `dehyphn-x' 2023-03-06 (WL)}
1386 \end{lstlisting}
1387 \end{frageantwort}
1389 \begin{frageantwort}{Wie kann die Version der experimentellen Muster
1390 ermittelt werden, die von \hologo{ConTeXt} verwendet werden?}
1392 Derzeit (Stand Februar 2021) gibt es keine Möglichkeit, die Version direkt
1393 zu ermitteln. Allerdings werden die \hologo{ConTeXt}-Muster automatisch
1394 aus den vorhandenen \Paket{hyph-utf8}-Mustern erzeugt; die Versionen sind
1395 daher ident zu den in \hologo{XeTeX} verwendeten Mustern.
1396 \end{frageantwort}
1398 \begin{frageantwort}{Ich habe neue Trennmuster erstellt. Wie kann ich diese
1399 installieren?}
1401 Die folgende Antwort richtet sich an Nutzer von \hologo{TeX} Live, die auf
1402 ihrem System über Administrationsrechte verfügen.
1404 \begin{enumerate}
1406 \item Überprüfen Sie, ob auf Ihrem System das Verzeichnis
1407 \Datei{TEXMFLOCAL\slash tex\slash generic\slash config}
1408 existiert.\footnote{Bei \Datei{TEXMFLOCAL} handelt es sich um den lokalen
1409 Baum der \hologo{TeX}-Installation, unter Unix in der Regel
1410 \Datei{/usr/local/texlive/texmf-local}, unter Windows \Datei{C:\textbackslash
1411 texlive\textbackslash texmf-local}.} Falls nicht, legen Sie es an.
1413 \item Überprüfen Sie, ob im Verzeichnis \Datei{TEXMFLOCAL\slash tex\slash
1414 generic\slash config} die Dateien \Datei{language-local.dat} und
1415 \Datei{language-local.def} existieren. Falls nicht, legen Sie sie an.
1417 \item Ergänzen Sie in der Datei \Datei{language-local.def} die folgende
1418 Zeile:\footnote{Als Vorbild für die erforderlichen Angaben können die
1419 vorhandenen Eintragungen in den Konfigurationsdateien \Datei{language.def}
1420 und \Datei{language.dat} der \hologo{TeX}-Installation dienen.}
1422 \begin{lstlisting}[style=LaTeX]
1423 \addlanguage{<Name>}{<Datei>}{<Ausnahmedatei>}{<lmin>}{<rmin>}
1424 \end{lstlisting}
1426 \noindent Dabei ist \texttt{<Name>} eine selbstgewählte Bezeichnung für die
1427 Trennmuster, \texttt{<Datei>} der Name der Trennmusterdatei bzw. der
1428 Manteldatei, wenn es eine solche gibt (vgl. \autoref{sec:installation}),
1429 \texttt{<Ausnahmedatei>} ggf. eine Datei mit Trennausnahmen (ansonsten leer),
1430 \texttt{<lmin>} die Mindestlänge einer am Wortanfang und
1431 \texttt{<rmin>} die Mindestlänge einer Wortende abgetrennten
1432 Silbe. Für deutsche Trennmuster setzt man die beiden letztgenannten Werte
1433 typischerweise auf \texttt{2}.
1435 Ergänzen Sie entsprechend in der Datei \Datei{language-local.dat} die
1436 folgende Zeile:
1438 \begin{lstlisting}
1439 <Name> <Datei>
1440 \end{lstlisting}
1442 \item Verschieben Sie Ihre Trennmusterdateien in das Verzeichnis
1443 \Datei{TEXMFLOCAL\slash tex\slash generic}.
1445 \item Führen Sie \emph{als Administrator} die Befehle
1447 \begin{lstlisting}[style=shell]
1448 mktexlsr
1449 \end{lstlisting}
1451 \noindent und
1453 \begin{lstlisting}[style=shell]
1454 tlmgr generate --rebuild-sys language
1455 \end{lstlisting}
1457 \noindent aus.
1459 \end{enumerate}
1461 Die so installierten Trennmuster können nun den Hinweisen in
1462 \autoref{sec:aktivieren} entsprechend aktiviert werden.
1463 \end{frageantwort}
1465 \begin{frageantwort}{Um in bestimmten Dokumenten einen dauerhaft stabilen
1466 Umbruch zu erreichen, will ich verhindern, dass die zur Zeit vorhandenen
1467 Trennmuster bei einer Aktualisierung der \hologo{TeX}-Installation verloren
1468 gehen. Wie gehe ich vor?}
1470 Suchen Sie auf Ihrem System nach der benötigten Trennmusterdatei und der
1471 zugehörigen Manteldatei gemäß \autoref{tab:dateien} und erstellen Sie Kopien
1472 dieser Dateien. Folgen Sie dann den Anweisungen der Antwort auf die vorige
1473 Frage.
1475 \end{frageantwort}
1478 \fragenthema{Rechtschreibung}
1480 \begin{frageantwort}{Verlag, Prüfer o.\,ä. bemängeln die Trennung der
1481 Trennmuster für die reformierte Rechtschreibung. Zum Beispiel
1482 wird »In-dus-trie« getrennt, der Duden trennt jedoch
1483 »In-dust-rie«.}
1485 Die amtlichen Regeln für die Rechtschreibung der deutschen Sprache
1486 lassen für viele Wörter mehrere Trennvarianten zu. Die Trennmuster
1487 und ebenso Wörterverzeichnisse legen sich aus praktischen Gründen
1488 auf eine Trennvariante fest. Sie können daher unterschiedliche
1489 Trennungen verwenden, ohne dass eine von beiden falsch ist. Aus
1490 diesem Grund sind Wörterverzeichnisse nicht geeignet, eine bestimmte
1491 Trennung auf Richtigkeit zu prüfen. Verbindlich sind einzig die
1492 amtlichen Regeln für die Rechtschreibung der deutschen
1493 Sprache~\cite{amtlRegeln:2006}. Häufig sind diese im Anhang eines
1494 Wörterbuchs abgedruckt. Die von den Trennmustern befolgten
1495 Konventionen können \autoref{sec:trennregeln} entnommen werden.
1497 Wenn Unsicherheit darüber herrscht, wie die Rechtschreibung geprüft
1498 wird, sollte dies frühzeitig geklärt werden. Nicht jedem Redakteur
1499 oder Prüfer ist bewusst, dass der Duden seine normative Stellung mit
1500 der Rechtschreibreform~1996 eingebüßt hat.
1501 \end{frageantwort}
1504 \begin{frageantwort}{Gibt es dudenkonforme Trennmuster für die
1505 reformierte Rechtschreibung?}
1507 Zur Zeit nicht, es ist auch nicht geplant. Dieses Projekt ist
1508 jedoch offen für Vorschläge und Mitarbeit.
1509 \end{frageantwort}
1512 \begin{frageantwort}{Weshalb werden noch Trennmuster für die
1513 traditionelle Rechtschreibung bereitgestellt?}
1515 Die amtlichen Regeln für die Rechtschreibung der deutschen Sprache
1516 in der Fassung von 2006 sind nur für öffentliche Einrichtungen und
1517 Behörden verbindlich. Im privaten Schriftverkehr kann man wahlweise
1518 die traditionelle oder die reformierte Rechtschreibung verwenden.%
1519 \footnote{Oder auch keine von beiden.}
1521 Daher erfreut sich die traditionelle Rechtschreibung weiterhin
1522 großer Beliebtheit.
1524 Für Texte in gebrochener Schrift ist die traditionelle
1525 Rechtschreibung sogar vorzuziehen.
1526 \end{frageantwort}
1528 \begin{frageantwort}{In der Voreinstellung für die deutsche Sprache
1529 beträgt die Mindestlänge abgetrennter Silben zwei Buchstaben. Wie
1530 kann diese Mindestlänge verändert werden?}
1532 Nehmen wir an, am Wortanfang sollen nicht weniger als drei und am
1533 Wortende nicht weniger als vier Buchstaben abgetrennt werden. Dann
1534 sind folgende Befehle nötig:
1536 \begin{itemize}
1537 \item Mit Plain-\hologo{TeX}:
1539 \begin{lstlisting}[style=LaTeX]
1540 \uselanguage{<sprache>}
1541 \lefthyphenmin=3
1542 \righthyphenmin=4
1543 \end{lstlisting}
1545 Ersetze dabei \texttt{<sprache>} durch eine der in
1546 \autoref{subsubsec:PlainTeX} erwähnten Trennmusterbezeichnungen,
1547 beispielsweise \texttt{ngerman}.
1549 \item Mit \hologo{LaTeX} und \Paket{Babel}:
1551 \begin{lstlisting}[style=LaTeX]
1552 \usepackage[<sprache>]{babel}
1553 \renewcommand*{\<sprache>hyphenmins}{34}
1554 \end{lstlisting}
1556 Ersetze dabei \texttt{<sprache>} durch eine der in
1557 \autoref{subsubsec:LaTeX+Babel} erwähnten
1558 \Paket{Babel}-Sprachbezeichnungen, beispielsweise
1559 \texttt{ngerman}.
1561 \item Mit \hologo{XeLaTeX}/\hologo{LuaLaTeX} und
1562 \Paket{Polyglossia} (Version 1.50 oder neuer):
1564 \begin{lstlisting}[style=LaTeX]
1565 \usepackage{polyglossia}
1566 \setmainlanguage{german}
1567 \setlanghyphenmins[<option>]{<sprache>}{3}{4}
1568 \end{lstlisting}
1570 Ersetze dabei \texttt{<option>} und \texttt{<sprache>} durch eine der in
1571 \autoref{subsubsec:LaTeX+PolyGlossia} erwähnten
1572 \Paket{Polyglossia}-Sprachbezeichnungen, beispielsweise
1573 \texttt{spelling=old} und \texttt{german}.
1574 \end{itemize}
1575 \end{frageantwort}
1577 \begin{frageantwort}{Können Trennungen mit einer Silbenlänge von nur
1578 einem Buchstaben ermöglicht werden, zum Beispiel für den Satz in
1579 schmalen Kolumnen?}
1581 Mit diesen Trennmustern ist das nicht möglich. Die
1582 Abtrennung einzelner Vokale, zum Beispiel »A-bend«, war nur
1583 kurzzeitig zulässig; die entsprechende Regelung von 1996 wurde mit
1584 der Rechtschreibreform 2006 wieder zurückgenommen. Wird die
1585 Silbenmindestlänge für die Worttrennung auf eins verringert, können
1586 falsche Trennungen auftreten.
1587 \end{frageantwort}
1590 \fragenthema{Mitarbeit}
1592 \begin{frageantwort}{Wie kann ich mich über dieses Projekt
1593 informieren?}
1595 Zentrale Anlaufstelle ist das Trennmuster-Wiki, welches sich
1596 momentan jedoch noch im Aufbau befindet.%
1597 \footnote{\url{https://projekte.dante.de/Trennmuster}}
1599 Für Fragen und Hinweise kann nach Anmeldung die Mailingliste%
1601 \footnote{\href{mailto:trennmuster@dante.de}{trennmuster@dante.de}}
1603 genutzt werden.
1605 \begin{itemize}
1607 \item Die Datei \Datei{CHANGES} enthält bekannte, systematische
1608 Fehler der Trennmuster.
1610 \item Das
1611 Entwicklerrepositorium%
1613 \footnote{\url{https://repo.or.cz/wortliste.git/tree/HEAD:/dokumente}}
1615 enthält im Verzeichnis \Datei{dokumente} eine Reihe von Dateien, welche
1616 u.\,a. Trennregeln und Trennstile im Detail beschreibt.
1618 \end{itemize}
1619 \end{frageantwort}
1622 \begin{frageantwort}{Wie kann ich helfen?}
1624 Die deutschsprachige Trennmustermannschaft ist eine offene Gruppe
1625 und benötigt dringend weitere Mithilfe. Interessenten sind daher
1626 hoch willkommen! Zum Mitmachen gibt es mehrere Möglichkeiten:
1628 \begin{itemize}
1629 \item Die einfachste ist, die experimentellen Trennmuster ausgiebig
1630 zu testen und Fehler zu melden (siehe \autoref{sec:trennfehler}).
1632 \item Besonders hilfreich wäre Mitarbeit am Projekt. Als Einstieg
1633 kann die (grobe) Aufgabenliste in der Projektbeschreibung dienen.
1635 Obwohl schon experimentelle Trennmuster veröffentlicht wurden,
1636 steht dieses Projekt noch ziemlich am Anfang. Ziel ist, die
1637 verwendete Wortliste von möglichst vielen Menschen in verteilter
1638 Arbeit auf Richtigkeit zu prüfen. Bis dahin bleibt jedoch noch
1639 viel zu tun.
1641 \item Mittelfristig -- nach Fertigstellung der Prüfmaske~-- kann
1642 auch durch systematische Durchsicht eines Teils der Wortliste
1643 geholfen werden.
1645 \item Fragen, Hinweise und Ideen sind auf der Mailingliste immer
1646 willkommen!
1647 \end{itemize}
1648 \end{frageantwort}
1651 \begin{frageantwort}{Sollten Trennfehler einzeln oder gesammelt
1652 eingereicht werden?}
1654 Das ist egal. Es sollten allerdings die folgenden Hinweise beim
1655 Einreichen von Fehlern beachtet werden:
1657 \begin{description}
1658 \setkomafont{descriptionlabel}{\normalfont\itshape}
1660 \item[Aktualität] Wenn ältere Trennmusterdateien verwenden werden,
1661 bitte zuerst prüfen, ob der Fehler auch mit aktuellen Trennmustern
1662 auftritt. Die aktuellen Trennmuster sind auf \Abk{ctan} im Paket
1663 \Paket{dehyph-exptl} oder im Dateibereich unter der
1664 Projekt-\Abk{url} erhältlich. Im Repositorium befindet sich auch
1665 ein Makefile, mit dem jederzeit neue Trennmuster aus der aktuellen
1666 Wortliste erzeugt werden können.
1668 \item[Informationen] In einem Fehlerbericht sollte für das
1669 betreffende Wort die richtige und bei einzelnen Worteinreichungen
1670 auch die falsche Trennung angegeben werden. Außerdem die genaue
1671 Version der verwendeten Trennmuster (traditionelle oder
1672 reformierte Rechtschreibung, Datum der Trennmusterdatei).
1674 \item[Listenformat] Es erleichtert die Korrektur, wenn
1675 Berichtigungsvorschläge in Form einer Liste eingereicht werden,
1676 die automatisch mit Skripten bearbeitet werden kann. Die
1677 folgenden Konventionen sollten dabei eingehalten werden:
1679 \begin{itemize}
1680 \item Die Spalten werden mit einem Semikolon \verb+;+ getrennt.
1681 \item Die erste Spalte enthält das betreffende Wort in
1682 ungetrennter Form.
1683 \item Die zweite Spalte enthält das Wort in der Trennvariante nach
1684 traditioneller Rechtschreibung.
1685 \item Falls die Trennung nach reformierter Rechtschreibung davon
1686 abweicht, steht diese in der dritten Spalte.
1687 \item Ab der vierten Spalte \emph{können} weitere Trennvarianten
1688 folgen, etwa die falsche Trennung. Eine kurze Erklärung sollte
1689 dann darauf eingehen.
1690 \item Unerwünschte Trennungen werden mit einem Punkt \verb+.+
1691 markiert.
1692 \item Anfang und Ende der Liste sollten klar erkennbar sein.
1693 \end{itemize}
1695 Eine Liste könnte beispielhaft so aussehen:
1697 \begin{lstlisting}[style=Text]
1698 sonnendurchfluteten;son-nen-durch-flu-te-ten
1699 Talentwässerung;Tal-ent.wäs-se-rung
1700 Fensterplatz;Fen-ster-platz;Fens-ter-platz
1701 \end{lstlisting}
1703 Dieses Format ist auch für einzeln eingereichte Korrekturen
1704 sinnvoll.
1706 \item[Betreff] Der Betreff einer Fehlermeldung sollte aussagekräftig
1707 sein. Daher sollten mehrere Trennfehler, sofern möglich,
1708 thematisch zusammengefasst werden. Außerdem kann zur einfacheren
1709 Zuordnung das entsprechende Kriterium aus
1710 \autoref{sec:trennfehler} dem Betreff der E-Mail in eckigen
1711 Klammern vorangestellt werden, zum Beispiel:
1713 \begin{lstlisting}[style=Text]
1714 Betreff: [A] sonnendurchfluteten
1715 \end{lstlisting}
1717 \noindent für einen Trennfehler im Wortes
1718 \emph{sonnendurchfluteten}, der durch einen Fehler in der
1719 Wortliste hervorgerufen wird.
1720 \end{description}
1721 \end{frageantwort}
1723 \end{document}
1725 %%% Local Variables:
1726 %%% mode: latex
1727 %%% TeX-engine: default
1728 %%% TeX-PDF-mode: t
1729 %%% TeX-master: t
1730 %%% coding: utf-8
1731 %%% End: