Makefile: Besserer Standardwert für `SRCDIR`, neue Variable `OUTDIR`.
[wortliste.git] / dehyph-exptl / CHANGES
blob30d713ecc7647eb251673ad566597ec22b0ca963
1 # Beschreibung
3 Diese Datei beschreibt die wichtigsten Änderungen der experimentellen
4 Trennmuster und einige bekannte Probleme (hauptsächlich systematische
5 Fehler).  Genauere Informationen zu den Änderungen können dem
6 öffentlichen Entwicklerrepositorium entnommen werden.  Nähere
7 Informationen zum Zugriff auf das Repositorium enthält das
8 [Trennmuster-Wiki](https://projekte.dante.de/Trennmuster).
10 Mit Hilfe des Skripts `patgen-list-diff.sh` kann man sich zum Beispiel
11 einfach einen Überblick über die korrigierten, hinzugefügten und
12 entfernten Wörter je Sprachvarietät in der zugrundeliegenden
13 Wortdatenbank zwischen zwei Paketversionen verschaffen.
15 Ältere Veröffentlichungen des Pakets können im Dateibereich des
16 [Trennmuster-Wikis](https://projekte.dante.de/Trennmuster) gefunden
17 werden.
21 # Bekannte Probleme
23 ## Alle Trennmusterdateien
25 * Es gibt Probleme mit Namen und geographischen Bezeichnungen.  Das wird
26   auch bis zu einem gewissen Grade immer so bleiben, da die den
27   Trennmustern zugrunde liegende Wortliste nie vollständig sein kann.
28   Grobe Fehltrennungen bitte melden!
30 * Der Ersatz _sz_ für _ß_ in der traditionellen Rechtschreibung wird
31   bisher nicht berücksichtigt.
34 # Änderungen
36 ## v0.8 (2022-03-16)
38 #### Wortdatenbank
40 505060 Einträge.
42       Rechtschreibung         hinzugefügt   entfernt   korrigiert
43     ---------------------------------------------------------------
44       traditionell (DE, AT)          6170         15           93
45       traditionell (CH)              6170         15           42
46       reformiert                     6112         21           48
49 ## v0.7 (2021-02-26)
51 #### Wortdatenbank
53 499731 Einträge.
55       Rechtschreibung         hinzugefügt   entfernt   korrigiert
56     ---------------------------------------------------------------
57       traditionell (DE, AT)         30456        150          941
58       traditionell (CH)             30456        150          941
59       reformiert                    30150        144          909
61 #### Verschiedenes
63 * Alle Wörter der Wortdatenbank mit Umlauten werden jetzt auch in Umschrift
64   getrennt.  So sind beispielsweise zusätzlich zu den Einträgen
66       Bä-ren
67       lö-sen
68       Tü-re
70   die Formen
72       Bae-ren
73       loe-sen
74       Tue-re
76   in den Trennmustern erfasst.
78 * Die Trennmuster werden mit neuen Patgen-Parametern erzeugt.
81 ## v0.6 (2019-04-04)
83 #### Wortdatenbank
85       Rechtschreibung         hinzugefügt   entfernt   korrigiert
86     ---------------------------------------------------------------
87       traditionell (DE, AT)          3414        116         1010
88       traditionell (CH)              3414        116         1002
89       reformiert                     3375         89          897
91 #### Paket
93 * Alle Dateien verwenden jetzt UTF-8-Kodierung.
95 #### Verschiedenes
97 * Das Babel-Paket (für plain TeX und LaTeX) unterstützt seit 2013
98   traditionelle deutsch-schweizerische Trennmuster, die mit dem
99   Sprachargument `swissgerman` aktiviert werden können.  Details dazu finden
100   sich in der Dokumentationsdatei `germanb.pdf` vom `babel-german`-Paket.
103 ## v0.5 (2018-03-31)
105 #### Wortdatenbank
107       Rechtschreibung         hinzugefügt   entfernt   korrigiert
108     ---------------------------------------------------------------
109       traditionell (DE, AT)          5953         24          716
110       traditionell (CH)              5953        459          720
111       reformiert                     5853         29          665
113 * _traditionelle schweizerdeutsche Rechtschreibung:_ Die
114   Dreikonsonantenregel wurde irrtümlicherweise auch auf den
115   Buchstaben _s_ angewandt; das ist jetzt korrigiert.
117 #### Paket
119 * Die Trennmusterdateien verwenden jetzt das YAML-Format; es folgt damit
120   dem `tex-hyphen`-Projekt, welches (ab der nächsten Version) ebenfalls
121   dieses Format zur einheitlichen Identifizierung und Beschreibung aller
122   Trennmuster verwendet.
124 * Die Dokumentation wurde überarbeitet.
127 ## v0.41 (2017-03-31)
129 #### Wortdatenbank
131       Rechtschreibung         hinzugefügt   entfernt   korrigiert
132     ---------------------------------------------------------------
133       traditionell (DE, AT)         24701         65          644
134       traditionell (CH)             24819         65          652
135       reformiert                    24280         33          703
137 #### Trennmuster
139 * Der Prozess der Musterberechnung wurde geändert, so dass in Patgen
140   alle im Zeichensatz ISO-8859-15 enthaltenen Buchstaben genutzt werden
141   können.  Unter anderem werden jetzt auch die Wörter _Œuvre_ und
142   _Škoda_ korrekt getrennt.
144 #### Paket
146 * Die Trennmusterdateien des dehyph-exptl-Pakets
147   (`dehyph*-x-2017-03-31.pat`) stehen jetzt unter der
148   [MIT-Lizenz][liz-mit].
151 ## v0.40 (2014-05-21)
153 #### Wortdatenbank
155       Rechtschreibung         hinzugefügt   entfernt   korrigiert
156     ---------------------------------------------------------------
157       traditionell (DE, AT)          2493        274          458
158       traditionell (CH)              2493        274          457
159       reformiert                     2468        278          394
161 * Die Arbeiten an der Klassifizierung von Trennstellen sind nahezu
162   abgeschlossen.
164 * Es wird eine Liste mit Schreibweisen vor der I. Orthographischen
165   Konferenz gepflegt (Datei `pre-1901`).  Mit Hilfe dieser Datei lassen
166   sich Muster erstellen, die veraltete Wörter und Schreibweisen
167   erwartungsgemäßer trennen.
169 * Die Lizenz der Dateien im [Entwickler-Repositorium][repo-wl] wurde
170   klargestellt ([MIT][liz-mit]).  (Das Paket `dehyph-exptl` steht jedoch
171   unter der [LPPL][liz-lppl].)
173 [repo-wl]: https://repo.or.cz/w/wortliste.git
174 [liz-mit]: https://opensource.org/licenses/mit-license.php
175 [liz-lppl]: https://www.latex-project.org/lppl.txt
178 ## v0.3 (2013-05-26)
180 #### Wortdatenbank
182       Rechtschreibung         hinzugefügt   entfernt   korrigiert
183     ---------------------------------------------------------------
184       traditionell (DE, AT)          5665         23          154
185       traditionell (CH)              5904         23          126
186       reformiert                     4852         12          123
188 * Weitere Arbeiten an der Klassifizierung von Trennstellen.
190 * Abgleich mit dem elektronischen Grimmschen Wörterbuch (ca. 1800
191   eingearbeitete Wörter).
193 * Viele Wörter mit drei aufeinanderfolgenden Konsonanten wurden
194   hinzugefügt.
196 * Viele weitere irreführende Trennungen der Form ...er-... werden
197   unterdrückt (z. B. ab-erkann-te).
200 ## v0.23 (2012-05-30)
202 #### Wortdatenbank
204       Rechtschreibung         hinzugefügt   entfernt   korrigiert
205     ---------------------------------------------------------------
206       traditionell (DE, AT)            44         93          166
207       traditionell (CH)                44         93          161
208       reformiert                       45         56           67
210 * Die Wortdatenbank liegt in UTF-8-Kodierung vor.
212 * _traditionelle Rechtschreibung (DE, AT, CH):_ Greift an einer Wortfuge
213   die Dreikonsonantenregel, so wird die folgende Trennstelle
214   grundsätzlich unterdrückt, sofern sie einen Abstand von nur zwei
215   Lauten hat.  Beispiele:
217         Metallegierung  =>  Me-tallegie-rung
218         Stilleben       =>  Stilleben
220     Aber:
222         Brennessel      =>  Brennes-sel
223         Stoffetzen      =>  Stoffet-zen
225 #### Paket
227 * Wenn pTeX verwendet wird, werden nun kompatible Trennmuster aus dem
228   Paket `hyph-utf8` geladen.  (Das Paket `hyph-utf8` verwendet die
229   Trennmuster dieses Pakets.  Es kann sich dabei jedoch um eine andere
230   Version der Muster handeln.)
232 * Die Dateien `projektbeschreibung.*` wurden entfernt.  Die Inhalte sind
233   nun im [Trennmuster-Wiki](https://projekte.dante.de/Trennmuster) zu
234   finden.
237 ## v0.22 (2011-07-02)
239 #### Wortdatenbank
241       Rechtschreibung         hinzugefügt   entfernt   korrigiert
242     ---------------------------------------------------------------
243       traditionell (DE, AT)            39         64          109
244       traditionell (CH)                39         64          109
245       reformiert                        5         28          108
247 #### Paket
249 * Wenn pTeX verwendet wird, werden keine Trennmuster geladen (notwendig
250   für die platex-Formaterstellung in TeX Live 2011).
252 * Die Dokumentation wurde erweitert.
255 ## v0.20 (2009-06-24)
257 #### Wortdatenbank
259       Rechtschreibung         hinzugefügt   entfernt   korrigiert
260     ---------------------------------------------------------------
261       traditionell (DE, AT)         10458        156         5579
262       traditionell (CH)             10464         83          594
263       reformiert                     9945         69          595
265 * _traditionelle Rechtschreibung (DE, AT):_ Für alle Wörter mit _ß_
266   wurde die Ersatzschreibung mit _ss_ und Trennung wie mit _ß_
267   aufgenommen.  Das Babelkürzel `"S` muss damit in Versalwörtern nur
268   noch in Ausnahmefällen verwendet werden (siehe auch Regel T2 in der
269   Paketdokumentation).  Beispiele:
271         GRÜSSE   =>  GRÜ-SSE
272         GRÖSSTE  =>  GRÖSS-TE
274 * _traditionelle Rechtschreibung (CH):_ Für alle Wörter mit _ß_ wurde die
275   im Schweizer Standarddeutsch gebräuchliche Schreibung mit _ss_ und
276   Trennung als _s-s_ aufgenommen.  Beispiele:
278         Grüs-se   statt  Grü-ße
279         grös-ste  statt  größ-te
281 * Die Trennung von Zahlwörtern wurde verbessert.
283 * Die römischen Zahlen bis MMD (2500) werden nicht getrennt.
285 * Viele zusätzliche irreführende Trennungen werden vermieden.
287 * Viele Fehler wurden korrigiert.
289 #### Trennmuster
291 * Es werden Trennmuster für die traditionelle Rechtschreibung des in der
292   Schweiz verwendeten Standarddeutschs bereitgestellt.
293   Babelunterstützung für diese Trennmuster fehlt bisher jedoch.  Wer
294   machts?
296 * Die Patgen-Parameter wurden geändert.  Die Trennmusterdateien werden
297   dadurch etwas kleiner.
299 #### Paket
301 * Die Dokumentation wurde erweitert.
304 ## v0.13 (2008-07-07)
306 #### Wortliste
308       Rechtschreibung   hinzugefügt   entfernt   korrigiert
309     ---------------------------------------------------------
310       traditionell                0          0            0
311       reformiert                  0          0            0
313 #### Paket
315 * Die Dokumentation wurde überarbeitet.
318 ## v0.12 (2008-07-02)
320 #### Wortdatenbank
322       Rechtschreibung   hinzugefügt   entfernt   korrigiert
323     ---------------------------------------------------------
324       traditionell               12          1           28
325       reformiert                 12          1           28
327 #### Paket
329 * Die Dokumentation wurde erweitert.
332 ## v0.11 (2008-06-27)
334 #### Wortdatenbank
336       Rechtschreibung   hinzugefügt   entfernt   korrigiert
337     ---------------------------------------------------------
338       traditionell               18          0           44
339       reformiert                 18          0           45
341 * Einige knifflige Wortzusammensetzungen wurden hinzugefügt
342   (Patentrichter usw.)
344 #### Paket
346 * Die Dokumentation wurde erweitert.
349 ## v0.1 (2008-06-18)
351 * Erstveröffentlichung
355 <!--
356 %%% Local Variables:
357 %%% coding: utf-8
358 %%% mode: markdown
359 %%% End: