Version 0.9.
[wortliste.git] / dehyph-exptl / CHANGES
blob34599aecfe289d6f5ecde51d183a2003093a1da6
1 # Beschreibung
3 Diese Datei beschreibt die wichtigsten Änderungen der experimentellen
4 Trennmuster und einige bekannte Probleme (hauptsächlich systematische
5 Fehler).  Genauere Informationen zu den Änderungen können dem
6 öffentlichen Entwicklerrepositorium entnommen werden.  Nähere
7 Informationen zum Zugriff auf das Repositorium enthält das
8 [Trennmuster-Wiki](https://projekte.dante.de/Trennmuster).
10 Mit Hilfe des Skripts `patgen-list-diff.sh` kann man sich zum Beispiel
11 einfach einen Überblick über die korrigierten, hinzugefügten und
12 entfernten Wörter je Sprachvarietät in der zugrundeliegenden
13 Wortdatenbank zwischen zwei Paketversionen verschaffen.
15 Ältere Veröffentlichungen des Pakets können im Dateibereich des
16 [Trennmuster-Wikis](https://projekte.dante.de/Trennmuster) gefunden
17 werden.
21 # Bekannte Probleme
23 ## Alle Trennmusterdateien
25 * Es gibt Probleme mit Namen und geographischen Bezeichnungen.  Das wird
26   auch bis zu einem gewissen Grade immer so bleiben, da die den
27   Trennmustern zugrunde liegende Wortliste nie vollständig sein kann.
28   Grobe Fehltrennungen bitte melden!
30 * Der Ersatz _sz_ für _ß_ in der traditionellen Rechtschreibung wird
31   bisher nicht berücksichtigt.
34 # Änderungen
36 ## v0.9 (2023-03-06)
38 #### Wortdatenbank
40 XXX
42 ## v0.8 (2022-03-16)
44 #### Wortdatenbank
46 505060 Einträge.
48       Rechtschreibung         hinzugefügt   entfernt   korrigiert
49     ---------------------------------------------------------------
50       traditionell (DE, AT)          6170         15           93
51       traditionell (CH)              6170         15           42
52       reformiert                     6112         21           48
55 ## v0.7 (2021-02-26)
57 #### Wortdatenbank
59 499731 Einträge.
61       Rechtschreibung         hinzugefügt   entfernt   korrigiert
62     ---------------------------------------------------------------
63       traditionell (DE, AT)         30456        150          941
64       traditionell (CH)             30456        150          941
65       reformiert                    30150        144          909
67 #### Verschiedenes
69 * Alle Wörter der Wortdatenbank mit Umlauten werden jetzt auch in Umschrift
70   getrennt.  So sind beispielsweise zusätzlich zu den Einträgen
72       Bä-ren
73       lö-sen
74       Tü-re
76   die Formen
78       Bae-ren
79       loe-sen
80       Tue-re
82   in den Trennmustern erfasst.
84 * Die Trennmuster werden mit neuen Patgen-Parametern erzeugt.
87 ## v0.6 (2019-04-04)
89 #### Wortdatenbank
91       Rechtschreibung         hinzugefügt   entfernt   korrigiert
92     ---------------------------------------------------------------
93       traditionell (DE, AT)          3414        116         1010
94       traditionell (CH)              3414        116         1002
95       reformiert                     3375         89          897
97 #### Paket
99 * Alle Dateien verwenden jetzt UTF-8-Kodierung.
101 #### Verschiedenes
103 * Das Babel-Paket (für plain TeX und LaTeX) unterstützt seit 2013
104   traditionelle deutsch-schweizerische Trennmuster, die mit dem
105   Sprachargument `swissgerman` aktiviert werden können.  Details dazu finden
106   sich in der Dokumentationsdatei `germanb.pdf` vom `babel-german`-Paket.
109 ## v0.5 (2018-03-31)
111 #### Wortdatenbank
113       Rechtschreibung         hinzugefügt   entfernt   korrigiert
114     ---------------------------------------------------------------
115       traditionell (DE, AT)          5953         24          716
116       traditionell (CH)              5953        459          720
117       reformiert                     5853         29          665
119 * _traditionelle schweizerdeutsche Rechtschreibung:_ Die
120   Dreikonsonantenregel wurde irrtümlicherweise auch auf den
121   Buchstaben _s_ angewandt; das ist jetzt korrigiert.
123 #### Paket
125 * Die Trennmusterdateien verwenden jetzt das YAML-Format; es folgt damit
126   dem `tex-hyphen`-Projekt, welches (ab der nächsten Version) ebenfalls
127   dieses Format zur einheitlichen Identifizierung und Beschreibung aller
128   Trennmuster verwendet.
130 * Die Dokumentation wurde überarbeitet.
133 ## v0.41 (2017-03-31)
135 #### Wortdatenbank
137       Rechtschreibung         hinzugefügt   entfernt   korrigiert
138     ---------------------------------------------------------------
139       traditionell (DE, AT)         24701         65          644
140       traditionell (CH)             24819         65          652
141       reformiert                    24280         33          703
143 #### Trennmuster
145 * Der Prozess der Musterberechnung wurde geändert, so dass in Patgen
146   alle im Zeichensatz ISO-8859-15 enthaltenen Buchstaben genutzt werden
147   können.  Unter anderem werden jetzt auch die Wörter _Œuvre_ und
148   _Škoda_ korrekt getrennt.
150 #### Paket
152 * Die Trennmusterdateien des dehyph-exptl-Pakets
153   (`dehyph*-x-2017-03-31.pat`) stehen jetzt unter der
154   [MIT-Lizenz][liz-mit].
157 ## v0.40 (2014-05-21)
159 #### Wortdatenbank
161       Rechtschreibung         hinzugefügt   entfernt   korrigiert
162     ---------------------------------------------------------------
163       traditionell (DE, AT)          2493        274          458
164       traditionell (CH)              2493        274          457
165       reformiert                     2468        278          394
167 * Die Arbeiten an der Klassifizierung von Trennstellen sind nahezu
168   abgeschlossen.
170 * Es wird eine Liste mit Schreibweisen vor der I. Orthographischen
171   Konferenz gepflegt (Datei `pre-1901`).  Mit Hilfe dieser Datei lassen
172   sich Muster erstellen, die veraltete Wörter und Schreibweisen
173   erwartungsgemäßer trennen.
175 * Die Lizenz der Dateien im [Entwickler-Repositorium][repo-wl] wurde
176   klargestellt ([MIT][liz-mit]).  (Das Paket `dehyph-exptl` steht jedoch
177   unter der [LPPL][liz-lppl].)
179 [repo-wl]: https://repo.or.cz/w/wortliste.git
180 [liz-mit]: https://opensource.org/licenses/mit-license.php
181 [liz-lppl]: https://www.latex-project.org/lppl.txt
184 ## v0.3 (2013-05-26)
186 #### Wortdatenbank
188       Rechtschreibung         hinzugefügt   entfernt   korrigiert
189     ---------------------------------------------------------------
190       traditionell (DE, AT)          5665         23          154
191       traditionell (CH)              5904         23          126
192       reformiert                     4852         12          123
194 * Weitere Arbeiten an der Klassifizierung von Trennstellen.
196 * Abgleich mit dem elektronischen Grimmschen Wörterbuch (ca. 1800
197   eingearbeitete Wörter).
199 * Viele Wörter mit drei aufeinanderfolgenden Konsonanten wurden
200   hinzugefügt.
202 * Viele weitere irreführende Trennungen der Form ...er-... werden
203   unterdrückt (z. B. ab-erkann-te).
206 ## v0.23 (2012-05-30)
208 #### Wortdatenbank
210       Rechtschreibung         hinzugefügt   entfernt   korrigiert
211     ---------------------------------------------------------------
212       traditionell (DE, AT)            44         93          166
213       traditionell (CH)                44         93          161
214       reformiert                       45         56           67
216 * Die Wortdatenbank liegt in UTF-8-Kodierung vor.
218 * _traditionelle Rechtschreibung (DE, AT, CH):_ Greift an einer Wortfuge
219   die Dreikonsonantenregel, so wird die folgende Trennstelle
220   grundsätzlich unterdrückt, sofern sie einen Abstand von nur zwei
221   Lauten hat.  Beispiele:
223         Metallegierung  =>  Me-tallegie-rung
224         Stilleben       =>  Stilleben
226     Aber:
228         Brennessel      =>  Brennes-sel
229         Stoffetzen      =>  Stoffet-zen
231 #### Paket
233 * Wenn pTeX verwendet wird, werden nun kompatible Trennmuster aus dem
234   Paket `hyph-utf8` geladen.  (Das Paket `hyph-utf8` verwendet die
235   Trennmuster dieses Pakets.  Es kann sich dabei jedoch um eine andere
236   Version der Muster handeln.)
238 * Die Dateien `projektbeschreibung.*` wurden entfernt.  Die Inhalte sind
239   nun im [Trennmuster-Wiki](https://projekte.dante.de/Trennmuster) zu
240   finden.
243 ## v0.22 (2011-07-02)
245 #### Wortdatenbank
247       Rechtschreibung         hinzugefügt   entfernt   korrigiert
248     ---------------------------------------------------------------
249       traditionell (DE, AT)            39         64          109
250       traditionell (CH)                39         64          109
251       reformiert                        5         28          108
253 #### Paket
255 * Wenn pTeX verwendet wird, werden keine Trennmuster geladen (notwendig
256   für die platex-Formaterstellung in TeX Live 2011).
258 * Die Dokumentation wurde erweitert.
261 ## v0.20 (2009-06-24)
263 #### Wortdatenbank
265       Rechtschreibung         hinzugefügt   entfernt   korrigiert
266     ---------------------------------------------------------------
267       traditionell (DE, AT)         10458        156         5579
268       traditionell (CH)             10464         83          594
269       reformiert                     9945         69          595
271 * _traditionelle Rechtschreibung (DE, AT):_ Für alle Wörter mit _ß_
272   wurde die Ersatzschreibung mit _ss_ und Trennung wie mit _ß_
273   aufgenommen.  Das Babelkürzel `"S` muss damit in Versalwörtern nur
274   noch in Ausnahmefällen verwendet werden (siehe auch Regel T2 in der
275   Paketdokumentation).  Beispiele:
277         GRÜSSE   =>  GRÜ-SSE
278         GRÖSSTE  =>  GRÖSS-TE
280 * _traditionelle Rechtschreibung (CH):_ Für alle Wörter mit _ß_ wurde die
281   im Schweizer Standarddeutsch gebräuchliche Schreibung mit _ss_ und
282   Trennung als _s-s_ aufgenommen.  Beispiele:
284         Grüs-se   statt  Grü-ße
285         grös-ste  statt  größ-te
287 * Die Trennung von Zahlwörtern wurde verbessert.
289 * Die römischen Zahlen bis MMD (2500) werden nicht getrennt.
291 * Viele zusätzliche irreführende Trennungen werden vermieden.
293 * Viele Fehler wurden korrigiert.
295 #### Trennmuster
297 * Es werden Trennmuster für die traditionelle Rechtschreibung des in der
298   Schweiz verwendeten Standarddeutschs bereitgestellt.
299   Babelunterstützung für diese Trennmuster fehlt bisher jedoch.  Wer
300   machts?
302 * Die Patgen-Parameter wurden geändert.  Die Trennmusterdateien werden
303   dadurch etwas kleiner.
305 #### Paket
307 * Die Dokumentation wurde erweitert.
310 ## v0.13 (2008-07-07)
312 #### Wortliste
314       Rechtschreibung   hinzugefügt   entfernt   korrigiert
315     ---------------------------------------------------------
316       traditionell                0          0            0
317       reformiert                  0          0            0
319 #### Paket
321 * Die Dokumentation wurde überarbeitet.
324 ## v0.12 (2008-07-02)
326 #### Wortdatenbank
328       Rechtschreibung   hinzugefügt   entfernt   korrigiert
329     ---------------------------------------------------------
330       traditionell               12          1           28
331       reformiert                 12          1           28
333 #### Paket
335 * Die Dokumentation wurde erweitert.
338 ## v0.11 (2008-06-27)
340 #### Wortdatenbank
342       Rechtschreibung   hinzugefügt   entfernt   korrigiert
343     ---------------------------------------------------------
344       traditionell               18          0           44
345       reformiert                 18          0           45
347 * Einige knifflige Wortzusammensetzungen wurden hinzugefügt
348   (Patentrichter usw.)
350 #### Paket
352 * Die Dokumentation wurde erweitert.
355 ## v0.1 (2008-06-18)
357 * Erstveröffentlichung
361 <!--
362 %%% Local Variables:
363 %%% coding: utf-8
364 %%% mode: markdown
365 %%% End: