5 # Dieses Perl-Skript extrahiert aus der `wortliste'-Datei eine Eingabedatei
6 # für Patgen, und zwar für die reformierte deutsche Rechtschreibung.
8 # Aufruf: perl extract-tex-refo.pl < wortliste > input.patgen
22 # entferne Leerzeichen aller Art
25 my @feld = split(';');
28 # Felder 2, 4, 5 und 7
30 $zeile = $feld[3] if defined $feld[3] && $feld[3] ne "-4-";
31 $zeile = $feld[4] if defined $feld[4] && $feld[4] ne "-5-";
32 $zeile = $feld[6] if defined $feld[6] && $feld[6] ne "-7-";
33 next if $zeile eq "-2-";
35 # entferne Doppeldeutigkeiten
36 $zeile =~ s/\[-*(.*?)-*\|.*?\]/$1/g;
37 # entferne Markierungen für schlechte Trennungen