Trennstellenkategorisierung
[wortliste.git] / skripte / merge-wordslists.sh
blob9b604a7d606b7c14a6393b66c0ad2a7d6262a3f8
1 #!/bin/sh
3 # merge-wordlists.sh
5 # Fügt mehrere Wortlisten zu einer sortierten Gesamtliste der einfachen
6 # (ungetrennten) Wörter)zusammen.
7 #
8 # Eingabe: ein oder mehrere Dateinamen.
9 # Ausgabe ist nach stdout.
11 LANG=de_DE.utf-8
12 export LANG
14 cat $@ \
15 | sed -e '/^#/d' \
16 -e 's/ /\
17 /' \
18 | sed -e 's/;.*//' \
19 -e 's/[-=·.|]//g' \
20 | sort \
21 | uniq -i
23 # eof