Außenbord ist selten aber nicht immer falsch.
[wortliste.git] / skripte / merge-wordslists.sh
blob19251c77fdbe413a4089f0e2ba34f0c891328d82
1 #!/bin/sh
3 # merge-wordlists.sh datei ...
5 # Fügt mehrere Wortlisten (in UTF8-Kodierung) zu einer sortierten
6 # Gesamtliste der einfachen (ungetrennten) Wörter zusammen.
8 # Eingabe: ein oder mehrere Dateinamen.
9 # Ausgabe ist nach stdout.
11 LANG=de_DE.utf-8
12 export LANG
14 cat $@ \
15 | sed -e '/^#/d' \
16 -e 's/ /\
17 /' \
18 | sed -e 's/;.*//' \
19 -e 's/[-=·.|<>]//g' \
20 | sort \
21 | uniq -i
23 # eof