Vervollständige dreibuchstabige Wörter mit Eszett.
[wortliste.git] / skripte / merge-wordslists.sh
blob107235403f0dfe58a88d3b7c26c387384c28e48b
1 #!/bin/sh
3 # merge-wordlists.sh datei ...
5 # Fügt mehrere Wortlisten (in UTF8-Kodierung) zu einer sortierten
6 # Gesamtliste der einfachen (ungetrennten) Wörter zusammen.
7 #
8 # Eingabe: ein oder mehrere Dateinamen.
9 # Ausgabe ist nach stdout.
11 LANG=de_DE.utf-8
12 export LANG
14 cat $@ \
15 | sed -e '/^#/d' \
16 -e 's/ /\
17 /' \
18 | sed -e 's/;.*//' \
19 -e 's/[-=·.|<>]//g' \
20 | sort \
21 | uniq -i
23 # eof