Python Skript update.
[wortliste.git] / skripte / HOWTO.new-words
bloba255ee5970a52ae0355f7ff8eafbf57c2eec24af
1 1. Vorbereiten der temporären Wortliste
2    $ sh merge-wordlists.sh ../wortliste [../pre-1901 …] [path/to/namen] > tmp.wl  <-- brauchen wir ab Pt. 3.
4 2. Listen aller Worte einer Textdatei (sortiert, uniq, case independent)
5    $ sh ./prepare-wordlist.sh < Textdatei
6         ^^
7         muß sein, damit die strippunct.sed gefunden wird
8      
9 3. ~ ohne die (in tmp.wl) bereits gelisteten Worte
10    $ sh ./prepare-wordlist.sh < Textdatei | grep -Fixvf tmp.wl
12 4. ~ als getrennte Worte
13    $  sh ./prepare-wordlist.sh < Textdatei | grep -Fixvf tmp.wl | sh make-hyphenlist.sh
15 5. ~ im wortlisten-Format (<ungetrennt>;<ge·trennt>)
16    $  sh ./prepare-wordlist.sh < Textdatei | grep -Fixvf tmp.wl | sh make-hyphenlist.sh | sh hyph2wl.sh