From 0491fdbc4531d1ba4f9e226e1337551304ba09e9 Mon Sep 17 00:00:00 2001 From: Guenter Milde Date: Sat, 25 Apr 2015 21:29:23 +0200 Subject: [PATCH] Python-Skript Korrekturen nach Neustrukturierung. --- skripte/python/MANIFEST | 14 +++++--------- skripte/python/edit_tools/hyphenate_neueintraege.py | 20 +++++++++++++------- skripte/sort.py | 7 +++++-- 3 files changed, 23 insertions(+), 18 deletions(-) diff --git a/skripte/python/MANIFEST b/skripte/python/MANIFEST index 4c26c82..24d0ca3 100644 --- a/skripte/python/MANIFEST +++ b/skripte/python/MANIFEST @@ -45,7 +45,7 @@ edit_tools ---------- wortliste.py - Python-Modul für die Arbeit mit der `Wortliste` + Python-Modul für die Arbeit mit der `Wortliste`. Wird von den anderen Python-Skripten importiert. Aufruf mit ``python wortliste.py`` startet einen @@ -60,9 +60,9 @@ Skripte zur Arbeit mit der Wortliste Siehe auch den Abschnitt `Arbeitsfluss`_ am Ende dieses Dokumentes. -Achtung experimentell: +.. Achtung:: Experimentell -* Die Skripte wurden für die eigene Arbeit mit der Wortliste entwickelt und + Die Skripte wurden für die eigene Arbeit mit der Wortliste entwickelt und erfordern zum Teil Anpassungen im Quelltext, eine gewisse Einarbeitung, Lesen der enthaltenen Dokumentation und gegebenenfalls Rücksprachen mit dem Autor. @@ -106,21 +106,17 @@ abgleich_praefixe.py Benötigt eine Liste der Teilwörter, die mit ``analyse.py`` erstellt werden kann (siehe Arbeitsfluss_). - - abgleich_sprachvarianten.py +abgleich_sprachvarianten.py Abgleich der Trennstellen zwischen Sprachvarianten Aufruf: ``python abgleich_sprachvarianten.py`` * Übertragen von kategorisierten Trennstellen zwischen Sprachvarianten desselben Wortes, und/oder - * Zusammenfassen von Feldern mit gleichem Inhalt wenn das Ergebnis ein wohlgeformter Eintrag ist. - * Ergänzen von Formen mit SS statt ß. - abgleich_suffixe.py Abgleich der Trennstellen zwischen Wörtern mit unterschiedlichem Suffix. @@ -188,7 +184,7 @@ test_teilwoerter.py Test der Markierung von Komposita in der Wortliste teilwoerter_*.txt - Liste der Teilwörter der Komposita in der Wortliste_. + Liste der Teilwörter der Komposita in der `Wortliste`. Erstellt mit ``analyse.py`` durch Trennen an "=". Listet Häufigkeiten des Auftretens als: diff --git a/skripte/python/edit_tools/hyphenate_neueintraege.py b/skripte/python/edit_tools/hyphenate_neueintraege.py index 5c870a0..3cc2f1a 100644 --- a/skripte/python/edit_tools/hyphenate_neueintraege.py +++ b/skripte/python/edit_tools/hyphenate_neueintraege.py @@ -9,10 +9,16 @@ # über "hyphenation"-Algorithmus und patgen-patterns. # ============================================================ -import sys, codecs, glob, copy + +import sys, os, codecs, glob, copy + +# path for local Python modules (parent dir of this file's dir) +sys.path.insert(0, os.path.dirname(os.path.dirname(__file__))) + from wortliste import WordFile, WordEntry, join_word, toggle_case, sortkey_duden from abgleich_neueintraege import print_proposal -from hyphenation import Hyphenator + +from patuse.hyphenation import Hyphenator # Konfiguration @@ -20,7 +26,7 @@ from hyphenation import Hyphenator # Pfad zur Datei mit den neu einzutragenden Wörtern:: -neuwortdatei = "spell/zusatz-de-1996-aspell-compact" +neuwortdatei = "../spell/zusatz-de-1996-aspell-compact" # neuwortdatei = "spell/DDR.txt" @@ -33,10 +39,10 @@ neuwortdatei = "spell/zusatz-de-1996-aspell-compact" # # im Wurzelverzeichnis der wortliste generiert werden:: -pfile_all = glob.glob('../../dehyphn-x/dehyphn-x-*.pat')[-1] -pfile_major = glob.glob('../../dehyphn-x-major/dehyphn-x-major-*.pat')[-1] -pfile_fugen = glob.glob('../../dehyphn-x-fugen/dehyphn-x-fugen-*.pat')[-1] -pfile_suffix = glob.glob('../../dehyphn-x-suffix/dehyphn-x-suffix-*.pat')[-1] +pfile_all = glob.glob('../../../dehyphn-x/dehyphn-x-*.pat')[-1] +pfile_major = glob.glob('../../../dehyphn-x-major/dehyphn-x-major-*.pat')[-1] +pfile_fugen = glob.glob('../../../dehyphn-x-fugen/dehyphn-x-fugen-*.pat')[-1] +pfile_suffix = glob.glob('../../../dehyphn-x-suffix/dehyphn-x-suffix-*.pat')[-1] diff --git a/skripte/sort.py b/skripte/sort.py index 830e1bf..0847862 100755 --- a/skripte/sort.py +++ b/skripte/sort.py @@ -27,8 +27,11 @@ usage = u'%prog [Optionen] [Eingangsdatei]\n' + __doc__ import unicodedata, sys, optparse, os -from python.edit_tools.wortliste import (WordFile, WordEntry, - join_word, udiff, sortkey_duden) +# path for local Python modules +sys.path.insert(0, os.path.join(os.path.dirname(__file__), 'python')) + +from edit_tools.wortliste import (WordFile, WordEntry, + join_word, udiff, sortkey_duden) # sortkey_wl # ---------- -- 2.11.4.GIT