From f475267645eedd56bc0bbce09c9dc852158b50df Mon Sep 17 00:00:00 2001 From: =?utf8?q?G=C3=BCnter=20Milde?= Date: Mon, 20 Jul 2020 11:51:23 +0200 Subject: [PATCH] Python-Skripte: kleine Korrekturen. --- skripte/python/edit_tools/hyphenate_neueintraege.py | 2 +- skripte/python/edit_tools/wortzerlegung.py | 2 +- skripte/python/lang_s/s2long-s.py | 14 +++++++++++--- skripte/python/patuse/hyphenation.py | 6 +++--- 4 files changed, 16 insertions(+), 8 deletions(-) diff --git a/skripte/python/edit_tools/hyphenate_neueintraege.py b/skripte/python/edit_tools/hyphenate_neueintraege.py index adb82d4..cae52c0 100755 --- a/skripte/python/edit_tools/hyphenate_neueintraege.py +++ b/skripte/python/edit_tools/hyphenate_neueintraege.py @@ -53,7 +53,7 @@ Bsp: python hyphenate_neueintraege.py < missing-words.txt > neu.todo # # :: -import sys, os, codecs, glob, copy, argparse, re, random +import sys, os, glob, argparse, re, random # path for local Python modules (parent dir of this file's dir) sys.path.insert(0, diff --git a/skripte/python/edit_tools/wortzerlegung.py b/skripte/python/edit_tools/wortzerlegung.py index e06d836..3c69b1f 100755 --- a/skripte/python/edit_tools/wortzerlegung.py +++ b/skripte/python/edit_tools/wortzerlegung.py @@ -820,4 +820,4 @@ if __name__ == '__main__': for line in output: print(line) - print('#', len(output), "Einträge'", file=sys.stderr) + print('#', len(output), "Einträge", file=sys.stderr) diff --git a/skripte/python/lang_s/s2long-s.py b/skripte/python/lang_s/s2long-s.py index 850a4f8..b91443b 100755 --- a/skripte/python/lang_s/s2long-s.py +++ b/skripte/python/lang_s/s2long-s.py @@ -605,8 +605,12 @@ if __name__ == '__main__': # # - Im Fraktur-Duden steht As *in Antiqua* mit rundem s, also # keine Aussage zur Schreibung in Fraktur. -# - Im 1971-er [Duden71]_ steht As ohne Unterstreichung des `s`, -# das wäre Lang-S, obgleich am Wortende! +# - Im 1971-er [Duden71]_ steht As (Tonart) ohne Unterstreichung des `s`, +# das wäre Lang-S, obgleich am Wortende! Ebenso für Es, Cis, ... +# +# Wir brauchen keine Ausnahme, da korrekterweise die Tonart immer in Antiqua +# zu setzen ist. + # # Quellen # ======= @@ -614,7 +618,11 @@ if __name__ == '__main__': # .. [Duden71] `Der Große Duden` 16. Auflage, VEB Bibliographisches Institut # Leipzig, 1971 # -# Kennzeichnet im Stichwortteil rundes s durch Unterstreichen. +# Kennzeichnet im Stichwortteil rundes „s“ durch Unterstreichen. +# +# .. [Duden34] `Der Große Duden`, Leipzig 1934 +# +# In Fraktur. # # .. [wikipedia] Langes s # http://de.wikipedia.org/wiki/Langes_s diff --git a/skripte/python/patuse/hyphenation.py b/skripte/python/patuse/hyphenation.py index 4d9cf25..65a71ec 100755 --- a/skripte/python/patuse/hyphenation.py +++ b/skripte/python/patuse/hyphenation.py @@ -34,7 +34,7 @@ import re, argparse, sys, os, glob __version__ = '2.2 2020-04-07' -class Hyphenator: +class Hyphenator(object): def __init__(self, pattern_file, exceptions=''): self.tree = {} for pattern in self.yield_patterns(pattern_file): @@ -134,11 +134,11 @@ class Hyphenator: # Text zerlegen: finde (ggf. leere) Folgen von nicht-Wort-Zeichen # gefolgt von Wort-Zeichen. Der Iterator liefert Match-Objekte, mit # den Untergruppen 0: nicht-Wort und 1: Wort. - it = re.finditer(r"([\W0-9_]*)(\w*)", text, flags=re.UNICODE) + tokens = re.finditer(r"([\W0-9_]*)(\w*)", text, flags=re.UNICODE) # Konvertierung und Zusammenfügen parts = [match.groups()[0] # nicht-Wort Zeichen + self.hyphenate_word(match.groups()[1], hyphen, lmin, rmin) - for match in it] + for match in tokens] return ''.join(parts) -- 2.11.4.GIT