Thread Wie würde man dieses am geschicktesten umsetzen - eine Ideensuche
(8 answers)
Opened by jan99 at 2014-11-11 14:00
Ich würd mal gucken das evtl. mit Regex zu suchen.
Alles was nicht Buchstabe (und Punkt) ist erstmal überall raus. Z.B. Bindestriche, ... dann alles Uppercase Und (\w)\w*\. ersetzen durch sowas wie $1\w+ Also Dr. nach D\w+ Und dann suchen und hoffen. Zur Sortierung: auch Perl hat ein sort oder versteh ich grad ein Problem nicht? Edit: Und ganz doof wirds Dr. Heise Straße mit Doktor Heise Str. zu vergleichen. Da wirds dann wohl auf einen wortweisen Vergleich rauslaufen. Und wenn sich dann noch wer vertippt haben kann :\ brauchts noch nen Levenshtein. Last edited: 2014-11-11 14:28:52 +0100 (CET) 1 + 1 = 10
|