Moin !
es geht darum das ich ca 40.000 Adressen (Soll) habe und eine Vielzahl von Adressen aus OpenStreetMap die ich gegeneinander abgleichen möchte. Genau genommen welche Adressen von den 40.000 sind noch nicht in OSM enthalten.
Meine Idee war ein Hash aufzubauen mit dem Straßennamen und der Hausnummer aus Soll. Dann durchlaufe ich die Nummern aus OSM und setze bei jedem in den Soll-Daten befundenen Adressen den Wert auf +1.
Am Ende fehlen alle diejenigen, die den Wert 0 haben.
Soweit so gut.
Jetzt zu meinen beiden Problemen:
1.) die Schreibweisen (St. <-> Sankt, Dr. <-> Doktor)können sich leicht unterscheiden. Wie vergleicht man am besten - ich hatte an soetaws wie Soundex gedacht. Eine bessere Idee ?
2.) Wenn ich eine Schleife durchlaufe, dann sind die Straßen durcheinander. Am liebsten wäre mir eine straßensortierte Ausgabe.
Hat einer zu diesen Dingen eine Idee oder vielleicht wäre ein ganz anderer Grundaufbau sinnvoll?
Gruß Jan
perl-Greenhorn - Win7 64bit / strawberry (ehem. activeperl) - www.OpenStreetMap.de