Thread ca. 1200 PDF-Dateien auslesen und bestimmte Daten in eine CSV-Datei speichern
(20 answers)
Opened by Thyrius at 2014-07-15 21:55
Stimmt, das waren ja .txt.
Ich sehe momentan ein Problem beim Verarbeiten der Adresse. Das Schema ist ja benannt: Frau (Empfänger) Nachname Vorname Straße HSN PLZ Ort Aber wie soll man die Daten sauber trennen? Vornamen können aus mehreren Namen bestehen; Straßen auch; Hausnummern können auch mehr als nur Zahlen sein, auch mit Leerzeichen. Wie soll man also festlegen, wo das Semikolon hin soll? Code: (dl
)
1 Mustermann Max Musterstr. 1 12345 Musterstadt Stehen die Adressen so schon im PDF? Vielleicht kann es hilfreicher sein, die Daten direkt aus dem PDF zu lesen... dafür habe ich aber bisher nichts mit PDF und den Modulen gemacht. meine Beiträge: I.d.R. alle Angaben ohne Gewähr und auf Linux abgestimmt!
Die Sprache heisst Perl, nicht PERL. - Bitte Crossposts als solche kenntlich machen! |