Thread ca. 1200 PDF-Dateien auslesen und bestimmte Daten in eine CSV-Datei speichern
(20 answers)
Opened by Thyrius at 2014-07-15 21:55
edit: Nochmal angeguckt und drüber nachgedacht:
Hier mal zusammengefügt (Achtung $infile ist jetzt $txtfile): Code (perl): (dl
)
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 #! /usr/bin/env perl use strict; use warnings; my $outfile = 'adresses.csv'; open my $OUTH, '>>', $outfile or die "open($outfile, w+) failed: $!"; for my $i ( 1 .. 1290 ) { my $pdffile = sprintf "%02d.pdf", $i; my $txtfile = sprintf "%02d.txt", $i; my $prog = "C:/pdf/pdftotext.exe -f 1 $pdffile $txtfile"; system( $prog ) == 0 or next; # bei Fehler weiter mit der naechsten datei open my $INH, '<', $txtfile or die "open($txtfile,ro) failed: $!"; ( undef, my $address ) = <$INH>; # zweimal lesen; erste "Zeile" ignorieren print $OUTH $address; close $INH; } close $OUTH or die "close($outfile) failed: $!"; Last edited: 2014-07-15 23:46:03 +0200 (CEST) meine Beiträge: I.d.R. alle Angaben ohne Gewähr und auf Linux abgestimmt!
Die Sprache heisst Perl, nicht PERL. - Bitte Crossposts als solche kenntlich machen! |