Schrift
[thread]8859[/thread]

CAM::PDF

Tags: Ähnliche Threads

Leser: 7


<< >> 4 Einträge, 1 Seite
weismat
 2007-03-21 11:58
#75221 #75221
User since
2003-08-18
142 Artikel
BenutzerIn
[default_avatar]
Hallo,
Hat jemand von Euch schon mal mit CAM::PDF gearbeitet, um ein PDF Dokument zu parsen?
Ich sehe zwar in dem Dump des Content, daß ich Daten sehe, aber ein genaues Vorgehen ist mir nicht klar.
Ich möchte gerne aus dem folgenden Dokument die letzte Zeile auslesen:
http://www.bundesbank.de/download/statistik/stat_geldmarkts.pdf.
vayu
 2007-03-21 12:15
#75222 #75222
User since
2005-01-13
782 Artikel
BenutzerIn
[default_avatar]
Code: (dl )
1
2
3
4
5
6
7
8
9
use strict;
use warnings;
use CAM::PDF;

my $pdf = CAM::PDF->new('C:\Dokumente und Einstellungen\user\Desktop\stat_geldmarkts.pdf');

my $page1 = $pdf->getPageText(1);
my @a = split "\n", $page1;
print $a[$#a];
\n\n

<!--EDIT|vayu|1174472176-->
weismat
 2007-03-21 12:23
#75223 #75223
User since
2003-08-18
142 Artikel
BenutzerIn
[default_avatar]
Vielen Dank!
vayu
 2007-03-21 12:26
#75224 #75224
User since
2005-01-13
782 Artikel
BenutzerIn
[default_avatar]
Code: (dl )
1
2
3
4
5
6
7
8
9
10
11
use strict;
use warnings;
use CAM::PDF;
use Data::Dumper;

my $pdf = CAM::PDF->new('C:\Dokumente und Einstellungen\behe3087\Desktop\stat_geldmarkts.pdf');

my $page1 = $pdf->getPageText(1);
my @a = split "\n", $page1;
@a = grep /(\d\,\d{2,3}|\.\.\.)/, (split " ", $a[$#a]);
print Dumper \@a;


machs so, dann hast auch wirklich NUR die Zahlen aus der Tabelle. und nicht noch den text hintendran\n\n

<!--EDIT|vayu|1174472825-->
<< >> 4 Einträge, 1 Seite



View all threads created 2007-03-21 11:58.