Thread PDF mit Perl lesen (5 answers)
Opened by smack: at 2007-07-23 20:13

heihon
 2007-07-23 22:43
#78773 #78773
User since
2006-09-15
15 Artikel
BenutzerIn
[default_avatar]
Ich habe auch schon mit PDFs zu tun gehabt und in CPAN nicht so richtig was gutes gefunden, aber bei
XPDF
gibt es freie Tools u.a. zum Auslesen von Text aus PDF-Dateien (pdftotext).
Das funktioniert ziemlich gut - jedenfalls wenn beim Erstellen der PDF-Datei nicht die Schriften vektorisiert wurden (dabei werden alle Buchstaben nicht mehr als Zeichen in einer Schrift, sondern als Vektorgrafik ins PDF eingebettet).
pdftotext muß man halt dann von perl per system() oder Backticks aufrufen.

View full thread PDF mit Perl lesen