PDF mit Perl lesen (Allgemeines zu Perl)

[thread]9217[/thread]

PDF mit Perl lesen

Leser: 4

smack:

2007-07-23 20:13

User since
2007-05-08
27 Artikel
BenutzerIn
[default_avatar]

hoi,
ich habe ein pdf und möchte gerne mit perl den inhalt lesen und anschließend als fließtext ausgeben.
ist das möglich?

mfg

RalphFFM

2007-07-23 20:22

User since
2006-11-16
258 Artikel
BenutzerIn

Ich denke das kommt auf das entsprechende PDF an.
Da hilft wahrscheinlich nur ausprobieren.

smack:

2007-07-23 20:28

User since
2007-05-08
27 Artikel
BenutzerIn
[default_avatar]

die frage richtete sich eher nach einem modul, bzw einem suchbegriff nachdem ich bei cpan suchen muss

sid burn

2007-07-23 20:48

User since
2006-03-29
1520 Artikel
BenutzerIn

user image

Vielleicht bringt es dir etwas wenn du nach dem Wort "pdf" suchst?

PDF

Jedenfalls hatte ich beim rüberschauen zwei Module gefunden die vllt. soetwas an Funktionalität anbieten könnten. Aber selber gemacht habe ich es noch nicht. Ansonsten gab es aber paar programme die Daten aus PDFs extrahieren können. Bilder und so ein kram. ka wie die hießen.

Nicht mehr aktiv. Bei Kontakt: ICQ: 404181669 E-Mail: perl@david-raab.de

smack:

2007-07-23 21:18

User since
2007-05-08
27 Artikel
BenutzerIn
[default_avatar]

jop, nahc pdf hab ich schon gesucht. das erste ergebnis bietet nur nicht sonderlich viel informationen und leitet zu einer nicht existenten seite weiter.

heihon

2007-07-23 22:43

User since
2006-09-15
15 Artikel
BenutzerIn
[default_avatar]

Ich habe auch schon mit PDFs zu tun gehabt und in CPAN nicht so richtig was gutes gefunden, aber bei
XPDF
gibt es freie Tools u.a. zum Auslesen von Text aus PDF-Dateien (pdftotext).
Das funktioniert ziemlich gut - jedenfalls wenn beim Erstellen der PDF-Datei nicht die Schriften vektorisiert wurden (dabei werden alle Buchstaben nicht mehr als Zeichen in einer Schrift, sondern als Vektorgrafik ins PDF eingebettet).
pdftotext muß man halt dann von perl per system() oder Backticks aufrufen.

View all threads created 2007-07-23 20:13.