Thread CAM::PDF: Auslesen von Textinhalten aus OpenOffice-PDF
(4 answers)
Opened by AndiE at 2010-12-24 19:49
Hallo,
danke für die interessanten Antworten. Ich habe "CAM::PDF" heruntergeladen und dabei wurden in "/usr/bin" einige Beispieldateien abgelegt. Nachdem ich etwas mir "getpdftext.pl" rumgespielt habe, habe ich nun "rewritepdf.pl" gesehen. Wenn ich diese Datei mit der Option "-d" aufrufe, kann ich die "Charmap" erkennen, mit der die Buchstaben der Textstrings ersetzt werden. Diese ist aufgebaut als: Die Textstrings enthalten dann, z.B.: Code: (dl
)
[<01><02>]Tj Soweit so gut. Nun müsste ich beides auslesen und miteinander verknüpfen. Aber das erscheint mir doch ein großes Stück Arbeit zu werden. Guten Rutsch Andre' |