Thread CAM::PDF: Auslesen von Textinhalten aus OpenOffice-PDF (4 answers)
Opened by AndiE at 2010-12-24 19:49

AndiE
 2010-12-27 19:49
#143843 #143843
User since
2010-10-24
65 Artikel
BenutzerIn
[default_avatar]
Hallo,

ist doch schön, seine eigene Frage zu beantworten :-). Die Antwort lautete "Nein, das geht nicht."

Der Grund dafür ist, dass OpenOffice ein XML-Format nutzt. Wenn man eine odt-Datei mit unzip entpackt erhält man diese Dateien. Nach wikipedia wird aus solchen "xml"-Dateien über eine "xsl-fo" eine "pdf"-Datei. Die Rückübertragung müsste also den umgelehrten Weg gehen.

Entweder über xml::XPath oder über xml::xslt.
Kennt sich jemand evtl damit aus?

Schöne Grüße

Andre'

View full thread CAM::PDF: Auslesen von Textinhalten aus OpenOffice-PDF