Thread CAM::PDF: Auslesen von Textinhalten aus OpenOffice-PDF
(4 answers)
Opened by AndiE at 2010-12-24 19:49
Hallo,
ist doch schön, seine eigene Frage zu beantworten :-). Die Antwort lautete "Nein, das geht nicht." Der Grund dafür ist, dass OpenOffice ein XML-Format nutzt. Wenn man eine odt-Datei mit unzip entpackt erhält man diese Dateien. Nach wikipedia wird aus solchen "xml"-Dateien über eine "xsl-fo" eine "pdf"-Datei. Die Rückübertragung müsste also den umgelehrten Weg gehen. Entweder über xml::XPath oder über xml::xslt. Kennt sich jemand evtl damit aus? Schöne Grüße Andre' |