Thread Benötige Perl-Skript zur Auswertung von .pdf-Dateien (14 answers)
Opened by ClaudiaRohmeier at 2013-03-06 15:09

murphy
 2013-03-06 17:11
#166250 #166250
User since
2004-07-19
1776 Artikel
HausmeisterIn
[Homepage]
user image
Da PDF eine Seitenlayoutsprache ist und keine Textauszeichnungssprache könnte es, je nach Struktur der vorliegenden PDF-Dateien, ziemlich problematisch werden, den Text so zu extrahieren, dass die logische Aufteilung in Absätze und Sätze erhalten bleibt. Erfahrungsgemäß liefern Werkzeuge wie pdf2text bisweilen nämlich nur Zeichensalat.
When C++ is your hammer, every problem looks like your thumb.

View full thread Benötige Perl-Skript zur Auswertung von .pdf-Dateien