Thread Text aus html Dateien lesen und in Datei schreiben
(13 answers)
Opened by binse at 2013-11-28 15:52
Zur Einführung in Perl empfehle ich Modern Perl. Das gibt eine knappe aber gute Einführung in die Sprachkonstrukte. Weitere Schwerpunkte sind "best practice" und Fallstricke. Allerdings solltest Du schon programmieren können. Sonst ist die Einführung etwas zu knapp.
Ich selbst habe Perl vor knapp 20 Jahren mit Hilfe der mitgelieferten Doku gelernt, die damals aber noch nicht so umfangreich war. Als Einstieg würde ich da perlintro nehmen. Ansonsten findest Du in der FAQ Links zu weiteren Büchern und Tutorien. Für Deine konkrete Problemstellung musst Du drei Aufgaben lösen: 1. Die Verzeichnisstruktur nach Filenamen durchsuchen. Dazu würde ich wohl zwei verschachtelte Schleifen und perlfunc opendir verwenden. Man kann aber auch ein Modul wie File::Find nehmen, 2. Informationen aus dem HTML extrahieren. Hier würde ich HTML::TreeBuilder zum Parsen des HTMLs verwenden. Dann im Baum, den Du bekommst, zum passenden Element gehen und dort mit $elem->as_text() bzw. $elem->attr(...) die gewünschten Informationen rausholen. 3. Die Informationen in einen CSV-File schreiben. Hier habe ich keine praktische Erfahrung. Ich würde aber in jedem Fall ein CPAN-Module für diese Aufgabe empfehlen.Class::CSV könnte ein Kandidat sein. |