Thread HTML::Parser (4 answers)
Opened by sid burn at 2007-05-11 17:42

sid burn
 2007-05-15 02:09
#76649 #76649
User since
2006-03-29
1520 Artikel
BenutzerIn

user image
[quote=ptk,13.May.2007, 10:21]Was hältst du vom Abschnit SUBCLASSING im Pod von HTML::Parser? Ich verstehe das so, dass du deine eigenen Daten im $p-Hash halten darfst, solange die Keys nicht mit _hparser anfangen. Zudem würde ich get_result in einer Subklasse von HTML::Parser unterbringen.[/quote]
Hi,
ja das ist noch eine sehr gute Idee die mir gefällt. Ich schaue mir aber zur Zeit noch paar andere Interface zu HTML::Parser an.

Das was mir bisher ganz gut gefallen hat ist HTML::TokeParser::Simple

Das kommt schon nahe an dem dran wie ich mir das vorstellen würde, aber irgendwie habe ich z.B: noch keinen vernünftigen weg gefunden um z.B. nach einem "tr" Tag zu suchen und mir dann alle "td" tags unterhalb des tr Tags ausgeben zu lassen. (Ein Beispiel ich weiß das es ein extra Modul gibt um Tabellen zu extrahieren)

Ansonsten gab es noch ein Modul das den HTML Code in einer Baumstruktur aufgebaut hat und man diesen Baum dann durchgehen konnte. In der Doku wurde der Aufbau des Baumes auch erklärt. Aber irgendwie finde ich das Modul nicht mehr. HTML::TreeBuilder war es aber nicht.

Ansonsten habe ich irgendwo im Internet noch was gefunden wo jemand mit einem XML Modul HTML geparsed hatte. Man konnte da irgendwie ein Suchpattern angeben und das ist sozusagen darüber gelaufen und hatt die Ergebnisse ausgeliefert. Weiß aber auch nicht mehr welches Modul das war, noch wo ich es gefunden hatte.

Kennt da noch jemand etwas anderes? Ich kann mich mit HTML::Parser auf dauer irgendwie gar nicht anfreunden.\n\n

<!--EDIT|sid burn|1179180684-->
Nicht mehr aktiv. Bei Kontakt: ICQ: 404181669 E-Mail: perl@david-raab.de

View full thread HTML::Parser