Thread Daten zwischen zwei Ausdrücken drucken
(9 answers)
Opened by MisterL at 2009-04-20 17:59
Unter Python verwende ich dafür immer ein Modul genannt "BeautifulSoup".
Wenn ich nach einem Pendant für Perl google, empfehlen die meisten ein Perl-Modul namens HTML::TreeBuilder::XPath. Damit komme ich so zu einem Ergebnis: Code (perl): (dl
)
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 #!/usr/bin/perl use warnings; use strict; use HTML::TreeBuilder::XPath; my $s = getHTMLString(); my $tree= HTML::TreeBuilder::XPath->new; $tree->parse($s); my @a = $tree->findnodes_as_strings ('//td'); for my $i (@a) { print "$i\n", } sub getHTMLString { return q(<html> <body> <head> <TITLE> Testseite </TITLE> </head> <table width="400" style="border-collapse: collapse" bordercolor="#B3B3C1" cellpadding="0" border="1" cellspacing="0"> <tr> <td height=25 valign=middle bgcolor="#336699"> <font color="#FFFFFF">Aktivität </font> </td> <td height=25 valign=middle bgcolor="#F4F4F4"> <b>Doktor</b></td> </tr> <tr> <td height=25 valign=middle bgcolor="#336699"> <font color="#FFFFFF">Land </font> </td> <td height=25 valign=middle bgcolor="#F4F4F4"> <b>Deutschland </b> ...</td> </tr> </table> </body></html>); } Problematisch ist dieses '//td'. Das ist wohl so eine besondere XPath-Selector-Sprache, mit der ich mich nicht auskenne. |