Schrift
[thread]8416[/thread]

HTML:Tree HTML::TableExtract Frage: HTML Tabelle extrahieren



<< >> 3 Einträge, 1 Seite
weismat
 2006-10-14 13:48
#70774 #70774
User since
2003-08-18
142 Artikel
BenutzerIn
[default_avatar]
Ich möchte aus einer HTML-Tabelle sowohl den Text als auch die zugehörigen Links extrahieren.
Code: (dl )
1
2
3
4
5
6
7
8
9
10
use strict;
use LWP::Simple;
use HTML::TableExtract;
my $url="xxx";
my $content = get($url);
my $te = HTML::TableExtract->new(depth => 1);
$te->parse($content);
foreach my $row ($te->rows) {
print join(',', @$row), "\n";
}
klappt wunderbar, um die Tabelle zu lesen....wie komme ich aber an die Links, die die Tabelle ebenfalls enthält? Hat da jemand Erfahrung und ein paar Tips?
renee
 2006-10-14 14:26
#70775 #70775
User since
2003-08-04
14371 Artikel
ModeratorIn
[Homepage] [default_avatar]
Was steht denn in $row drin? Poste mal einen Dump...
OTRS-Erweiterungen (http://feature-addons.de/)
Frankfurt Perlmongers (http://frankfurt.pm/)
--

Unterlagen OTRS-Workshop 2012: http://otrs.perl-services.de/workshop.html
Perl-Entwicklung: http://perl-services.de/
weismat
 2006-10-14 14:33
#70776 #70776
User since
2003-08-18
142 Artikel
BenutzerIn
[default_avatar]
Ich denke, daß ich die Lösung gefunden habe...
Nehme den Parameter keep_html => 1 und schneide dann den Link heraus....Für den Tabelleninhalt nehme setzte ich keep_html wieder auf 0, damit ich die sichtbaren Zellenwerte bekomme.
<< >> 3 Einträge, 1 Seite



View all threads created 2006-10-14 13:48.