HTML:Tree HTML::TableExtract Frage: HTML Tabelle extrahieren (Allgemeines zu Perl)

[thread]8416[/thread]

HTML:Tree HTML::TableExtract Frage: HTML Tabelle extrahieren

weismat

2006-10-14 13:48

User since
2003-08-18
142 Artikel
BenutzerIn
[default_avatar]

Ich möchte aus einer HTML-Tabelle sowohl den Text als auch die zugehörigen Links extrahieren.

Code: (dl )

use strict;
use LWP::Simple;
use HTML::TableExtract;
my $url="xxx";
my $content = get($url);
my $te = HTML::TableExtract->new(depth => 1);
$te->parse($content);
foreach my $row ($te->rows) {
  print join(',', @$row), "\n";
}

klappt wunderbar, um die Tabelle zu lesen....wie komme ich aber an die Links, die die Tabelle ebenfalls enthält? Hat da jemand Erfahrung und ein paar Tips?

renee

2006-10-14 14:26

User since
2003-08-04
14371 Artikel
ModeratorIn

Was steht denn in $row drin? Poste mal einen Dump...

OTRS-Erweiterungen (http://feature-addons.de/)
Frankfurt Perlmongers (http://frankfurt.pm/)
--

Unterlagen OTRS-Workshop 2012: http://otrs.perl-services.de/workshop.html
Perl-Entwicklung: http://perl-services.de/

weismat

2006-10-14 14:33

User since
2003-08-18
142 Artikel
BenutzerIn
[default_avatar]

Ich denke, daß ich die Lösung gefunden habe...
Nehme den Parameter keep_html => 1 und schneide dann den Link heraus....Für den Tabelleninhalt nehme setzte ich keep_html wieder auf 0, damit ich die sichtbaren Zellenwerte bekomme.

View all threads created 2006-10-14 13:48.