Links extrahieren - #28643 (Webframeworks, Sonstige Fragen zur Webprogrammierung mit Perl)

Mary

2006-09-23 14:15

User since
2006-06-25
17 Artikel
BenutzerIn
[default_avatar]

Danke! Das Beispiel aus dem Artikel ist schon mal hilfreich:

Code: (dl )

#! /usr/bin/perl
use strict;
use warnings;
use HTML::Parser;

my @links;
my $file = "my_file.html";

my $p = HTML::Parser->new();
$p->handler(start => \&start_handler,"tagname,attr,self");
$p->parse_file($file);

foreach my $link(@links){
  print "Linktext: ",$link->[1],"\tURL: ",$link->[0],"\n";
}

sub start_handler{
  return if(shift ne 'a');
  my ($class) = shift->{href};
  my $self = shift;
  my $text;
  $self->handler(text => sub{$text = shift;},"dtext");
  $self->handler(end => sub{push(@links,[$class,$text]) if(shift eq 'a')},"tagname");
}

Und wie kann ich diesen Skript anpassen, um die Links wie

Code: (dl )

<a class="res" href="http://...">

zu extrahieren? Ich kriege es leider nicht selber hin.

Lg
Mary