Danke! Das Beispiel aus dem Artikel ist schon mal hilfreich:
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
#! /usr/bin/perl
use strict;
use warnings;
use HTML::Parser;
my @links;
my $file = "my_file.html";
my $p = HTML::Parser->new();
$p->handler(start => \&start_handler,"tagname,attr,self");
$p->parse_file($file);
foreach my $link(@links){
print "Linktext: ",$link->[1],"\tURL: ",$link->[0],"\n";
}
sub start_handler{
return if(shift ne 'a');
my ($class) = shift->{href};
my $self = shift;
my $text;
$self->handler(text => sub{$text = shift;},"dtext");
$self->handler(end => sub{push(@links,[$class,$text]) if(shift eq 'a')},"tagname");
}
Und wie kann ich diesen Skript anpassen, um die Links wie
<a class="res" href="http://...">
zu extrahieren? Ich kriege es leider nicht selber hin.
Lg
Mary