Thread String zerlegen mit REGEXP (8 answers)
Opened by Gast at 2005-04-11 12:56

Gast Gast
 2005-04-11 17:16
#29466 #29466
ehmm bei mir sind die html-Datei extern und das perl-Script sieht jetzt so aus!!!

Code: (dl )
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
#!/usr/bin/perl -w
#anfang use (was er noch benutzen soll!)
use strict;
use DBI;
use warnings;
use HTML::Parser;

#ende use
our $file;
my @links;


# Datenbank
my $datenbank = "db_rpt";
# Datenbankhost
my $datenbankhost = "localhost";
# Datenbankusername
my $datenbankuser = "XXXXXX";
# Datenbankpasswort
my $datenbankpw = "XXXXXX";

my $p = HTML::Parser->new();
$p->handler(start => \&start_handler,"tagname,attr,self");


my $dbh = DBI->connect("DBI:mysql:$datenbank:$datenbankhost","$datenbankuser","$datenbankpw") || scripterror ("Fehler bei der Datenbankverbindung aufgetreten.");
my $sth = $dbh->prepare("SELECT datei FROM index_seiten");
$sth->execute or die DBI->errstr;
#@inhalt = $sth->fetchrow_array();
while (my($datei) = $sth->fetchrow_array())
 {
print "$datei \n";
   open (DAT, '<', $datei) || die "Kann die Datei $datei nicht laden!";
   my $tmp_var;
   my $secln=0;
   foreach (<DAT>)
{
next unless (/STYLE/);
$p->parse($_);
 
}
}
foreach my $link(@links){
print "Linktext: ",$link->[1],"\tURL: ",$link->[0],"\n";
}

$sth->finish;
$dbh->disconnect;

sub start_handler{
return if(shift ne 'a');
my ($class) = shift->{href};
my $self = shift;
my $text;
$self->handler(text => sub{$text = shift;},"dtext");
$self->handler(end => sub{push(@links,[$class,$text]) if(shift eq 'a')},"tagname");
}


Ich denke mal der HTML::Parser (sorry kann halt manchmal nicht schreiben!) nicht mit den "^M" am Ende jeder Zeile zu tun hat!
Wenn ich den html-Code kopiere dann sind diese nicht dabei!

MfG

View full thread String zerlegen mit REGEXP