Schrift
[thread]7478[/thread]

regexp -> html datein durschsuchen



<< >> 7 Einträge, 1 Seite
e-weder
 2005-11-17 13:58
#60202 #60202
User since
2005-11-08
31 Artikel
BenutzerIn
[default_avatar]
hallo
hab da mal eine frage und hoffe ihr könnt mir helfen.

folgender ausgangspunkt.Ich habe eine html datei wie folgt:
Code: (dl )
1
2
3
4
......
<center><br><font color="#008000">www.webseite.de</font>
<br></center><font color="#008000">www.<b>homepage</b>.de</font>
.....


nun will ich alles was zwichen <font color="#008000">...</font> ist, in eine arrey haben!

wie löse ich das am besten?

mfg e-weder
pktm
 2005-11-17 14:18
#60203 #60203
User since
2003-08-07
2921 Artikel
BenutzerIn
[Homepage]
user image
Mit HTML::Parser, HTML::Tokeparser oder HTML::TreeBuilder. Ersteres ist das Standardmodul, das zweite finde ich recht komfortabel und das dritte fand wer anderes ganz gut.
http://www.intergastro-service.de (mein erstes CMS :) )
pKai
 2005-11-17 14:22
#60204 #60204
User since
2005-02-18
357 Artikel
BenutzerIn
[default_avatar]
Wenn die Variable $file bereits dem kompletten Dateiinhalt enthält:
Quote
my $hstart = quotemeta '<font color="#008000">';
my $hend = quotemeta '</font>';

my @Arr = $file =~ /$hstart(.*?)$hend/osg;


Ob das "am besten" ist kommt auf dein Programm(umfeld) an.
I sense a soul in search of answers.
Dubu
 2005-11-17 16:25
#60205 #60205
User since
2003-08-04
2145 Artikel
ModeratorIn + EditorIn

user image
@pKai: Dann hoffst du aber, dass innerhalb des <font color="#008000">...</font> kein weiteres font-Tag auftaucht.

Und zum /o-Flag sollte man dazu sagen, dass man es wirklich nur dann verwenden soll, wenn sich $hstart und $hend garantiert nie zwischen zwei Aufrufen der Regex aendern.
Crian
 2005-11-17 16:30
#60206 #60206
User since
2003-08-04
5872 Artikel
ModeratorIn
[Homepage]
user image
Es gibt gute Gründe, die genannten Module zu verwenden, es sei denn, man hat die HTML-Dateien selbst per Programm erzeugt und kann sich auf einen Haufen Sachen verlassen, auf den man sich normalerweise nicht verlassen kann. Und selbst dann besteht immer noch die Möglichkeit, sich in den Fuß zu schießen ^^
s--Pevna-;s.([a-z]).chr((ord($1)-84)%26+97).gee; s^([A-Z])^chr((ord($1)-52)%26+65)^gee;print;

use strict; use warnings; Link zu meiner Perlseite
ptk
 2005-11-18 00:52
#60207 #60207
User since
2003-11-28
3645 Artikel
ModeratorIn
[default_avatar]
[quote=pktm,17.11.2005, 13:18]Mit HTML::Parser, HTML::Tokeparser oder HTML::TreeBuilder. Ersteres ist das Standardmodul, [/quote]
Nein. Vielleicht bei ActivePerl, aber nicht bei der "richtigen" Perl-Distribution:
Code: (dl )
1
2
3
corelist HTML::Parser

HTML::Parser was not in CORE (or so I think)
Quote
das zweite finde ich recht komfortabel und das dritte fand wer anderes ganz gut.
Ich vielleicht? Heute morgen musste ich das Parsen einer HTML-Seite schnell umstellen. Das ging mit HTML::TreeBuilder ganz einfach.
renee
 2005-11-18 11:29
#60208 #60208
User since
2003-08-04
14371 Artikel
ModeratorIn
[Homepage] [default_avatar]
Zu CPAN:HTML::Parser findest Du auch einen kleinen Wiki-Artikel unter den FAQ
OTRS-Erweiterungen (http://feature-addons.de/)
Frankfurt Perlmongers (http://frankfurt.pm/)
--

Unterlagen OTRS-Workshop 2012: http://otrs.perl-services.de/workshop.html
Perl-Entwicklung: http://perl-services.de/
<< >> 7 Einträge, 1 Seite



View all threads created 2005-11-17 13:58.