Schrift
[thread]12642[/thread]

Regex <br /> hinter <li> entfernen



<< >> 7 Einträge, 1 Seite
Gast Gast
 2008-10-15 22:18
#115547 #115547
Hallo Forum,
ich bräuchte mal eure Hilfe. Mit folgender Regex versuche ich überschüssige Umbrüche hinter bzw. vor Listenelementen zu entfernen.

Leider funktioniert dieser Ausdruck bei mir nicht. Was mache ich falsch?

$text =~ s/(<\/?(ul|li|ol)(.+[^>])?>)<br \/>/arsch$1/gsi;

Ich danke für eure Hilfe,

Grüße Michael
Gast Gast
 2008-10-15 22:36
#115548 #115548
Regexes für das Filtern bei HTML zu nehmen ist nicht sinnvoll.
Gast Gast
 2008-10-15 23:18
#115549 #115549
Hallo,
das mag ja stimmen, nur leider bringt mich diese Antwort gerade nicht weiter.

Vielleicht hat jemand eine Idee,
Danke!
Linuxer
 2008-10-15 23:40
#115550 #115550
User since
2006-01-27
3890 Artikel
HausmeisterIn

user image
Wenn Du mit den Fehlern leben willst, die das Parsen von HTML mit Regex mit sich bringen kann (bzw. mit sich bringt), kannst Du folgenden Regex versuchen:

Code (perl): (dl )
$text =~ s{(?:<br\s+/>)?(\s*</?(?:[uo]l|li)>\s*)(?:<br\s+/>)?}{$1}gi;


Anpassungen für enthaltene Attribute oder Verwendung des Punkt als Platzhalter bitte selber vornehmen!

Wenn Du es sauber lösen willst, solltest Du Dir ein Parser-Modul anschauen, z.B. CPAN:HTML::Parser.
meine Beiträge: I.d.R. alle Angaben ohne Gewähr und auf Linux abgestimmt!
Die Sprache heisst Perl, nicht PERL. - Bitte Crossposts als solche kenntlich machen!
Gast Gast
 2008-10-15 23:50
#115552 #115552
Hallo,
ich danke dir! Ja ich weiß dass ein Parser besser ist, nur für mein Projekt war das gerade wichtig.

Ich danke dir für die Hilfe,

Grüße Michael
Linuxer
 2008-10-15 23:57
#115553 #115553
User since
2006-01-27
3890 Artikel
HausmeisterIn

user image
war mir klar, dass sich die schlechtere Lösung durchsetzt ;o)
meine Beiträge: I.d.R. alle Angaben ohne Gewähr und auf Linux abgestimmt!
Die Sprache heisst Perl, nicht PERL. - Bitte Crossposts als solche kenntlich machen!
GwenDragon
 2008-10-16 15:33
#115571 #115571
User since
2005-01-17
14761 Artikel
Admin1
[Homepage]
user image
Faulheit siegt so lange bis das Konstrukt des Regex nicht mehr greift.

http://faq.perl-community.de/bin/view/Perldoc/perl...
<< >> 7 Einträge, 1 Seite



View all threads created 2008-10-15 22:18.