Thread HTML-Code aus Zeichenkette entfernen (12 answers)
Opened by Gast at 2004-08-29 21:50

Dubu
 2004-08-30 02:21
#3601 #3601
User since
2003-08-04
2145 Artikel
ModeratorIn + EditorIn

user image
Code: (dl )
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
#!/usr/bin/perl
use strict;
use warnings;

my $message = <<EOT;
<p>Dies ist ein <b>Testtext in HTML</B>,
der <a href="link">einen Link</a> und <i>andere </i> Tags
enthalten soll. <br />
<img src="foo.png" alt="Foo" /> <img src="bar.png" alt="bar"></img>
</p>
EOT

$message =~ s~<([^bi]|/[^bi]|/?[^/>]{2,}/?)>~&lt;$1&gt;~gi;

# oder vielleicht so: (nur oeffnende Klammern ersetzen)

# $message =~ s~<(?!b>|i>|/b>|/i>)~&lt;~gi;


print $message;


Wie man sieht, kommt die zweite Variante besser mit einzelnen Kleiner- oder Groesserzeichen klar. Dafuer kann man mit der ersten Variante sehr einfach alles, was nach Tag aussieht, direkt loeschen (Ersetzungsteil einfach leer lassen).

View full thread HTML-Code aus Zeichenkette entfernen