Thread Alle HTML-Tags entfernen: REGEX (16 answers)
Opened by steinwolf at 2003-11-14 16:30

jan
 2003-11-14 23:21
#71851 #71851
User since
2003-08-04
2536 Artikel
ModeratorIn
[Homepage] [default_avatar]
gut, mit dem tag innerhalb des kommentars erledigt sich der regexp, mehrzeilige tags sollten ja mit einem s zum g ohne weiteres zu erfassen sein.
mit
while(s/<[^><]*?>//gs){}
lässt sich aber auch das bereinigen. aber natürlich, da hast du schon recht, nicht sauber, da
<!-- hallo ><< -->
das auch wieder sprengen würde.
insofern stimme ich zu, dass ein vorheriges parsen womöglich besser wäre.
wie säh's mit
s/<!--.*?-->//gs;
s/<.*?>//gs;
aus? schwächen? wenn wir mal von sauberem html ausgehen, also &gt; innerhalb von attributen (wäre > nur unsauber oder ungültig?) etc?

View full thread Alle HTML-Tags entfernen: REGEX