Thread Alle HTML-Tags entfernen: REGEX
(16 answers)
Opened by steinwolf at 2003-11-14 16:30
gut, mit dem tag innerhalb des kommentars erledigt sich der regexp, mehrzeilige tags sollten ja mit einem s zum g ohne weiteres zu erfassen sein.
mit while(s/<[^><]*?>//gs){} lässt sich aber auch das bereinigen. aber natürlich, da hast du schon recht, nicht sauber, da <!-- hallo ><< --> das auch wieder sprengen würde. insofern stimme ich zu, dass ein vorheriges parsen womöglich besser wäre. wie säh's mit s/<!--.*?-->//gs; s/<.*?>//gs; aus? schwächen? wenn wir mal von sauberem html ausgehen, also > innerhalb von attributen (wäre > nur unsauber oder ungültig?) etc? |