Grundlegende Frage zu Regulären Ausdrücken (HTML ausfiltern) - #111615 (Allgemeines zu Perl)

Roper

2008-06-28 18:21

User since
2008-06-28
3 Artikel
BenutzerIn
[default_avatar]

Hallo,

ich habe eine allgemeine Frage zu regulären Ausdrücken.
Ich hab ca. Anfang der Woche angefangen Perl zu lernen und mir ist bis jetzt nicht ganz klar geworden wie genau Perl da vorgeht.

Folgendes Beispiel:
Und zwar möchte ich durch eine Substitution in einer HTML Datei sämtliche Tags durch nichts ersetzen.
Meine erste Idee war als Pattern folgendes zu verwenden: <.+>
Also eine Spitzklammer < gefolgt von mindestens einem bis beliebig viele Zeichen und einer Spitzklammer die das Ende markiert >.

Ist es denn nicht so dass bei der Suche nach dem Pattern zuerst einmal nach < gesucht wird, Danach wird überprüft ob das 2te Zeichen im Pattern passt. Das kann ja jedes beliebige Zeichen (außer \n) sein und trifft so eigentlich immer.
Da dieses beliebige Zeichen beliebig oft auftauchen darf wird dann überhaupt noch ein > gefunden? Dieses fällt ja auch in das Muster .+

Eine Zeile mit z.B.: <b>Test</b>
würde dann ja von <b... bis b> komplett getroffen und ersetzt werden.

Ist das die Vorgehensweise von Perl? Und wenn ja, wie könnte ich dann ein Tag sinnvoll als Pattern darstellen?

//ModEdit GwenDragon: Titel ergänzt