ganzer bereich aus html parsen - #79316 (Allgemeines zu Perl)

Crian

2004-01-21 11:02

User since
2003-08-04
5881 Artikel
ModeratorIn

Ja.

Code: (dl )

m~<span WASDIESENSPANEINDEUTIGMACHT>
   (
    (?:(?!</span>).)+
    |
    <span[^>]*>(?:(?!</span>).)+</span>
   )+
  ~x;

Schauen wir uns den Audruck einmal an.



Er fängt mit dem eindeutig gekennzeichneten span an, wie der eindeutig ist, musst Du ja wissen, ev. über ein id="meinspan" oder wie auch immer.

Das was nun folgt wird in einer Klammer gefangen, damit es hinterher in der Variablen $1 steht.

Was darf nun hier folgen?

1) (?:(?!).)+ Zeichen, die nicht der Anfang von "" sind (das Plus dient nur zur Beschleunigung, falls es das wirklich tut...)

oder

2) <span[^>]*>(?:(?!).)+ komplette in span-Tags eingeschlossene Ausdrücke (denn diese darf man ja schachteln).

Davon darf immer wieder 1 bis unendlich viele folgen.
Der Ausdruck wird aufhören, wenn er an das  des ursprünglichen (besonderen) span-Tags stößt, da das erste Zeichen davon ("<") weder auf die erste noch auf die zweite erlaubte Kategorie passt.

Alles klar?

Edit: Smilies ausgeschaltet\n\n

s--Pevna-;s.([a-z]).chr((ord($1)-84)%26+97).gee; s^([A-Z])^chr((ord($1)-52)%26+65)^gee;print;

use strict; use warnings; Link zu meiner Perlseite