Thread Hilfe bei Regulären Ausdrücken (Regex)
(6 answers)
Opened by Student82 at 2010-09-04 18:10
Schlampig ausgedrückt ist
Code (perl): (dl
)
\W*(\w+\W+){1,2}\w+\W* Ein Wort besteht aus einer Serie von Word-Zeichen. Laut XML Schema 2.0 ist ein Word-Zeichen: Quote Getrennt sind die die Wörter durch ein oder mehr nicht-Wort-Zeichen, also durch 'Punktierung', 'Seperator' und 'Andere'. Am Anfang und am Ende des Strings dürfen nicht-Word-Codepoints auftauchen. Falls der reguläre Ausdruch eine Bedingung für Personennamen sein soll, dann ist er seh fragwürdig. Zum Beispiel würde 'Karl-Heinz Friedrich Dettenhofer' zurückgewiesen, da der Bindestrich, '-' U+2010, eine Punktuation ist und der String somit aus vier Wörten besteht. |