Thread patern matching
(10 answers)
Opened by olruebe01 at 2007-11-10 13:40
HI Moritz,
dieses Modul steht mir anscheinend nicht zur Verfügung und ichkann sowas nicht selber installieren... Ich habe es jetzt mit einer While-Schleife gelöst. Code: (dl
)
1 while ($str=~ m/Haus.+?Haus.+?Garten.+?Zaun/s ) { So lange also vor Garten und Zaun 2x(!) "Haus" vorkommt, wird das erste "Haus" entfernt und die matching-abfrage durchgeführt. So wird $1 runden für runde ums erste "Haus" gebracht, bis nurnoch ein Mal "Haus" vor den anderen Wörtern bleibt. Vielleicht noch nicht die eleganteste Lösung, läuft aber. Jetzt habe ich noch ein Problem: Wenn der Text nicht von mir ist, sondern per UserAgent von einem anderen Server geladen wird, scheinen da unichtbare teuerzeichen oder owas drin zu sein. Die erkennungdes Textes funktioniert. Es wird über mehrere Zeilen der kürzeste Satz gefunden. Perfekt. Aber wenn ich nun diesen kürzesten Satz per Code: (dl
)
$content=~ s/$str//; entfernen will, geschieht das nicht. Sehe ich mir den originaltext und den kurzen Satz an, sind die augenscheinlich absolut identisch. Der lange Text wird von einem anderen Server generiert (auch mein Skript). Aber ich kann hier nichts erkennen, was ich da falsch gemacht haben könnte. Fällt Euch auf Anhieb etwas ein, was ich prüfen könnte? Könnte der Text irgendwei ander formatiert werden, nachdem ich ihn per UerAgent lade? |