Thread Regex für Spamfilter bei Nicht-Ascii (33 answers)
Opened by GwenDragon at 2012-06-17 18:27

topeg
 2012-06-18 20:42
#159125 #159125
User since
2006-07-10
2611 Artikel
BenutzerIn

user image
use utf8; löst das Problem nur halb, da damit nur Zeichen Im Code behandelt werden. Wenn die Daten aus einem __DATA__ block kommen geht das. Aber für andere Quellen können die regulären Ausdrücke nicht greifen, wenn die Daten nicht dekodiert sind. Ansonsten werden sie als Bytefolgen gehandhabt und \b greift nur bedingt.

View full thread Regex für Spamfilter bei Nicht-Ascii