Thread ZERO WIDTH SPACE (Unicode 200B) mit einem RegEx finden und ersetzen (6 answers)
Opened by micha2 at 2023-07-12 14:26

rosti
 2023-07-13 07:39
#195142 #195142
User since
2011-03-19
3492 Artikel
BenutzerIn
[Homepage]
user image
2 Möglichkeiten:
Zeichen mit pack "U", 0x200B; erzeugen und für den zu prüfenden Text die Charactersemantics einschalten. Damit die RegEx.

Oder Du arbeitest bytesemantisch und erzeugst mit pack "CCC", 0xE2, 0x80, 0x8B; die Bytesequenze für das ZWS und nimmst für den zu untersuchenden Text ebenfalls die Bytesequenz zum Vergleich.

http://rolfrost.de/ucdata.html?detail=8203

mfg


PS: Also entweder Zeichen mit Zeichen vergleichen oder Bytes mit Bytes. Alles Andere wird nix.
Last edited: 2023-07-13 18:00:24 +0200 (CEST)

View full thread ZERO WIDTH SPACE (Unicode 200B) mit einem RegEx finden und ersetzen