Thread split: \W ohne deutsche Umlaute
(3 answers)
Opened by pktm at 2008-05-15 00:02
Oder Textstrings benutzen und die Unicode-Eigenschaft IsAlnum abfragen:
Code (perl): (dl
)
1 2 3 4 5 6 7 8 9 10 use strict; use warnings; use utf8; binmode STDOUT, ':utf8'; my $test = "abäc||asÖdß! ü"; my @a = split m/\P{IsAlnum}+/, $test; print "@a\n"; __END__ abäc asÖdß ü Locales haben einige Probleme, z.B. sind sie auf einigen Linuxinstallationen ein wenig kaputt, und es gibt ein paar potentielle Sicherheitsprobleme. |