Thread split: \W ohne deutsche Umlaute (3 answers)
Opened by pktm at 2008-05-15 00:02

moritz
 2008-05-15 01:57
#109718 #109718
User since
2007-05-11
923 Artikel
HausmeisterIn
[Homepage]
user image
Oder Textstrings benutzen und die Unicode-Eigenschaft IsAlnum abfragen:

Code (perl): (dl )
1
2
3
4
5
6
7
8
9
10
use strict;
use warnings;
use utf8;
binmode STDOUT, ':utf8';

my $test = "abäc||asÖdß! ü";
my @a = split m/\P{IsAlnum}+/, $test;
print "@a\n";
__END__
abäc asÖdß ü


Locales haben einige Probleme, z.B. sind sie auf einigen Linuxinstallationen ein wenig kaputt, und es gibt ein paar potentielle Sicherheitsprobleme.

View full thread split: \W ohne deutsche Umlaute