Gerade was die Unicode-Unterstützung in Perl angeht, ist viel passiert. Ab Perl 5.14.0 wird Unicode 6.0 fast komplett unterstützt. Es gibt noch ein paar Grenzfälle, die nicht komplett abgedeckt werden, aber das meiste ist komplett:
Wenn Du
use feature 'unicode_strings' verwendest, werden alle String-Operationen und Regulären Ausdrücke mit Unicode-Semantik ausgeführt.
\N{NAME} kennt jetzt alle Namen aus Unicode
Du kannst eigene Abkürzungen für \N{ABKÜRZUNG} festlegen
Schau Dir auch am besten mal
http://beta.metacpan.org/module/charnames an.
Karl Williamson hat echt ganze Arbeit geleistet. Vor allem bei den Regulären Ausdrücken hat er viel gemacht.
Bei multi-char folds gibt es aber ein paar Sachen zu berücksichtigen:
"\N{LATIN SMALL LIGATURE FI}" =~ /fi/i; # Matches
"\N{LATIN SMALL LIGATURE FI}" =~ /[fi][fi]/i; # Doesn't match!
"\N{LATIN SMALL LIGATURE FI}" =~ /fi*/i; # Doesn't match!
Und was Perl-Code in UTF-8 angeht: Zur Zeit gibt es ein
"Google Summer of Code"-Projekt, das sich damit beschäftigt, dass Perl-Code auch noch mehr UTF-8 enthalten darf.