Thread ucfirst in RegEx nutzen (12 answers)
Opened by Lebewesen at 2011-11-09 16:41

rosti
 2011-11-09 20:29
#154082 #154082
User since
2011-03-19
3470 Artikel
BenutzerIn
[Homepage]
user image
Das Problem ist nicht UTF-8-spezifisch. Die Stringfunktionen lcfirst() und ucfirst() funktionieren mit Umlauten erst seit Perl 5.6., also seither Perl zwischen Oktetten und Zeichenketten unterscheidet. Encode.pm gibt es seit v5.8, damit ist es möglich, dem Perlinterpreter mitzuteilen, ob es sich um eine Zeichenkette mit einer bestimmten Kodierung handelt.

Beim Lesen von Bytes aus Dateien kann diese "Mitteilung ob der Kodierung" alternativ auch über den IO-Layer gemacht werden (ab v5.8) und darüber hinaus gibt es noch das Pragma use bytes; zum Einschalten der byteSemantics, falls erforderlich.

View full thread ucfirst in RegEx nutzen