Thread ucfirst in RegEx nutzen
(12 answers)
Opened by Lebewesen at 2011-11-09 16:41
Das Problem ist nicht UTF-8-spezifisch. Die Stringfunktionen lcfirst() und ucfirst() funktionieren mit Umlauten erst seit Perl 5.6., also seither Perl zwischen Oktetten und Zeichenketten unterscheidet. Encode.pm gibt es seit v5.8, damit ist es möglich, dem Perlinterpreter mitzuteilen, ob es sich um eine Zeichenkette mit einer bestimmten Kodierung handelt.
Beim Lesen von Bytes aus Dateien kann diese "Mitteilung ob der Kodierung" alternativ auch über den IO-Layer gemacht werden (ab v5.8) und darüber hinaus gibt es noch das Pragma use bytes; zum Einschalten der byteSemantics, falls erforderlich. |