Thread use utf8 und Verhalten von String-Operationen (65 answers)
Opened by rosti at 2011-08-03 19:16

rosti
 2011-08-03 17:22
#151106 #151106
User since
2011-03-19
3472 Artikel
BenutzerIn
[Homepage]
user image
Quote
Du siehst, das utf8-Pragma hat keinerlei Einfluss auf das Ergebnis des String-Operationen. Wenn man substr() und uc() bytes liefert, arbeiten sie auf bytes, wenn man ihnen codepoints liefert, arbeiten sie auf codepoints, voellig unabaehngig vom utf8-Pragma.

Ueberzeugt?


Ja, natürlich, keine Frage ;)

Es kommt immer auf die Aufgabenstellung an, Beispiele:

Wenn ich in Perl Character Semantic haben will, gehe ich über die Codepoints. Wenn eine DB-Anbindung vorliegt und Character Semantic im RDBMS gebraucht wird, nutze ich die CS-Methoden des RDBMS. Wenn das RDBMS mit Byte-Sequenzen aus einem Perl-Script klarkommt, brauche ich in Perl keine CS, sondern belasse es bei der Byte Semantic. Wenn ein Perl-CGI Bytessequenzen an einen Webserver schickt, braucht es ebenfalls keine CS in Perl.

Mein Modul CSU ' Character Semantics for UTF-8 ' hat auf Perl v5.6.1 und v5.8.8 bisher jeder Aufgabenstellung genügt, was CS in Sachen Perl betrifft. Ich werde das Modul (alter Name CharTools, seit heute finde ich den Namen CSU besser *G) nicht veröffentlichen, Ihr habt mir zu verstehen gegeben, dass Ihr lieber Encode auf höheren Perl-Versionen benutzt.

--Rolf

View full thread use utf8 und Verhalten von String-Operationen