Thread mein script verweigert ignore_case in utf-8 pattern matching
(23 answers)
Opened by technix at 2013-06-02 16:19
Encode ist ein perl-modul, das ab 5.8 mitgeliefert wird.
die doku kannst du auch lokal mit perldoc Encode aufrufen. hier mal zur veranschaulichung von bytes und chars (kommentare von mir): Code: (dl
)
1 perl -wE' ich arbeite in einem utf8-terminal. output nummer 1: in $bytes steht \303\244 für das ä - 2 bytes, die als utf8 dekodiert einen zusammenhängenden character bilden würden. output nummer 2: das siehst du in $chars. Devel::Peek zeigt dir zur veranschaulichung [UTF8 "\x{e4} \x{f6} \x{fc}"]. output nummer 3: in latin1 besteht ein ä aus einem byte \344 binmode STDOUT, ... ist nur eine alternative zu $output = encode_utf8($output) und praktisch, wenn man mehrere sachen ausgeben will und nicht den gesamten output in einer variable hat. steht aber auch in http://perlgeek.de/de/artikel/charsets-unicode Always code as if the guy who ends up maintaining your code will be a violent psychopath who knows where you live. -- Damian Conway in "Perl Best Practices"
lesen: Wie frage ich & perlintro brian's Leitfaden für jedes Perl-Problem |