Thread Umlaute finden
(6 answers)
Opened by hago at 2018-01-23 08:40
Bei Umlauten gibt es mehre Dinge zu betrachten:
a) in welcher Kodierung ist dein Perl-Script gespeichert? b) in welcher Kodierung erfolgt die Eingabe? c) in welcher Kodierung erfolgt die Ausgabe? Wenn du "use utf8;" verwendest, zeigst du Perl an, dass du dein Script in utf-8 gespeichert hast (dann sollte das aber auch stimmen und das Script nicht in Windows-1252 gespeichert sein!). Somit wird die üs in deinem Programm (also sowohl bei der Zuweisung an $xx als auch in den Regex) korrekt als solches erkannt. Dann musst du nur noch Ein- und Ausgabe umwandeln. Die Eingabe mit decode, die Ausgabe mit encode. Ich bin kein Windows-Experte, meine aber mich zu erinnern, dass Windows Codepage 850 verwendet (gibt es "chcp" noch? - gib es einfach mal auf Windows-Kommandozeile ein!) Hier ein exzellenter Artikel: https://perlgeek.de/de/artikel/charsets-unicode Last edited: 2018-01-23 08:59:28 +0100 (CET) |