Thread Zeichensatzproblem mit Š
(15 answers)
Opened by bianca at 2019-06-07 19:07 2019-06-07T17:07:51 bianca Ich tippe auf eine falsche Reihenfolge beim dekodieren: Die Bytefolge des großen Š ist (hex) C5 A0. Das A0 ist, als Byte interpretiert, wie das Pech es so will, der Wert des NBSP (non-breaking-space), und wir sehen ja auch ein Leerzeichen nach dem \305 in der Ausgabe des Data::Dumper. Irgendwer interpretiert die Daten byte-weise und wandelt das NBSP in ein normales Blank um, bevor Du mit Deinem UTF8-Dekodieren zum Zug kommst. Wenn Du den Sündenbock nicht findest, der das vermeintliche NBSP in ein Leerzeichen verwandelt: Schau' Dir in der CGI-Dokumentation mal das Pragma -utf8 an: Damit übernimmt CGI das Dekodieren, hoffentlich bevor das NBSP in ein Leerzeichen umgewandelt wird. Dann darfst Du selbst natürlich nicht mehr dekodieren. |