Thread unicode combined characters nach iso aber wie ?
(5 answers)
Opened by perlot at 2012-02-23 16:13
Hi, ich bin eigentlich mit Encode bisher gut gefahren, was utf8 -> iso-8859-1 und zurück anbelangt. Nun habe ich in einer XML Datei sogenannte "combined characters", die werden leider nicht erkannt, evtl. weil das erste Byte (von gesamt dreien ) nur \x{55} also kleiner als ist. Also das Ü ist nicht als 2Byte vorhanden sondern als 3Bytes. Also 1 Byte U (Latin capital letter U, \x55 ) + 2 Bytes (combining diaeresis, \xcc \x88).
Wie bekomme ich \x55\xcc\x88 zu einem Ü konvertiert ? Danke für jeden Tipp und jedes Such-Stichwort. LG M. Last edited: 2012-02-23 16:17:49 +0100 (CET) |