Thread unicode combined characters nach iso aber wie ? (5 answers)
Opened by perlot at 2012-02-23 16:13

perlot
 2012-02-23 16:13
#156372 #156372
User since
2012-02-23
2 Artikel
BenutzerIn
[default_avatar]
Hi, ich bin eigentlich mit Encode bisher gut gefahren, was utf8 -> iso-8859-1 und zurück anbelangt. Nun habe ich in einer XML Datei sogenannte "combined characters", die werden leider nicht erkannt, evtl. weil das erste Byte (von gesamt dreien ) nur \x{55} also kleiner als ist. Also das Ü ist nicht als 2Byte vorhanden sondern als 3Bytes. Also 1 Byte U (Latin capital letter U, \x55 ) + 2 Bytes (combining diaeresis, \xcc \x88).

Wie bekomme ich \x55\xcc\x88 zu einem Ü konvertiert ? Danke für jeden Tipp und jedes Such-Stichwort. LG M.
Last edited: 2012-02-23 16:17:49 +0100 (CET)

View full thread unicode combined characters nach iso aber wie ?