Thread Zeichensätze UTF-8 -> Latin-1 konvertieren (21 answers)
Opened by Glasperlenspieler at 2011-01-04 09:53

leo11
 2011-01-05 06:03
#144077 #144077
User since
2008-08-14
250 Artikel
BenutzerIn
[default_avatar]
2011-01-04T20:19:54 Glasperlenspieler
Quote
Dir ist klar, das Win Latin-1 nicht ISO-8859-1 ist?


Macht das denn in der Praxis einen Unterschied oder ist das etwas, über das man hinwegsehen kann?!

Das zeigt mein Beispiel. Ich hab ein Zeichen aus WINDOWS-1252 genommen das nicht in ISO-8859-1 enthalten ist und es nach UTF8 gewandelt. Dann hab ich eine Wandlung mit iconv und recode nach ISO-8859-1 versucht/gemacht. Wenn die Daten die dir vorliegen ursprünglich von WINDOWS-1252 nach UTF-8 konvertiert wurden, und du sie nun nach ISO-8859-1 konvertieren möchtest, weil dir nicht klar war, dass auch WINDOWS-1252 völlig ok/richtig wäre, dann macht es also den Unterschied ziwschen einer Lösung ohne Probleme und einer mit. Eben genau das zeigt mein Beispiel.

Quote
Quote
Wie zuvor schon jemand schrieb: Was soll dann damit passieren?

Hmpf, habe ich das nicht schon beantwortet? Mir geht es im Endeffekt darum, eine Liste der Zeichen zu erhalten, die nicht konvertiert werden können.

Schon klar. Nur was machst du dann damit. Nehmen wir mal an du hast dann ISO-8859-1 mit besonders codierten Zeichen alla HTML. Was nutzt das? Programme müssen das ja auch interpretieren können. Gibt es Programme die ISO-8859-1 gemischt mit bspw. UTF8 richtig interpretieren? Selbst wenn, klingt das recht ungewöhnlich.

View full thread Zeichensätze UTF-8 -> Latin-1 konvertieren