Thread Wie nach ISO-8859-1 konvertieren (15 answers)
Opened by miwieg at 2011-02-22 17:22

clms
 2011-02-23 13:49
#145936 #145936
User since
2010-08-29
373 Artikel
BenutzerIn
[default_avatar]
2011-02-23T12:12:38 GwenDragon
Ich Interpretiere den HTML5-Draft so:
Wenn das Zeichenencoding als ISO-8859-1 angegeben ist und das eingelesenen Zeichen nicht aus ISO-8859-1 stammt, soll in dem Fall die Kodierung Windows-1252 als Ersatz angenommen werden.

Da steht nicht, dass für HTML5 ISO-8859-1 koderter Inhalt immer als Windows-1252 zu interpretieren ist.

Ich habe mir den HTML5-Draft jetzt nicht durchgelesen, aber es macht durchaus Sinn, der Einfachheit halber ISO-8859-1 bei der HTML-Ausgabe immer als Windows-1252 zu interpretieren.

Da kann man 3 Fälle untrescheiden:

* der Code entspricht einem druckbaren Zeichen in ISO-8859-1.
Dann liefert Windows-1252 das gleiche Zeichen. Es ist also egal welche der beiden Codierungen man verwendet.

* Control-Codes im Bereich 0x00-0x1F
Die sind bei beiden Codierungen (und ASCII) identisch. es ist also egal, welchen Code man verwendet. Außer Zeilenumbruch und Tabs sind sie fürs Rendern von HTML ohnehin uninteressant

* Codes 0x80-0x9F
In diesem Bereich unterscheiden sich die beiden Codierungen. ISO-8859-1 hat dort Control-Codes, die in einem HTML-Dokument nix zu suchen haben. Für die HTML-Darstellung sind sie nicht geeignet. Bei Windows-1252 ist ein Großteil dieser Codes mit druckbaren Zeichen belegt. Also kann man die getrost ausgeben.

View full thread Wie nach ISO-8859-1 konvertieren