Thread Unicode
(15 answers)
Opened by GwenDragon at 2019-01-21 16:20
Der Browser kann UTF-8, und es steht im Header. Er bekommt die Bytes c3b0 c29f c291 c280, und nachdem er die UTF-8-Dekodierung durchgeführt hat, muss er aus den resultierenden Codepoints was machen. In Windows Codepage 1252 steht Ÿ‘€ genau an den Positonen, die nach dem Dekoderen entstehen.
c3b0 ist ein in Unicode definierter Codepoint (U+00F0) für das ð. Die anderen entsprechen im Iso-Latin-1-Supplement irgendwelchen Kontrollzeichen: c280 oder Codepoint U+0080 ist im Unicodeblock_Lateinisch-1,_Ergänzung ein PAD, 80 ist in Windows-1252 ein €. |