Thread Systematische Fehler (42 answers)
Opened by rosti at 2023-11-12 10:22

rosti
 2023-11-14 09:59
#195521 #195521
User since
2011-03-19
3276 Artikel
BenutzerIn
[Homepage]
user image
Quote
Ein Terminal erwartet keine Encoding sondern Bytesequenzen.


Heißt, daß das Encoding eines Terminals nur intern, also für das Terminal selbst gilt. Daß ein Terminal/Console Bytesequenzen erwartet ist schon immer so gewesen. Wenn ein Terminal die Bytesequenz E2 82 AC bekommt, stellt es nur dann das Eurozeichen dar wenn am Terminal die Kodierung utf8 eingestellt ist.

Quote
Ein Unicode Codepoint der in einen bestimmten Encoding kodiert ist, ist doch eine Bytesequenz.


Nein. Der Codepoint sagt überhaupt nichts über die Kodierung aus. Bspw. hat das 'ä' den Codepoint U+E4 und kann verschieden kodiert sein, also auch Latin1 oder ANSI. Somit ist der Codepoint nur ein numerischer Identifier für ein Zeichen.

Viele Grüße!

View full thread Systematische Fehler