Thread [Tk] File auswählen unicode
(31 answers)
Opened by welle at 2013-11-01 20:07
Hallo GUIfreund,
2013-11-06T11:52:30 GUIfreund Den kann es naturgemäß nicht geben, weil z.B. ein ASCII-String in fast allen Kodierungen gleich ist. Um eine Zeichenfolge mit nicht-ASCII-Zeichen einer Kodierung zuordnen zu können, müsste man wissen, welche Zeichen das sein sollen. In einer 8-Bit-Kodierung kann beispielsweise derselbe Codepoint mal ein Ä oder ein (kyrillisches) Д sein usw. Es gibt Encode::Guess, das die Kodierung zu erraten versucht, wie der Name schon sagt. Wenn man eine ganze Datei hat, kann es sein, dass sie am Anfang einen Byte Order Mark (BOM) hat; daran kann das Encoding zuverlässig erkannt werden. HTH Grüße payx |