Thread Zeichen ersetzen: UTF - ISO-8859-2/windows-1250?
(10 answers)
Opened by Gast at 2008-01-15 18:45
Hallo
Wenn du eine Perl-Version hast die Unicode kann und dein Betriebssystem Unicode kann - für Vista kann ich die Frage nicht beantworten - ist Perl dein Freund. Mit Hilfe des Moduls Encode kannst du (fast) alles nach UTF-8 konvertieren. Code (perl): (dl
)
1 2 3 4 5 kristian@tux:~> perl -wle ' use Encode; my @list = Encode->encodings(":all"); print $_ for @list; ' 7bit-jis AdobeStandardEncoding AdobeSymbol AdobeZdingbat ascii ascii-ctrl big5-eten big5-hkscs cp1006 cp1026 cp1047 cp1250 cp1251 cp1252 cp1253 cp1254 cp1255 cp1256 cp1257 cp1258 cp37 cp424 cp437 cp500 cp737 cp775 cp850 cp852 cp855 cp856 cp857 cp860 cp861 cp862 cp863 cp864 cp865 cp866 cp869 cp874 cp875 cp932 cp936 cp949 cp950 dingbats euc-cn euc-jp euc-kr gb12345-raw gb2312-raw gsm0338 hp-roman8 hz iso-2022-jp iso-2022-jp-1 iso-2022-kr iso-8859-1 iso-8859-10 iso-8859-11 iso-8859-13 iso-8859-14 iso-8859-15 iso-8859-16 iso-8859-2 iso-8859-3 iso-8859-4 iso-8859-5 iso-8859-6 iso-8859-7 iso-8859-8 iso-8859-9 iso-ir-165 jis0201-raw jis0208-raw jis0212-raw johab koi8-f koi8-r koi8-u ksc5601-raw MacArabic MacCentralEurRoman MacChineseSimp MacChineseTrad MacCroatian MacCyrillic MacDingbats MacFarsi MacGreek MacHebrew MacIcelandic MacJapanese MacKorean MacRoman MacRomanian MacRumanian MacSami MacSymbol MacThai MacTurkish MacUkrainian MIME-B MIME-Header MIME-Header-ISO_2022_JP MIME-Q nextstep null posix-bc shiftjis symbol UCS-2BE UCS-2LE UTF-16 UTF-16BE UTF-16LE UTF-32 UTF-32BE UTF-32LE UTF-7 utf-8-strict utf8 viscii Die Doku zu Encode hilft übringends ungemein, wenn man verstehen will oder muss, was da abgeht. Sag uns mal noch ein Wort zu deiner Perlversion, ich vermute die kommt von ActiveState? "perl -v" sagt es dir. Latin 2 ist nur ein anderer Name für ISO-8859-2, MS hat immer ein eigenes Plazebo für jeden Zeichensatz, in vielen Fällen waren die Anfangs identisch hatten nur andere Namen. Gruss Kristian |