Thread Zeichen ersetzen: UTF - ISO-8859-2/windows-1250?
(10 answers)
Opened by Gast at 2008-01-15 18:45
Ich bin ein Perl Neuling und Perl ist auch meine erste Programmiersprache. Insbesonde mit charsets kenne ich mich überhaupt nicht aus. Alles was ich im Internet bisher dazu gefunden hab war mir vieeeeeeeel zu hoch und ich suche schon den ganzen Tag! Deshalb wäre ich dankbar wenn mir jemand weiterhelfen kann und mirs idiotensicher erklären könnte.
Ich hab etliche Text-Dateien, die tschechische Schriftzeichen enthalten, diese Dateien sollen in anderen Programmen verwendet werden, die nur ASCII-Code unterstützen. Jetzt hab ich versucht ein Perl script zu schreiben, dass die Zeichen durch mehrere von mir erfundene Zeichen ersetzt (so ähnlich wie im Deutschen ß mit ss geschrieben werden kann). Das funktioniert auch ganz gut, wenn die Dateien in UTF-8 codiert wurden. Es funktioniert aber nicht mit ner ganzen Reihe anderer Dateien, die ich hier so rumliegen habe. So jetzt meine Fragen: 1.) Gibt es ne Möglichkeit mit Perl herauszufinden, welchen Zeichencode eine Datei verwendet? 2.) Kann man mit perl Dateien in einem bestimmten Zeichencode einlesen und in einen anderen konvertieren? 3.) Wie? 4.) Wenn das alles nicht geht, welche Möglichkeiten gibts noch zeichencode zu konvertieren? Vielen Dank schon mal Annett |