Thread bug in Encode? (3 answers)
Opened by miwieg at 2011-03-14 09:41

miwieg
 2011-03-14 09:41
#146466 #146466
User since
2006-07-16
59 Artikel
BenutzerIn
[default_avatar]
Hallo,

Ich muss größere Textmengen von UTF-8 nach ISO-8859-1 konvertieren.
Ich benutze Encode. Der entsprechende Code sieht ungefähr so aus:

Code: (dl )
1
2
3
4
5
6
7
open(INF,"<:encoding(utf-8)",$infile);
open(OUTF, ">:encoding(iso-8859-1)", $outfile);
while(my $line = <INF>){
# do something with $line
}
close(INF);
close(OUTF);


Leider gibt es dabei Probleme. Ich erhalte folgende Fehlermeldung:
Quote
"\x{2000}" does not map to iso-8859-1, <INF> line 18981.
panic: sv_setpvn called with negative strlen, <INF> line 18981.

und das Programm bricht vorzeitig ab.
Irgendwo im Netz hat jemand behauptet, dass dies ein Bug innerhalb des Encode-Pakets sei.

Wie kann ich dieses Problem umgehen?
Ein "Hack", der problematische Zeichen einfach vorher abfängt, wäre auch völlig ausreichend.

Vielen Dank im Voraus!

View full thread bug in Encode?