Schrift
[thread]8611[/thread]

Shift-Jis Problem



<< >> 5 Einträge, 1 Seite
esskar
 2006-12-30 04:08
#72802 #72802
User since
2003-08-04
7321 Artikel
ModeratorIn

user image
Moin,

ich quälle mich schon seit längerem mit einem shift-jis problem rum.
z.B. folgende Seite: http://www.kagoshima.med.or.jp/map/index/198.html hol ich mit mit LWP ab und will mir dann den body mit $resp->decoded_content decodieren.
Ich bekomm dann undef zurueck und in $@ steht folgende Meldung: shiftjis "\xFA" does not map to Unicode at C:/Perl/lib/Encode.pm line 166.

Liegt das jetzt wirklich an der Seite. Solche Fehler tauchen noch auf 1000 anderen japanischen Seiten auf und nicht nur von Seiten dieser Domain sondern auch von anderen.

Kann das ein Fehler inm Perl Shift-Jis Decoder sein?

Wenn ich versuche, den Fehler zu umgehen und die Stuecke, die mich interessieren, selber dekodiere (auch wieder mit Encode::decode) tritt der Fehler auch auf.

In den handlesüblichen Browsern sieht ja auch alles normal aus.

Hat jemand ne Idee oder sieht meine Denkfehler?

Danke.
topeg
 2006-12-30 05:34
#72803 #72803
User since
2006-07-10
2611 Artikel
BenutzerIn

user image
Ich glaube der Decoder stolpert irgendwo über "CJK Compatibility Ideographs" von F900 bis FAFF...
esskar
 2006-12-30 10:48
#72804 #72804
User since
2003-08-04
7321 Artikel
ModeratorIn

user image
weißt du das?
oder siehst du das?

aber schonmal danke!
topeg
 2006-12-30 14:18
#72805 #72805
User since
2006-07-10
2611 Artikel
BenutzerIn

user image
In der von dir gezeigten seite taucht mehrfach ein Zeichen mit der Codierung "FA11" auf und sonst keines das "FA" enthält (zumindest habe ich keines gesehen). "FA11" taucht halt in "CJK Compatibility Ideographs" auf. Es ist unwahrscheinlich, daß einzelne Zeichen aus aus einer Map fehlen, so glaube ich, daß die gesammte Unicodemap nicht gefunden wird.
Aber das ganze ist nur eine Vermutung, die noch geprüft werden müßte.
esskar
 2006-12-30 18:09
#72806 #72806
User since
2003-08-04
7321 Artikel
ModeratorIn

user image
hab jetzt mein ganzes projekt nach c# portiert, da klappt das decoden nämlich!
ich werde die woche mal nen bug einreichen!
<< >> 5 Einträge, 1 Seite



View all threads created 2006-12-30 04:08.