Thread Webseite lesen und Inhalt speichern - Probleme mit encoding (7 answers)
Opened by entepa at 2014-10-04 23:37

bianca
 2014-10-05 06:31
#177661 #177661
User since
2009-09-13
7016 Artikel
BenutzerIn

user image
Wenn die gecrawlte Seite nicht in UTF-8 vorliegt muss sie erst gewandelt werden.
Versuchs mal mit encode('utf8',decode('ZEICHENSATZ_DER_SEITE',$response->decoded_content)).

Oben im Script ein use Encode qw(decode encode);.
Als 'ZEICHENSATZ_DER_SEITE' vermute ich mal ein 'iso-8859-1' oder 'iso-8859-15' aber das lässt sich im Quelltext der Seite nachsehen.

Zum lesen: Zeichenkodierungen oder „Warum funktionieren meine Umlaute nicht?”
10 print "Hallo"
20 goto 10

View full thread Webseite lesen und Inhalt speichern - Probleme mit encoding