Thread Webseite lesen und Inhalt speichern - Probleme mit encoding
(7 answers)
Opened by entepa at 2014-10-04 23:37
Wenn die gecrawlte Seite nicht in UTF-8 vorliegt muss sie erst gewandelt werden.
Versuchs mal mit encode('utf8',decode('ZEICHENSATZ_DER_SEITE',$response->decoded_content)). Oben im Script ein use Encode qw(decode encode);. Als 'ZEICHENSATZ_DER_SEITE' vermute ich mal ein 'iso-8859-1' oder 'iso-8859-15' aber das lässt sich im Quelltext der Seite nachsehen. Zum lesen: Zeichenkodierungen oder „Warum funktionieren meine Umlaute nicht?” 10 print "Hallo"
20 goto 10 |