Thread Quellcode einer Website abziehen
(6 answers)
Opened by DiesDas at 2018-06-21 12:34
Hallo zusammen,
Ich hoffe ich bin hier richtig gelandet. Ich möchte gerne den Quellcode einer Website abziehen, um diesen auszuwerten. Nun habe ich versucht mit wget & cURL an den Quellcode zu kommen, aber ich bekomme nie den selben Quellcode, der mir auch im Browser angezeigt wird. wget Code: (dl
)
system("wget -P $folder -e robots=off $url_download"); cURL Code: (dl
)
system("curl -o $folder/seite1.html $url_download"); Ich vermute der zieht sich immer .php Datei, die wahrscheinlich die html-dateien auf einem CMS-System dynamisch erzeugt. Gibt es eine andere Möglichkeit an den Quellcode zu kommen, der im Browser ausgegeben wird? Ich arbeite mit Perl, daher habe ich es mal mit dem Modul "Mechanize" probiert und komme hier zum selben Ergebnis.. Code: (dl
)
1 my $mech = WWW::Mechanize->new; Für hilfreiche Kommentare wäre ich sehr dankbar Last edited: 2018-06-21 12:37:42 +0200 (CEST) |