Thread Quellcode einer Website abziehen (6 answers)
Opened by DiesDas at 2018-06-21 12:34

Gast DiesDas
 2018-06-21 12:34
#188555 #188555
Hallo zusammen,

Ich hoffe ich bin hier richtig gelandet.

Ich möchte gerne den Quellcode einer Website abziehen, um diesen auszuwerten.
Nun habe ich versucht mit wget & cURL an den Quellcode zu kommen, aber ich bekomme nie den selben Quellcode, der mir auch im Browser angezeigt wird.

wget
Code: (dl )
system("wget -P $folder -e robots=off $url_download");


cURL
Code: (dl )
system("curl -o $folder/seite1.html $url_download");


Ich vermute der zieht sich immer .php Datei, die wahrscheinlich die html-dateien auf einem CMS-System dynamisch erzeugt.

Gibt es eine andere Möglichkeit an den Quellcode zu kommen, der im Browser ausgegeben wird?

Ich arbeite mit Perl, daher habe ich es mal mit dem Modul "Mechanize" probiert und komme hier zum selben Ergebnis..

Code: (dl )
1
2
3
4
5
6
7
8
9
10
11
12
my $mech = WWW::Mechanize->new;

$mech->get($url);


my @lines = split(/\n+/,$mech->content);

foreach( @lines ) {

print $_ . "\n";

}


Für hilfreiche Kommentare wäre ich sehr dankbar
Last edited: 2018-06-21 12:37:42 +0200 (CEST)

View full thread Quellcode einer Website abziehen