Schrift
[thread]11098[/thread]

Google Sucherergebnisse auslesen

Leser: 1


<< >> 5 Einträge, 1 Seite
disaster_0
 2008-01-04 17:22
#104398 #104398
User since
2008-01-04
2 Artikel
BenutzerIn
[default_avatar]
Hallo!

Ich habe versucht mittels LWP::Simple und get() die Suchergebnisse einer Google-Suche asuzulesen. Leider bleibt die entsprechende Variable leer. Scheinbar ist es bei Google nicht gerne gesehen, dass die Suchergebnisse so ausgelesen werden, wobei hinter meinem Script keine bösen Absichten stecken :)

Hat hiermit schonmal jemand Erfahrungen gemacht / gibt es Möglichkeiten dieses Problem irgendwie zu lösen?
Alternativen zu Google sehe ich in diesem Fall nicht wirklich.

Vielen Dank im Vorraus.
Ronnie
 2008-01-04 17:43
#104401 #104401
User since
2003-08-14
2022 Artikel
BenutzerIn
[default_avatar]
Es gibt von Google eine extra API, für die du einen API-key brauchst. Wenn ich mich recht erinnere ist dieser umsonst bis 1000 Anfragen im Monat. Guck mal dort: http://code.google.com/apis/soapsearch/api_faq.htm...

EDIT: Dazu passend CPAN:DBD::Google und verschiedene andere cpan-Module.
Gast Gast
 2008-01-04 17:46
#104403 #104403
kein Code zum Posten?
disaster_0
 2008-01-04 17:46
#104404 #104404
User since
2008-01-04
2 Artikel
BenutzerIn
[default_avatar]
Vielen Dank Ronnie :)


//Edit... Scheinbar gibt es das so nicht mehr. Und mich jetzt in AJAX einarbeiten lohnt sich für das Vorhaben auch nicht.

Schade :)
GwenDragon
 2008-01-04 18:09
#104407 #104407
User since
2005-01-17
14761 Artikel
Admin1
[Homepage]
user image
Wieso AJAX?
Ich kann auch ohne Javascript bei Google suchen.
Sonst könnte ich mit Lynx niemals was finden. Geht aber.

Du solltest vielleicht einen Useragent nehmen, der einem echten Browser entspricht. ;)

Obwohl es auch mit UA = Bratwurst/1.0 geht ;)



Die URL bei Google ist doch wie folgt:

Code: (dl )
http://www.google.de/search?q=%s&sourceid=opera&num=%i&ie=utf-8&oe=utf-8&lr=lang_de

wobei %s der Suchsting ist.

Alles per Get abgesendet
<< >> 5 Einträge, 1 Seite



View all threads created 2008-01-04 17:22.