Thread Platzhalter für HTML-Ausdrücke (reguläre Ausdrücke) (47 answers)
Opened by vitopetre at 2010-04-02 09:42

bianca
 2010-04-06 10:32
#135738 #135738
User since
2009-09-13
7016 Artikel
BenutzerIn

user image
Generelle Bitte Vito: Wenn man in einen Text nachträglich über "Editieren" Fragen einfügt, sollte man das durch eine Anmerkung z.B. ganz unten im Post kenntlich machen, damit es gesehen wird. Besser ist, einfach auf den eigenen Post zu antworten und dort die neue Frage einzusetzen.

2010-04-06T08:08:48 vitopetre
Trotzdem muss ich jetzt nochmal dumm fragen: RegEx sind also reguläre Ausdrücke und damit wird die Art und Weise bezeichnet wie ich den Text aus der HTML-Seite holen will oder das was WWW::Mechanize macht?

Mit regulären Ausdrücken drückt man Regeln aus, nach denen etwas gefunden und/oder ersetzt werden soll in einem String. Wie gesagt, es gibt verschiedene Möglichkeiten, mit einem String etwas anzustellen. Es mit Regex zu machen gehört sicher zu den schnellsten, unter Umständen aber nicht immer zu den leicht lesbarsten und leicht zu wartenden Möglichkeiten. Wenn man es aber mal drauf hat, ist es kein Problem.
Bei WWW::Mechanize nehme ich mal stark an, dass dort auch Regex zum Einsatz kommen, müsste man mal nachschauen.

2010-04-06T08:08:48 vitopetre
Nache welcher anderen Methode funktionieren denn Module wie der HTML-Parser, den man statt der RegEX nutzen soll?

Die funktionieren im Grunde genau so, sind aber teilweise besser auf besondere Situationen oder spezielle Anforderungen getrimmt. WWW::Mechanize ist ja eigentlich ein Automatisierer für Webseiten, eine Art Roboter. Dass der auch Links extrahiert, ist eig. ein Nebeneffekt. Besser sollten das die anderen Module können.
Manchmal kann es halt besser sein, alles in einem Modul zu haben, weil man u.U. nicht jedes/unendlich viele Modul(e) zur Verfügung hat.
10 print "Hallo"
20 goto 10

View full thread Platzhalter für HTML-Ausdrücke (reguläre Ausdrücke)