Thread 3 Fragen: Trefferliste umstrukturieren, mit gefunden Links weiterarbeiten + wie kann ich nur Teile eines Treffers anzeigen?
(47 answers)
Opened by vitopetre at 2010-04-11 23:27 2010-04-12T23:26:13 vitopetre <MEINE_PERÖNLICHE_MEINUNG_UND_ERFAHRUNG> Lass Dich nicht entmutigen. Was hier alles gesagt wird ist alles richtig. Vieles davon allerdings sehr theoretisch und verallgemeinert. Ich parse auch einige Seiten teils mit Modulen und teils mit Regex und das klappt wundervoll! Das Parsen läuft bei mir überwiegend per CRON im Hintergrund und hat in nun über 7 Jahren in 3 größeren Projekten vielleicht alles in allem 10 mal kleinere Anlässe für Anpassungen gegeben, ansonsten läuft das wie ein Uhrwerk. Und die Hälfte der Anpassungen beruhten auf Anpassung meines eigenen Codes aufgrund mangelnden Wissens meinerseits bis dato und nicht aufgrund von Änderungen bei den geparsten Seiten. Es erkennt dank Regex sogar sämtliche Fehler in den Daten, die der Anbieter selbst nicht bemerkt :) Meine Praxiserfahrung besagt einfach, dass Seitenanbieter in der Regel von einmal angestammtem Code-Aufbau (bezogen auf HTML) nur selten abweichen. Und dann geht das mit Regex sehr gut. Mag sein, dass die von mir geparsten Seiten dahingehend selten sind aber ich weiß es einfach von mir selbst. Meine eigenen Seiten ändern sich vom Aufbau/Syntax her auch eher selten. Und wenn man mal inhaltlich etwas anfasst, dann doch meist im gleichen Stil und gleicher Syntax wie das bestehende, oder? Man will sich ja nichts zerschießen und auch ohne erneute komplette Einarbeitung mal schnell was ändern/ergänzen. Insofern: Regex und HTML sind nicht unmöglich und - je nach Fall - sogar ganz wunderbar geeignet für HTML! </MEINE_PERÖNLICHE_MEINUNG_UND_ERFAHRUNG> Edit: Und was wollte ich damit sagen? Ich wollte sagen, entscheide nicht dogmatisch, wie Du es löst nach dem Motto, "man parst HTML nicht mit Regex". Lasse Faktoren wie Beständigkeit der Anbieterseite, eigener Lerneffekt, eigene zur Verfügung stehende Zeit für das Projekt, Spaß an der Arbeit genauso einfließen, SOLANGE es sich hier nicht um eine berufliche Angelegenheit oder Auftragsarbeit handelt. Last edited: 2010-04-13 08:46:39 +0200 (CEST) 10 print "Hallo"
20 goto 10 |