Thread I/O Operations: Pfade übertragen auf einen HTML-Parser (17 answers)
Opened by lin at 2010-10-03 13:29

topeg
 2010-10-05 16:50
#141730 #141730
User since
2006-07-10
2611 Artikel
BenutzerIn

user image
Denk mal darüber nach was du eigentlich machen willst:
Du willst alle HTML-Dateien durchgehen die mit "einzelergebnis" anfangen. In jeder Datei sind die Daten einer Schule, abgelegt, die du extrahieren willst. Du bekommst für jede Datei/Schule einen Datensatz.
Der muss ja irgendwo so gespeichert werden, dass er nicht überschrieben wird. Da bietet sich ein Array an das du den letzten gelesenen Datensatz anhängst.

Um das Script mal verbal zu beschreiben:
  • 0. lege ein Array "schools" an.
  • 1. suche alle Dateien die sich wie "einzelergebnis*.html" lesen
  • 2. gehe die liste der gefundenen Dateien durch
    • 2.0. lege ein Hash "school" an
    • 2.1. lese die Datei ein und extrahiere:
      • Ort
      • Name
      • Typ
      • eine Liste von Adressen
      • Beschreibung
    • 2.2. Speichere die gefunden Werte in einem Hash namens "school"
    • 2.3. Hänge den Hash "school" an das Array "schools" an. (das muss eine Hash-Referenz sein, einen Hash "%hash" kann man nicht einfach so in ein Array packen. Da passieren ganz seltsame Dinge wenn man es versucht)
  • 3. öffne eine Ausgabdatei
  • 4. gehe das Array "schools" durch
    • 4.1 lese aus dem Hash der an jeder aktuellen stelle des Arrays ist
      • Ort
      • Name
      • Typ
      • eine Liste von Adressen
      • Beschreibung

      aus und speichere die Daten in die ausagebdatei
  • 5. schließe die Ausgabedatei


EDIT: Tabelle korrekt formatiert
Last edited: 2010-10-05 17:37:01 +0200 (CEST)

View full thread I/O Operations: Pfade übertragen auf einen HTML-Parser