Denk mal darüber nach was du eigentlich machen willst:
Du willst alle HTML-Dateien durchgehen die mit "einzelergebnis" anfangen. In jeder Datei sind die Daten einer Schule, abgelegt, die du extrahieren willst. Du bekommst für jede Datei/Schule einen Datensatz.
Der muss ja irgendwo so gespeichert werden, dass er nicht überschrieben wird. Da bietet sich ein Array an das du den letzten gelesenen Datensatz anhängst.
Um das Script mal verbal zu beschreiben:
- 0. lege ein Array "schools" an.
- 1. suche alle Dateien die sich wie "einzelergebnis*.html" lesen
- 2. gehe die liste der gefundenen Dateien durch
- 2.0. lege ein Hash "school" an
- 2.1. lese die Datei ein und extrahiere:
- Ort
- Name
- Typ
- eine Liste von Adressen
- Beschreibung
- 2.2. Speichere die gefunden Werte in einem Hash namens "school"
- 2.3. Hänge den Hash "school" an das Array "schools" an. (das muss eine Hash-Referenz sein, einen Hash "%hash" kann man nicht einfach so in ein Array packen. Da passieren ganz seltsame Dinge wenn man es versucht)
- 3. öffne eine Ausgabdatei
- 4. gehe das Array "schools" durch
- 4.1 lese aus dem Hash der an jeder aktuellen stelle des Arrays ist
- Ort
- Name
- Typ
- eine Liste von Adressen
- Beschreibung
aus und speichere die Daten in die ausagebdatei
- 5. schließe die Ausgabedatei
EDIT: Tabelle korrekt formatiert
Last edited: 2010-10-05 17:37:01 +0200 (CEST)