Thread [Mojo::DOM] Regex bis "break"? (8 answers)
Opened by Ionit at 2014-09-23 13:56

Ionit
 2014-09-23 13:56
#177492 #177492
User since
2006-05-16
81 Artikel
BenutzerIn
[default_avatar]
Hallo Freunde,

ich habe folgende html-Struktur.

Code: (dl )
1
2
3
4
5
6
7
<div id="test">
Alter: 21 Jahre<br>
Haarfarbe: blond<br>
Figur: normal<br>
Augenfarbe: grün<br>
.....
</div>


Wie ihr seht, ist der Content in diesem DIV nur durch ein <br> getrennt bzw. zu unterscheiden - es fehlen leider die li-tags (oder ähnliches).

Somit habe ich Probleme mit Mojo durch dieses Content zu loopen um die richtige Zeile zu finden (z.B. das Alter).

Wenn li-Tags vorhanden wären, würde ich das z.B. so machen:
Code: (dl )
1
2
3
4
5
6
7
8
@details = $dom2->find("li")->each( sub {
if ($_->find("li")->first =~ /Alter:/) {
$alter = $_->text;
$alter =~ s/Alter://;
$alter =~ s/Jahre//;
$alter =~ s/ //g;
}
}


Damit hätte ich den numerischen Wert (den brauche ich nämlich). Bei dem obigen Beispiel ist das aber nicht möglich.

Ich als Anfänger weiß leider nicht wie ich die obigen Zeilen aufspalten und aus jeder einzelnen eine Mojo:Collection machen kann um den jeweiligen Text/Wert extrahieren zu können.

Wäre von euch jemand so nett und könnte mir einen Tip geben. Ich bin nämlich mit meinem Latein momentan am Ende.

Danke schonmal im Voraus
Matthias
Last edited: 2014-09-23 14:04:45 +0200 (CEST)

View full thread [Mojo::DOM] Regex bis "break"?