Thread lwp tokeparser HTML::Parser haumichtot: newbie braucht hilfe (1 answers)
Opened by Gast at 2007-01-25 11:46

Gast Gast
 2007-01-25 11:46
#9546 #9546
Hallo Community,

ich hoffe ihr könnt mir helfen, ich versuche derzeit inhalt aus einer webseite sauber zu grabben, leider (bis jetzt) ohne erfolg.

Bis jetzt habe ich geschaft den gesamten quelltext mit meinem perl script zu grabben (wow..)

nun will ich aber nur bestimmte Texte davon in meiner variable haben, und zwar sieht das wie folgt aus:

Code: (dl )
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
            <td class="column1">

<input type="submit" name="Button1" value="Hinzufuegen" id="Button1" class="add" />

12345

<br />

<span class="verkauf">

67890

</span>

<br />


</td>
</tr>


von diesen blöcken will ich nun "12345" und "67890" extrahieren, diese blöcke sind immer identisch aufgebaut, der einzige unterschied ist das Button1 Numerisch weitergeführt wird, Button2, Button3, etc.

wie bewerkstellige ich das nun am einfachsten, ratet ihr mir eher zu dem tokeparser, ode eher zum normalen parser?

wäre super wenn ihr mir ein beispiel geben könntet, habe leider erst gestern mit perl angefangen!

gruß
luigi

p.s. irgendwie funktioniert die registration hier im board nicht Oo

View full thread lwp tokeparser HTML::Parser haumichtot: newbie braucht hilfe