Thread Anfänger: RegEx-Templates / Handler? (8 answers)
Opened by Ionit at 2014-09-05 16:24

Raubtier
 2014-09-05 16:48
#177097 #177097
User since
2012-05-04
1076 Artikel
BenutzerIn
[default_avatar]
Naja, wenn du jeweils die Infos aus unterschiedlichen Stellen holen musst, dann wirst du um eine Spezialbehandlung wohl nicht herumkommen.

Allerdings ist selbst html mit bekannter Struktur mit REs schlecht/schwierig zu parsen, wieso also RegEx-Templates?

Wenn es Webseiten sind, kann man die z.B. mit Mojo::DOM recht einfach parsen, wenn man weiß, wo man die Infos herbekommen möchte.

Beispiel:
Code (perl): (dl )
1
2
3
4
use Mojo::DOM;
use LWP::Simple;
my $dom=Mojo::DOM->new(get("http://www.perl-community.de/bat/poard/thread/19260"));
$dom->find("div.author_info small")->each(sub { say $_->text });


Also vielleicht eine kleine sub für jede Art von URL?

View full thread Anfänger: RegEx-Templates / Handler?