Thread Webseite bestimmte Werte auslesen
(12 answers)
Opened by Willi9974 at 2020-03-07 09:08
Die API von TreeBuilder saugt Eselschwänze. Web::Query ist um Größenordnungen einfacher zu bedienen. Illustration, ungetestet:
Code (perl): (dl
)
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 use Web::Query::LibXML 'wq'; my $post_wrapper = wq('https://www.perl-community.de/bat/poard/thread/20750') ->find('div.author > a:contains("clms")') ->parent->parent; my $posting = $post_wrapper->find('.posting_content'); $posting->find('blockquote')->remove; my $post_text = $posting->text; my @permalinks; $post_wrapper->find('.anchor a')->each(sub { push @permalinks, $_->attr('href'); }); |