Query von Hyperlinks sortieren - #191338 (HTML, CSS und Javascript)

mika

2020-02-09 12:19

User since
2010-10-02
168 Artikel
BenutzerIn

user image

Wie fragt man den canonical Link eines Dokuments am besten ab?

Hier mal was ich habe, das tut aber eigentlich nicht:

Code: (dl )

#!/usr/bin/perl

use strict;
use warnings;
use LWP;
use Data::Dumper;

my $browser = LWP::UserAgent->new();
my $site = $browser->get('http://de.wikibooks.org');
my $code = $site->decoded_content();

use XML::LibXML;
my $dom = XML::LibXML->load_xml(string => $code);
foreach my $node ($dom->findnodes('//link[@rel="canonical"]/@href')) {
    print $node->to_literal(), " # canonical LibXML\n";
}

use XML::XPath;
my $xp = XML::XPath->new(xml => $code);
foreach my $node ($xp->findnodes('//link[@rel="canonical"]')) {
    print $node->getAttribute('href'), " # canonical XPath\n";
}

Last edited: 2020-02-09 12:21:24 +0100 (CET)