Thread LWP libwww-perl scheitert an Meta Tag (3 answers)
Opened by BratHering at 2013-02-10 21:05

GwenDragon
 2013-02-11 09:41
#165706 #165706
User since
2005-01-17
14748 Artikel
Admin1
[Homepage]
user image
Entweder die Seite hat vergessen den XML-Namespace für das Attribut twitter: anzugeben.
Wie zu sehen ist:
Code (xml): (dl )
1
2
<html xmlns="http://www.w3.org/1999/xhtml"  itemscope itemtype="http://schema.org/Article"
prefix="og: http://ogp.me/ns# fb: http://ogp.me/ns/fb# video: http://ogp.me/ns/video#">

Da fehlt wohl: xmlns:twitter="http://api.twitter.com/"

Oder HTTP::HeadParser hat einen Bug bei modernen HTML.
http://www.w3.org/TR/html5/document-metadata.html#...
Denn "twitter:..." als Attribut name ist nach WHATWG ist registriert.

//EDIT: ich habe gerade per Mail freundlich Arte.tv darauf hingewiesen, dass sie ihr XHTML bitte um den Namespace für das twitter-Prefix erweitern sollen.

//EDIT2:
Aber HTTP::HeadParser kann allgemein nicht mit Namespace-Prefixen umgehen. Selbst mit dem angegebenen fb nicht.

Ich halte das Zwangs-die für einen Mist. Ein Parser, der Elemente und Attribute nicht kennt, sollte die verwerfen.
XHTML transitional ist nämlich locker und nicht strikt zu parsen.

//EDIT3: Der Bug für HTML::HeadParser ist schon gemeldet worden: https://rt.cpan.org/Public/Bug/Display.html?id=805...
Last edited: 2013-02-11 10:44:31 +0100 (CET)

View full thread LWP libwww-perl scheitert an Meta Tag