Thread XML::LibXML + HTML::TreeBuilder sollen Parsen abbrechen bei defektem HTML
(19 answers)
Opened by bikus at 2010-05-04 16:21
Unter relaxed verstand ich allgemein die Fähigkeit, den Parser so einzustellen, dass er auch kaputten Code nimmt.
Das war nicht auf irgendein Produkt gemünzt. Ich würde den HTML-Parser zum Parsen von HTML nehmen. Der Autor hat ja geschrieben, dass der Parser so gemacht ist, dass er mit HTML klar kommt, das Draußen existiert, also wohl auch kaputtes, MS-eigenes und sostwie seltsames HTML. |