Thread HTML::PrettyPrinter zerschiesst HTML-Entities
(3 answers)
Opened by Britzel at 2014-07-04 00:22
Meine Erfahrung:
Der Fehler hat nichts mit HTML::PrettyPrinter selbst zu tun, sondern passiert spätestens beim Einlesen des HTML-Codes in den HTML::Element Tree. Das kannst du überprüfen, indem Du den HTML::Element-Tree direkt (ohne HTML::PrettyPrinter) dumpst - die Methode ist AFAIK as_HTML(). Oder Du schaust Dir die Textstrings im HTML-Tree direkt an. Da ist das MDASH sicher schon zu — escaped, so dass beim Export nach HTML nur '&" als Sonderzeichen erkannt - und durch die Entity & ersetzt wird. Für die Ausgabe, die Du haben willst, müsste in den Text-Strings das Unicode-Zeichen für MDASH stehen. |