Thread XML::LibXML und encoding problem (1 answers)
Opened by Ekki at 2015-02-22 20:11

Ekki
 2015-02-24 21:16
#179879 #179879
User since
2015-01-12
3 Artikel
BenutzerIn
[default_avatar]
Um hier mal die Ingrid zu machen:
Ich habe das Problem nicht prinzipiell lösen können, nur umgehen.

Ich habe festgestellt, dass das geschilderte Problem nur bei Texten in Attributen (alt, title usw.) auftritt. Offensichtlich nutzt die das XML Modul die problematischen Funktionen nur beim Anlegen von Nodes mit solchen Attributen. Und abgestellt habe ich da problem, das ich den Zeichensatz in Textattributen eben auf alles bis 0x7f begrenzt habe. Nicht schön, aber es geht zunächst mal.

Daneben habe ich dann auch mal das neue Tidy ausprobiert, das mit HTML5 umgehen kann. Der Output ist ok, aber lässt sich wie beim Vorgänger nicht fein genug kontrollieren. Das macht das Tool nicht unbrauchbar, aber es gefällt auch nicht...

Gruß,
Ekki

View full thread XML::LibXML und encoding problem