Thread Html-Entities in numerischen Unicode wandeln (7 answers)
Opened by Andy at 2014-05-07 16:15

clms
 2014-05-08 14:07
#175420 #175420
User since
2010-08-29
373 Artikel
BenutzerIn
[default_avatar]
Guest Andy
Mein Problem ist, dass Texte im Text Sachen gemischt vorkommen können. Also etwas in der Art "Wären sie bereit dafür? Warum älter aussehen als Sie sich fühlen."

Daraus wird dann "Wären sie bereit dafür? Warum älter aussehen als Sie sich fühlen."

Das hat doch nichts damit zutun, ob Du die Entities in dezimaler, hexadezimaler oder String-Codierung dargestellt werden.

Dein Problem ist, dass in Deinem Input manche Umlaute als Entities codiert sind, andere nativ enthalten sind. Wenn Du jetzt einen Filter drüberlaufen lässt, der Umlaute und andere "kritische" Zeichen in Entities codieren soll, hält dieser die schon vorhandenen Entities für normale Text-Strings und escaped das Ampersand.

Lösung: Erstmal alle Enteties in normale Unicode-Zeichen wandeln. Bereits vorhandene native Umlaute werden dadurch nicht verändert, aber "ä" wird in "ä" umgewandelt. Anschließend hast Du die Umlaute einheitlich in Unicode und kannst sie wieder zu "ä" oder "ä " escapen.

View full thread Html-Entities in numerischen Unicode wandeln