Thread html nach xhtml konvertieren: xhtml mit unicode-zeichensatz ? (6 answers)
Opened by abe-want-to-know at 2005-10-13 20:07

abe-want-to-know
 2005-10-14 10:35
#58761 #58761
User since
2005-10-13
3 Artikel
BenutzerIn
[default_avatar]
ich habe einfach ein paar parameter ausprobiert ...

mit
$encoding = find_encoding("utf-8");
erhalte ich folgende meldung beim schreiben der datei:
Wide character in print at ...blabla
(also kennt er da irgendwelche zeichen nicht)

mit
$encoding = find_encoding("unicode");
wird zumindest das temporäre html-file erfolgreich erstellt.

mit
$encoding = find_encoding("ucs4");
kommt dann dieser fehler:
UTF-32:Unrecognised BOM 3c68746d at ... blabla
(also kann so nicht gefunden werden ...)


Und: was kann windows1251 was utf8 nicht kann? :::
windows1251 ist der kyrilische zeichensatz (sieht russisch aus)


soweit klappt ja alles wunderbar...
erst beim übergeben des html-files an tidy (zwecks xhtml-konvertierung) werden die (win1251) zeichen falsch übersetzt

View full thread html nach xhtml konvertieren: xhtml mit unicode-zeichensatz ?