Thread html nach xhtml konvertieren: xhtml mit unicode-zeichensatz ?
(6 answers)
Opened by abe-want-to-know at 2005-10-13 20:07
ich habe einfach ein paar parameter ausprobiert ...
mit $encoding = find_encoding("utf-8"); erhalte ich folgende meldung beim schreiben der datei: Wide character in print at ...blabla (also kennt er da irgendwelche zeichen nicht) mit $encoding = find_encoding("unicode"); wird zumindest das temporäre html-file erfolgreich erstellt. mit $encoding = find_encoding("ucs4"); kommt dann dieser fehler: UTF-32:Unrecognised BOM 3c68746d at ... blabla (also kann so nicht gefunden werden ...) Und: was kann windows1251 was utf8 nicht kann? ::: windows1251 ist der kyrilische zeichensatz (sieht russisch aus) soweit klappt ja alles wunderbar... erst beim übergeben des html-files an tidy (zwecks xhtml-konvertierung) werden die (win1251) zeichen falsch übersetzt |