Thread html nach xhtml konvertieren: xhtml mit unicode-zeichensatz ? (6 answers)
Opened by abe-want-to-know at 2005-10-13 20:07

ptk
 2005-10-14 04:42
#58760 #58760
User since
2003-11-28
3645 Artikel
ModeratorIn
[default_avatar]
[quote=abe-want-to-know,13.10.2005, 18:07]ich verwende das kommando-zeilen-tool tidy,
um webseiten(z.B. html) ins xhtml-format zu konvertieren

bei manchen webseiten macht tidy mucken - es werden anscheinend nur einige wenige zeichensätze unterstützt:

-raw (direkt ?) -ascii -latin1 -iso2022 -utf8 -mac -win1252

habe es so gestartet:

Code: (dl )
system('tidy -indent -asxhtml -quiet -utf8 quelle.html > target.xml');

oder
Code: (dl )
system('tidy -indent -asxml -quiet -utf8 quelle.html > target.xml');



ich bräuchte aber:
'windows1251' oder: 'unicode'

gibts da irgendeine möglichkeit
oder kann man villeicht auf andere weise eine html-seite ins xhtml-format konvertieren ???[/quote]
Was soll denn "unicode" für ein Encoding sein? So etwas gibt es nicht. Nur utf8, ucs4 etc.

Und: was kann windows1251 was utf8 nicht kann?\n\n

<!--EDIT|ptk|1129250582-->

View full thread html nach xhtml konvertieren: xhtml mit unicode-zeichensatz ?