Thread html nach xhtml konvertieren: xhtml mit unicode-zeichensatz ? (6 answers)
Opened by abe-want-to-know at 2005-10-13 20:07

abe-want-to-know
 2005-10-13 20:07
#58756 #58756
User since
2005-10-13
3 Artikel
BenutzerIn
[default_avatar]
ich verwende das kommando-zeilen-tool tidy,
um webseiten(z.B. html) ins xhtml-format zu konvertieren

bei manchen webseiten macht tidy mucken - es werden anscheinend nur einige wenige zeichensätze unterstützt:

-raw (direkt ?) -ascii -latin1 -iso2022 -utf8 -mac -win1252

habe es so gestartet:

Code: (dl )
system('tidy -indent -asxhtml -quiet -utf8 quelle.html > target.xml');

oder
Code: (dl )
system('tidy -indent -asxml -quiet -utf8 quelle.html > target.xml');



ich bräuchte aber:
'windows1251' oder: 'unicode'

gibts da irgendeine möglichkeit
oder kann man villeicht auf andere weise eine html-seite ins xhtml-format konvertieren ???

View full thread html nach xhtml konvertieren: xhtml mit unicode-zeichensatz ?