Thread Sonderzeichen ersetzen (4 answers)
Opened by Dareios at 2005-02-27 18:22

ptk
 2005-02-28 13:04
#4523 #4523
User since
2003-11-28
3645 Artikel
ModeratorIn
[default_avatar]
[quote=Dubu,27.02.2005, 23:18]Ist das so eine spezielle Schriftart, dass sie mit ihrer eigenen Kodierung herkommt, oder kommen die Zeichen nicht doch aus ISO-8859-1 o.ae.? ¦ und ¨ findet man dort jedenfalls.
Und ISO-8859-1 kann eigentlich jeder aktuelle Rechner; sogar Windows benutzt ja eine fast diesem Standard entsprechende Kodierung (cp1252, IIRC).

Zumindest in Unicode sollte sich aber jedes Zeichen gebraeuchlicher menschlicher Sprachen darstellen lassen, und neuere Betriebssysteme haben auch Unicode-faehige Fonts. Das kann man allerdings noch nicht bei jedem Anwender erwarten.[/quote]
Nein, S caron ist *nicht* in ISO-8859-1 enthalten, sondern nur in der Microsoft-Erweiterung (cp1252 oder cp1250, nicht sicher). Bei ISO-8859-1 sind zwischen 128 und 160 keine Zeichen definiert.

Zum Problem: es gibt auf CPAN das Modul Text::Unidecode, mit dem man von Unicode nach ASCII umwandeln kann, notfalls mit einer Ersatzdarstellung. Interessant koennte auch diese Erweiterung fuer Text::Unidecode sein: https://rt.cpan.org/NoAuth/Bug.html?id=8017

View full thread Sonderzeichen ersetzen