Thread [HTML::Restrict] Probleme mit Attributen und deren Werten mit Nicht-ASCII-Zeichen nach Filtern
(7 answers)
Opened by GwenDragon at 2025-12-30 14:04
Verstehe das Prinzip: In Dateien, stdout, stdin, http, html, also außerhalb vom Programm hast Du Oktetten (Bytes). Diese Bytes kennen keine Kodierung.
Einem Programm jedoch, was mit diesen Bytes arbeitet, muß mitgeteilt werden, was diese Bytes kodieren. D.h., da ist für diese Bytes die Kodierung einzuschalten. Z.B. mit Encode::decode_utf8(BytesAusDatei); Und wenn das wieder nach draußen geht, ist die Kodierung auszuschalten, z.B. mit encode_utf8(KodierteZeichenKette); Beispiel: Code (perl): (dl
)
1 2 3 4 5 6 7 8 9 10 11 use strict; use warnings; use HTML::Entities; use Encode; my $html = qq(<img alt="Weißer Nebel" />); # Übergebe Bytes # print encode_entities($html), "\n"; # Müll # Schalte UTF-8-Kodierung ein print encode_entities(decode_utf8($html)); # Korrekt Last edited: 2025-12-31 10:53:29 +0100 (CET) |