Thread [HTML::Restrict] Probleme mit Attributen und deren Werten mit Nicht-ASCII-Zeichen nach Filtern (7 answers)
Opened by GwenDragon at 2025-12-30 14:04

rosti
 2025-12-31 10:31
#196785 #196785
User since
2011-03-19
3505 Artikel
BenutzerIn
[Homepage]
user image
Verstehe das Prinzip: In Dateien, stdout, stdin, http, html, also außerhalb vom Programm hast Du Oktetten (Bytes). Diese Bytes kennen keine Kodierung.
Einem Programm jedoch, was mit diesen Bytes arbeitet, muß mitgeteilt werden, was diese Bytes kodieren. D.h., da ist für diese Bytes die Kodierung einzuschalten. Z.B. mit Encode::decode_utf8(BytesAusDatei);

Und wenn das wieder nach draußen geht, ist die Kodierung auszuschalten, z.B. mit encode_utf8(KodierteZeichenKette);

Beispiel:

Code (perl): (dl )
1
2
3
4
5
6
7
8
9
10
11
use strict;
use warnings;
use HTML::Entities;
use Encode;

my $html = qq(<img alt="Weißer Nebel" />);
# Übergebe Bytes
# print encode_entities($html), "\n"; # Müll

# Schalte UTF-8-Kodierung ein
print encode_entities(decode_utf8($html)); # Korrekt

Last edited: 2025-12-31 10:53:29 +0100 (CET)

View full thread [HTML::Restrict] Probleme mit Attributen und deren Werten mit Nicht-ASCII-Zeichen nach Filtern