Thread Html-Entities in numerischen Unicode wandeln
(7 answers)
Opened by Andy at 2014-05-07 16:15 Guest Andyncode_entities_numeric aus HTML::Entities ist nicht das richtige? geht so: Code (perl): (dl
)
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 use HTML::Entities qw(encode_entities_numeric decode_entities); # Ärger ist das ärgern über das große ß! my $html = 'Ärger ist, das ärgern über das große ß!'; my $echter_text = decode_entities($html); my $numerisch_kodiert = encode_entities_numeric($echter_text); print <<TXT; $html -> $echter_text -> $numerisch_kodiert TXT ergibt: Ärger ist, das ärgern über das große ß! -> Ärger ist, das Ärgern über das große ß! -> Ärger ist, das ärgern über das große ß! //EDIT: Ach so, du willst die dezimalen Entitäten haben. Dann passt das weniger. Ich präfereriere die Sedezimalen (=Hex...) weil sie manchmal kürzer sind. Kann auch heute noch Speicher und Zeit sparen. Und die Zuordnung zu Zeichengruppen bei Unicode ist bei Sedezimal einfacher. Bei א (Hebräischer Buchstabe Aleph) weiß ich bei א wo ich wenn mal nötig, nach den Unicodeblock suchen muss in der Zeichentabelle. Bei א ist keine Unicodegruppe mehr schnell zu erkennen. QuoteWas hast du probiert? Editiert von GwenDragon: Hinweis auf Unicodeblöcke bei Hex Last edited: 2014-05-07 17:09:17 +0200 (CEST) |