Thread HTML::Parser und substr() (46 answers)
Opened by GwenDragon at 2023-05-09 13:09

rosti
 2023-05-09 17:51
#194832 #194832
User since
2011-03-19
3278 Artikel
BenutzerIn
[Homepage]
user image
Das liegt daran daß Du den Text als Rohdaten (Binary) bekommst. Die Lösung ist Encode.pm und damit musst Du für Deinen Text die Kodierung (utf-8) einschalten. Dann klappt es auch mit substr(), das arbeitet dann zeichenorientiert. MFG

Code (perl): (dl )
1
2
3
4
5
6
7
8
9
10
use strict;
use warnings;
use Encode;

my $binary = 'äöü'; # Rohdaten
# Kodierung einschalten
my $chars = Encode::decode("utf-8", $binary);
my $substr = substr($chars, 0, 2);
use bytes; # für print die Kodierung wieder ausschalten
print $substr; # äö


Siehe auch http://rolfrost.de/widechar.html

.
Last edited: 2023-05-09 17:53:22 +0200 (CEST)

View full thread HTML::Parser und substr()