unicode in perl: unicode in perl (Allgemeines zu Perl)

[thread]5838[/thread]

unicode in perl: unicode in perl

Tags: encoding Ähnliche Threads

Leser: 3

Gast Gast

2003-10-21 08:16

hallo perl-freaks!

verwendet jemand schon unicode?

ich habe ein txt datei mit englischen a b c ,deutschen umlauten und russischen buchstaben erstellt
http://www.linuxbox.co.za/~linder/unicode.jpg
dann habe ich das als unicode.txt in utf8-format gespeichert.
und mit diesem script möchte ich den text einlesen,bearbeiten und dann ausgeben (in console und in file).

Code: (dl )

#!/usr/bin/perl -w
use strict;
use utf8;
my $text;
open(FILE,"<unicode8.txt");
open(OUTPUT,">text.txt");
binmode FILE,":utf8";
binmode OUTPUT,":utf8";
binmode STDOUT,":utf8";
while(<FILE>){print OUTPUT $_; $text .=$_}
close FILE;
close OUTPUT;

es klappt bei mir nicht das auszugeben und in regexp zu verwenden

zweites bild - ein abschnitt aus einer doc datei (microsoft word vers 8)
http://www.linuxbox.co.za/~linder/word.jpg
das ist auch unicode. ich muss zuerst alle 0x00 aus der code entfernen und weiter zu arbeiten.
oder weisst jemand wie man damit besser klarkommt?
und das letztes bild:
http://www.linuxbox.co.za/~linder/russisch.jpg
das ist der russische text in word datei.
was kann ich damit machen? umwandeln? parsen?

wenn jemand bescheid weisst oder wo zum thema nachlesen kann (perldoc utf8,unicode usw hab ich schon gelesen) - postet bitte antwort.

vielen dank

Pavel

Editiert von Crian: Code-Tags hinzugefügt\n\n

kabel

2003-10-21 14:04

User since
2003-08-04
704 Artikel
BenutzerIn
[default_avatar]

die monks wissen mehr:
http://www.perlmonks.org/index.pl?node=unicode&go_button=Search
vielleicht findest du beim stöbern die antwort auf deine frage.

HTH

-- stefan

Geewiz

2003-10-22 01:53