hallo perl-freaks!
verwendet jemand schon unicode?
ich habe ein txt datei mit englischen a b c ,deutschen umlauten und russischen buchstaben erstellt
http://www.linuxbox.co.za/~linder/unicode.jpg
dann habe ich das als unicode.txt in utf8-format gespeichert.
und mit diesem script möchte ich den text einlesen,bearbeiten und dann ausgeben (in console und in file).
#!/usr/bin/perl -w
use strict;
use utf8;
my $text;
open(FILE,"<unicode8.txt");
open(OUTPUT,">text.txt");
binmode FILE,":utf8";
binmode OUTPUT,":utf8";
binmode STDOUT,":utf8";
while(<FILE>){print OUTPUT $_; $text .=$_}
close FILE;
close OUTPUT;
es klappt bei mir nicht das auszugeben und in regexp zu verwenden
zweites bild - ein abschnitt aus einer doc datei (microsoft word vers 8)
http://www.linuxbox.co.za/~linder/word.jpg
das ist auch unicode. ich muss zuerst alle 0x00 aus der code entfernen und weiter zu arbeiten.
oder weisst jemand wie man damit besser klarkommt?
und das letztes bild:
http://www.linuxbox.co.za/~linder/russisch.jpg
das ist der russische text in word datei.
was kann ich damit machen? umwandeln? parsen?
wenn jemand bescheid weisst oder wo zum thema nachlesen kann (perldoc utf8,unicode usw hab ich schon gelesen) - postet bitte antwort.
vielen dank
Pavel
Editiert von Crian: Code-Tags hinzugefügt\n\n
<!--EDIT|Crian|1066722260-->