Thread whitespace-match funktioniert nicht
(7 answers)
Opened by Student87 at 2013-02-21 14:36
Ich hab mir ne Datei aus meinem Langenscheidt Vokabeltrainer exportiert und über file -i rausgefunden, dass sie UTF-16le formatiert ist.
Jetzt hab ich sie mit '<:encoding(UTF-16le)' eingelesen und mit '>:encoding(UTF-8)' wieder ausgeben in die Datei "VokList". In der Datei (s. Anhang) sieht man, dass der Langenscheidt Vokabeltrainer Nomen/Verb/Adj/Adv - Angaben mit exportiert hat. Die will ich wegfiltern. Hiermit Code (perl): (dl
)
/[v n adj adv]\t/
matche ich zwar erfolgreich diese Angaben, ABER sobald ich den Ausdruck zu Code (perl): (dl
)
/\s[v n adj adv]\t/
ändere, matche ich nichts mehr. Wieso, was ist das für ein Character in der Datei vor der Wortart-Angabe, wenn es kein whitespace ist? Dass es kein Tab ist, sieht man, habs auch trotzdem schon getestet ... Anhänge |