Thread Durchlaufzeit von 2 verschachtelten foreach-schleifen optimieren
(5 answers)
Opened by kimmy at 2013-12-17 11:05
Du musst auch aufpassen mit deinem Split nach Leerzeichen. Das kann genausgut ein Satzzeichen sein.
Falls deine gesamte Datei in den Speicher passt vielleicht sowas, das sollte schneller gehen. Code (perl): (dl
)
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 my @suffixe = qw(en er); my $suff_str = '(?:'.join('|', @suffixe).')'; my $txt = join('', <DATA>); while ($txt =~ m/(\w+($suff_str))\b/g) { print "$1 $2\n"; } __DATA__ Hallo Zusammen, ich habe 2 relativ langen TXT-Dateien. Eine Text-Datei ist ein ganz normaler deutscher Artikel (ca. 40000 Zeilen). Die andere Datei ist eine Liste von Suffixe (Nomen, ADJ, etc.). Was ich haben möchte, ist der Inputdatei einzulesen und mit der Liste zu vergleichen. Mein Code sieht wie folgt aus: edit: Die Datei als utf8 abspeichern und "use utf8;" oben einfügen, sonst gibt's wahrscheinlich Probleme mit Umlauten. edit2: Falls das 1:1 das Echtskript ist kann auch die Ausgabe (Konsole) der limitierende Faktor sein. Last edited: 2013-12-17 11:33:38 +0100 (CET) 1 + 1 = 10
|