Dateien durchsuchen (gelöst) (Allgemeines zu Perl) - Perl-Community.de

Start · Board · Anwendungen/Programme/Skripte in Perl · Allgemeines zu Perl

2025-04-13 09:21:35
Europe/Berlin
Einloggen (Registrieren)
- Einstellungen
- Statistics
Jemand zu Hause?
0 Benutzer online
3 Gäste

[thread]18103[/thread]

submit to reddit

Dateien durchsuchen [gelöst]

[gelöst]

Tags: perl5 Ähnliche Threads

Leser: 22

Articles: hide open all | hide show old branches

+30 replies
Gast Paul

2013-01-30 21:28

Hallo zusammen,

habe ein kleines Performance Problem bei meinem Perl Skript.

Ich habe als Basis zwei Dateien. Datei A trägt Zeileninformationen, die durch Zeileninformationen aus Datei B ersetzt werden müssen. Beide Textdateien verfrachte ich zunächst in Vektoren. Über eine foreach-Schleife durchlaufe ich nun zeilenweise Vektor A, um in einer zweiten foreach-Schleife Vektor B zeilenweise zu durchlaufen und einen Vergleich beider Zieleninhalte durchzuführen. Wird eine übereinstimmung gefunden wird der Wert aus der aktuellen Zeile der zweiten foreach-Schleife an die Stelle des aktuellen Zeilenwertes der ersten foreach-Schleife geschrieben. Anschließend zähle ich die äußere Schleife um eins hoch. Da meine Vektoren jedoch auch bis zu 1000000 Einträge enthält ist das ganze super langsam.

Habt Ihr einen guten Tipp für mich, wie ich anders vorgehen könnte? Bin mit meinem Anfänger-Latein am Ende :-(

LG,
Paul
Last edited: 2013-01-30 21:48:28 +0100 (CET)
- +25 replies
- betterworld
  
  2013-01-30 22:14
  
  User since
  2003-08-21
  2614 Artikel
  ModeratorIn
  
  So ganz wird es nicht klar, was Du da genau vorhast. Vermutlich hilft es, wenn Du mal ein paar Beispielzeilen aus Deinen Dateien herzeigst.
  
  Mit Vektoren sind wohl Arrays gemeint. Wenn ich das jetzt richtig verstehe, solltest Du die Datei B am besten irgendwie zu einem Hash verarbeiten statt zu einem Array, und dann sollte das etwas schneller durchlaufen.
  Lieblingsmodule: IPC::System::Simple, Path::Class
  - +24 replies
  - Gast Paul
    
    2013-01-30 22:20
    
    Korrekt, ich meine mit Vektoren Arrays.
    
    Prinzipiell ist der Dateiaufbau ganz einfach:
    
    Inhalt Datei A:
    11
    22
    33
    
    Inhalt Datei B:
    44
    22
    55
    
    In diesem Fall gehe ich mit der ersten Schleife zum ersten Eintrag aus Datei A und prüfe nun mit einer zweiten schleife über jede zeile von Datei B ob Eintrag aus Datei A eq Eintrag aus Datei B. Ist dies der Fall wird der überinstimmende Wert in eine Datei C geschrieben. Im Fall der beiden Beispieldateien ist der zweite Eintrag identisch und würde in datei C geschrieben.
    
    Da ich den Code nicht vorliegen habe kann ich leider gerade keine Codezeilen schicken.
    Last edited: 2013-01-30 23:12:09 +0100 (CET)
    - +23 replies
    - Muffi
      
      2013-01-30 23:24
      
      User since
      2012-07-18
      1465 Artikel
      BenutzerIn
      
      a) Können Einträge in einer Datei doppelt vorkommen?
      b) Ist die Reihenfolge nachher wichtig?
      
      [EDIT] Falls beides nein, evtl. sowas
      
      Code (perl): (dl )
      
      1 2 3 4 5 6
      
      my @zeilen_a = <$file_a>; my @zeilen_b = <$file_b>; my %zeilen_count; $zeilen_count{$_}++ for (@zeilen_a, @zeilen_b); my @zeilen_c = grep { $zeilen_count{$_} > 1 } (keys %zeilen_count);
      
      [EDIT] Falls das zu viel Speicher braucht könnt man noch ein bisserl sparen.
      Last edited: 2013-01-30 23:54:16 +0100 (CET)
      1 + 1 = 10
      - +22 replies
      - Gast Paul
        
        2013-01-31 07:31
        
        Problem ist, dass die nicht übereinstimmenden Einträge aus Datei A erhalten bleiben müssen und zwar an genau derselben Position. Es sollen lediglich die übereinstimmenden werte getauscht werden.
        Last edited: 2013-01-31 08:36:08 +0100 (CET)
        
        +21 replies
        
        Muffi
        
        2013-01-31 08:41
        
        User since
        2012-07-18
        1465 Artikel
        BenutzerIn
        
        Dann hab ichs nicht kapiert.
        
        Wenn Werte übereinstimmen sind sie ja (zumindest für mich) gleich. Und durch was sollen die beiden gleichen Werte dann getauscht werden?
        
        [EDIT] Evtl. könntest du auch mal ein paar Begriffe näher erklären, wie z.B. "Zeileninformationen" "Zieleninhalte"
        und
        "Ist dies der Fall wird der überinstimmende Wert in eine Datei C geschrieben" und wenn nicht?
        Last edited: 2013-01-31 08:46:52 +0100 (CET)
        1 + 1 = 10
        
        +20 replies
        
        Gast Paul
        
        2013-01-31 15:44
        
        Hab Euch mal einen Code-Ausschnitt angefügt.
        Die grep Funktion hat schon einiges beschleunigt, allerdings ist das Programm noch immer sehr langsam.
        Gibts Ideen zur Verbesserung der Performance?
        
        Code (perl): (dl )
        
        1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55
        
        open (C,">${OUTPATH}/${C}"); open (A,"<${OUTPATH}/${A}"); @file=<A>; close (A) or die "Cannot write $A file\n"; my $ll; my $zeile; $ll=1; foreach $zeile (@lfile) { chomp ($file[$ll]); $VALUE=substr($file[$ll],0,20); chomp ($VALUE); $VALUE = $VALUE * 1; open (B,"<${OUTPATH}/${B}") or die " Cannot open file $B for reading\n"; @file=<B>; close (B) or die "Cannot write $B file\n"; my $LINE; my @grep; @grep = (grep {$_ =~ /${VALUE}/} @file); $LINE = @grep; if ( $LINE eq 1 ) { chomp ($grep[0]); print C "$grep[0]"; } else { print C "$file[$ll]"; }; $ll++; };
        
        modedit Editiert von pq: code-tags hinzugefügt
        Last edited: 2013-01-31 15:53:21 +0100 (CET)
        
        +19 replies
        
        Muffi
        
        2013-01-31 16:04
        
        User since
        2012-07-18
        1465 Artikel
        BenutzerIn
        
        Ein Wunder, dass der Code überhaupt irgendwas macht.
        
        Also: Du hast Datei A. Für jede Zeile in A guckst du, ob es eine Zeile in B gibt, die die A-Zeile ersetzen muss.
        Das Resultat, also die original A-Zeilen + die ersetzten A-Zeilen kommen nach C.
        Und wie ist genau die Regel, wann A durch B ersetzt wird?
        1 + 1 = 10
        
        +18 replies
        
        Gast Paul
        
        2013-01-31 16:28
        
        Sorry, hab beim Säubern der Datei einen kleinen Fehler eingebaut.
        
        Code: (dl )
        
        1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58
        
        open (C,">${OUTPATH}/${C}"); open (A,"<${OUTPATH}/${A}"); @file_a=<A>; close (A) or die "Cannot write $A file\n"; my $ll; my $zeile; $ll=1; foreach $zeile (@lfile) { chomp ($file[$ll]); $VALUE=substr($file[$ll],0,20); chomp ($VALUE); $VALUE = $VALUE * 1; open (B,"<${OUTPATH}/${B}") or die " Cannot open file $B for reading\n"; @file_b=<B>; close (B) or die "Cannot write $B file\n"; my $LINE; my @grep; @grep = (grep {$_ =~ /${VALUE}/} @file); $LINE = @grep; if ( $LINE eq 1 ) { chomp ($grep[0]); print C "$grep[0]"; } else { print C "$file[$ll]"; }; $ll++; }; close (C) or die "Cannot write $C file\n";
        
        Last edited: 2013-01-31 16:53:53 +0100 (CET)
        
        Muffi
        
        2013-01-31 16:56
        
        User since
        2012-07-18
        1465 Artikel
        BenutzerIn
        
        Könntest dus trotzdem nochmal in Worte fassen, wie die Regel ist?
        Dann muss man auch nicht raten, für was wohl ein
        
        Code (perl): (dl )
        
        $VALUE = $VALUE * 1;
        
        gut ist
        1 + 1 = 10
        
        +16 replies
        
        Linuxer
        
        2013-01-31 17:00
        
        User since
        2006-01-27
        3891 Artikel
        HausmeisterIn
        
        Das sieht ja sehr wirr aus... Bitte nicht böse sein, das folgende ist nicht bös gemeint:
        
        Du öffnest Datei A zum Lesen und meldest im Fehlerfall beim Schließen des entsprechenden Handles "Cannot write to"?
        
        Wie kommt der Inhalt nach @lfile? Du hast zuvor doch nur Datei A nach @file_A gelesen?
        
        Auch B öffnest Du zum Lesen und meldest im Fehlerfall bei Schließen ebenso "Cannot write to"?
        
        Durch welchen Dateiinhalt "grepst" Du in Zeile 36? Wo wird @file gefüllt? Meintest Du @file_b?
        
        Fazit: Lass einmal ab vom Code, atme durch und beschreibe das ganze nochmal in Textform, wie von Muffi vorgeschlagen.
        
        Wenn ich meinem Kaffeesatz trauen kann, rate ich mal:
        Es könnte vielleicht deshalb insgesamt so lange dauern, weil Du für jede Zeile in A die gesamte Datei B durchsuchen lässt (Anhand des Codes geraten).
        Last edited: 2013-01-31 17:08:58 +0100 (CET)
        meine Beiträge: I.d.R. alle Angaben ohne Gewähr und auf Linux abgestimmt!
        Die Sprache heisst Perl, nicht PERL. - Bitte Crossposts als solche kenntlich machen!
        
        +15 replies
        
        Gast Paul
        
        2013-01-31 17:27
        
        Ok, nochmals in Textform.
        
        Ich musste den Code säubern und dabei sind doch einige Tippfehler mehr reingekommen. Bitte lasst euch von den Fehlermeldungen, welche ich printe nicht verwirren, das sind derzeit noch dummys.
        
        Öffne C zum späteren printen
        
        Öffne A und in einen Array @file_a schreiben
        
        Initialisieren der Schleife, um zeilenweise @file_a abzuarbeiten.
        Suchwert $VALUE definieren und zur Zahl machen.
        
        Code befindet sich in Zeile eins: Öffne B und in einen Array @file_b schreiben.
        
        In Array @file_b nach $VALUE suchen.
        Wird dieser gefunden wird er in C geschrieben.
        Wird dieser nicht gefunden bleibt Zeile Eins erhalten und wird in C geschrieben.
        
        Schleife eins hochzählen und nächste Zeile aus @file_a bearbeiten.
        
        Ich hoffe nun ist es einigermaßen verständlich?
        Last edited: 2013-01-31 17:31:38 +0100 (CET)
        
        betterworld
        
        2013-01-31 19:00
        
        User since
        2003-08-21
        2614 Artikel
        ModeratorIn
        
        Also ich verstehe das immer noch nicht so ganz... Wenn die Zeile identisch in A und B ist, was macht es denn dann überhaupt für einen Unterschied, ob die Zeile aus A oder B ausgegeben wird?
        
        Also mit Deinem Beispiel oben:
        
        Inhalt Datei A:
        11
        22
        33
        
        Inhalt Datei B:
        44
        22
        55
        
        Wie wäre in diesem Beispiel dann der Inhalt von C? Es wäre doch dasselbe wie A... Also was hat das Vertauschen für einen Sinn?
        
        Die Art und Weise, wie Du da mit substr und grep arbeitest, könnte meine Frage beantworten, aber zur Veranschaulichung zeig bitte mal echten Beispiel-Input und -Output, wo das wirklich einen Unterschied macht.
        Lieblingsmodule: IPC::System::Simple, Path::Class
        
        +13 replies
        
        topeg
        
        2013-01-31 19:57
        
        User since
        2006-07-10
        2611 Artikel
        BenutzerIn
        
        Soweit ich es verstanden habe:
        
        Code (perl): (dl )
        
        1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35
        
        #!/usr/bin/perl use strict; use warnings; my $OUTPATH=''; my $A=''; my $B=''; my $C=''; open(my $temp_fh, '<', "$OUTPATH/$B") or die("Can't open $B ($!)\n"); my @referenz=<$temp_fh>; close($temp_fh); open(my $out_fh, '>', "$OUTPATH/$C") or die("Can't open $C ($!)\n"); open(my $in_fh, '<', "$OUTPATH/$A") or die("Can't open $A ($!)\n"); MAINLOOP: while(my $line = <$in_fh>) { my $value=substr($line,0,20); $value+=0; for my $ref_line (@referenz) { if($ref_line =~ /$value/) { print $out_fh $ref_line; next MAINLOOP; } } print $out_fh $line; } close($in_fh); close($out_fh);
        
        Merke dir:
        - Führe eine 'teure' Aktion möglichst nur einmal aus.
        - Mach so wenig wie möglich.
        - Speichere so wenig wie möglich, aber so viel wie nötig.
        
        Nach den Prämissen:
        
        Lese den Inhalt von Datei B in das Array @referenz
        Öffne Datei C zum Schreiben
        Öffne Datei A zum Lesen
        Durchlaufe die Hauptschleife solange noch Zeilen zu lesen sind:
        Lese eine Zeile aus Datei A
        Nimm die ersten 20 Byte als Zahl
        Gehe das Array @referenz durch
        Wenn die Zahl in ein einem Eintrag gefunden wurde Schreibe diese Zeile in Datei C
        Mach den nächsten Durchlauf der Hauptschleife
        Schreibe die Zeile aus Datei A in C
        Mach den nächsten Durchlauf der Hauptschleife
        schließe alle offenen Dateien
        
        Das kann man noch beschleunigen:
        
        Code (perl): (dl )
        
        1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42
        
        #!/usr/bin/perl use strict; use warnings; my $OUTPATH=''; my $A=''; my $B=''; my $C=''; my %index; open(my $temp_fh, '<', "$OUTPATH/$B") or die("Can't open $B ($!)\n"); MAINLOOP: while(my $line=<$temp_fh>) { while($line=~/(\d+)/gc) { my $value=$1; $value+=0; next if(exists($index{$value})); $index{$value}=$line; next MAINLOOP; } } close($temp_fh); open(my $out_fh, '>', "$OUTPATH/$C") or die("Can't open $C ($!)\n"); open(my $in_fh, '<', "$OUTPATH/$A") or die("Can't open $A ($!)\n"); while(my $line = <$in_fh>) { my $value=substr($line,0,20); $value+=0; if(exists($index{$value})) { print $out_fh $index{$value}; next; } print $out_fh $line; } close($in_fh); close($out_fh);
        
        Ich erzeuge einen Index mit der Zuordnung 'Zahl' => 'Zeile' Das benutze ich dann um die heraus gelesenen Zahlen zu vergleichen. Das funktioniert aber nur wenn es Integerzahlen und keine Fließkommazahlen sind. Aber auch dafür gäbe es Lösung, dazu müsste ich aber genauer wissen, um welche Werte es sich handelt.
        Last edited: 2013-01-31 19:58:55 +0100 (CET)
        
        +12 replies
        
        Gast Paul
        
        2013-01-31 23:42
        
        Zunächst vielen Dank für die tolle Unterstützung hier.
        
        Ich werde morgen einige Eurer Tipps ausprobieren.
        Aus bestimmten Gründen kann ich keinen echten Input und Output zeigen.
        Nur soviel. Es macht durchaus Sinn Gleiches gegen Gleiches zu tauschen, wenn danach unterschiedliche Zeileninhalte folgen ;-)
        Last edited: 2013-01-31 23:52:21 +0100 (CET)
        
        +11 replies
        
        Muffi
        
        2013-02-01 08:35
        
        User since
        2012-07-18
        1465 Artikel
        BenutzerIn
        
        Man kann auch Zeilen hier reinstellen, die vielleicht nicht das Original sind, aber trotzdem Sinn machen.
        Wenn ich eine Zeile "22" sehe und im Source irgendwas mit substr 20, dann kann irgendwas nicht so ganz stimmen.
        
        Bei dir haben jetzt einen ganzen Tag lang mehrere Leute versucht rauszufinden was du überhaupt vor hast und du hältst es bis jetzt nicht für nötig dein Chaos so weit aufzubereiten, ein Beispiel zu bringen, das auch Sinn macht oder wenigstens Nachfragen komplett zu beantworten, dass ich nicht wirklich gross Lust hab da noch weiter zu helfen.
        1 + 1 = 10
        
        +10 replies
        
        Gast Paul
        
        2013-02-01 09:06
        
        Wie gesagt, ich finde Eure Hilfe hier echt klasse und im Prinzip denke ich, dass die meisten verstanden haben, worum es mir geht. Aber hier nochmal in möglichst einfachen Worten.
        
        Vergleiche zeilenweise die Werte aus Datei B mit dem ersten Eintrag aus Datei A. Bei Übereinstimmung soll die Zeile aus B (deren Position unbekannt ist) in eine neue Datei C geschrieben werden. Keine Übereinstimmung erfordert, dass die Zeile aus A erhalten bleibt und in C geschrieben wird.
        
        Die Dateien haben eine länge von ca 1000000 Zeilen.
        Last edited: 2013-02-01 09:12:45 +0100 (CET)
        
        Muffi
        
        2013-02-01 09:26
        
        User since
        2012-07-18
        1465 Artikel
        BenutzerIn
        
        Ja. Und du hast bis jetzt noch nicht erklärt, wie das Format der Zeilen ist und wie sich eine Übereinstimmung definiert.
        1 + 1 = 10
        
        +8 replies
        
        Linuxer
        
        2013-02-01 09:33
        
        User since
        2006-01-27
        3891 Artikel
        HausmeisterIn
        
        Wenn ich das jetzt richtig deute, hast Du 2 Dateien mit zeilenbasierten Informationen.
        Jede Zeile enthält eine 20stellige Information, die Du vergleichst und danach noch weitere Daten, die Du letzten Endes (mit)kopiert haben willst.
        Also quasi Kennzahl+Datensatz, schematisch sowas:
        
        Code: (dl )
        
        1 2 3 4 5 6 7 8
        
        Datei A: 001 dataset1A 002 dataset2A 003 dataset3A Datei B: 002 dataset2B 004 dataset4B
        
        Am Ende Deines Skriptes sollte C dann so aussehen:
        
        Code: (dl )
        
        1 2 3 4
        
        Datei C: 001 dataset1A 002 dataset2B 003 dataset3A
        
        Lediglich die Zeile 2 wurde ausgetauscht, weil es für die anderen Zeilen keine Übereinstimmung der Kennzahl gab.
        
        Können sich Kennzahlen in den Dateien A+B wiederholen?
        Was soll mit Zeilen passieren, die aus Datei B bereits kopiert worden sind?
        edit: Wenn es eine Übereinstimmung der Kennzahlen von A und B gibt und B hat mehrere Zeilen mit der gleichen Kennzahl (ist ja derzeit unbekannt), sollen dann alle Zeilen mit dieser Kennzahl aus B kopiert werden oder nur die erste?
        Last edited: 2013-02-01 10:05:30 +0100 (CET)
        meine Beiträge: I.d.R. alle Angaben ohne Gewähr und auf Linux abgestimmt!
        Die Sprache heisst Perl, nicht PERL. - Bitte Crossposts als solche kenntlich machen!
        
        +7 replies
        
        Gast Paul
        
        2013-02-01 10:06
        
        Hallo Linuxer,
        
        Du hast das Problem korrekt erkannt.
        
        Kennzahlen können sich nicht wiederholen und tauchen nur einmal auf.
        Das von Dir gepostete Datenset C soll genau so ausschauen.
        
        Hast Du da eine Hilfestellung für mich?
        Last edited: 2013-02-01 10:11:52 +0100 (CET)
        
        Muffi
        
        2013-02-01 10:14
        
        User since
        2012-07-18
        1465 Artikel
        BenutzerIn
        
        Code (perl): (dl )
        
        1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16
        
        my %b_lookup; for (<$file_b>) { my ($num, $data) = split(/ /, $_, 2); $b_lookup{$num} = "$num $data"; } for (<$file_a>) { my ($num, $data) = split(/ /, $_, 2); if (exists $b_lookup{$num}) { print $file_c $b_lookup{$num}."\n"; } else { print $file_c "$_\n"; } }
        
        Die Filehandles müssen noch geöffnet, geschlossen werden.
        
        Prognose: Läuft unter 5 sek.
        1 + 1 = 10
        
        +5 replies
        
        Linuxer
        
        2013-02-01 10:28
        
        User since
        2006-01-27
        3891 Artikel
        HausmeisterIn
        
        Was ist mit topegs Lösungsvorschlägen? Funktionieren die nicht?
        
        Mein erster Ansatz war:
        
        Code (perl): (dl )
        
        1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29
        
        #! /usr/bin/perl use strict; use warnings; use List::Util qw( first ); my $fileA = "A.txt"; my $fileB = "B.txt"; my $outfile = "C.txt"; my $criteria_size = 20; # be sure you have enough memory for this! my @reference = do { open my $fh, '<', $fileB; <$fh> }; open my $fhout, '>', $outfile or die "open($outfile,w) failed: $!\n"; open my $fhin, '<', $fileA or die "open($fileA,ro) failed: $!\n"; while ( my $lineA = <$fhin> ) { my $critA = substr( $lineA, 0, $criteria_size ); # return first line with matching reference number and leave it in @reference my $lineB = first { substr( $_, 0, $criteria_size ) == $critA } @reference; print $fhout ( $lineB ? $lineB : $lineA ); } close $fhin; close $fhout or die "close($outfile) failed: $!\n";
        
        Mein zweiter Ansatz benutzt einen Hash, wie von topeg und Muffi schon eingesetzt:
        
        Code (perl): (dl )
        
        1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35
        
        #! /usr/bin/perl use strict; use warnings; use List::Util qw( first ); my $fileA = "A.txt"; my $fileB = "B.txt"; my $outfile = "C.txt"; my $criteria_siue = 20; # be sure you have enough memory for this! my %reference; open my $fh, '<', $fileB or die "open($fileB,ro) failed: $!\n"; # expensive in memory usage (as it uses temporary lists in memory) # %reference = map { substr( $_, 0, $criteria_size ) => $_ } <$fh>; while ( my $line = <$fh> ) { $refernce{ substr( $line, 0, $criteria_size ) } = $line; } close $fh; open my $fhout, '>', $outfile or die "open($outfile,w) failed: $!\n"; open my $fhin, '<', $fileA or die "open($fileA,ro) failed: $!\n"; while ( my $lineA = <$fhin> ) { my $critA = substr( $lineA, 0, $criteria_size); print $fhout ( exists $reference{$critA} ? $reference{$critA} : $lineA ); } close $fhin; close $fhout or die "close($outfile) failed: $!\n";
        
        Beide setzen voraus, dass ausreichend Speicher vorhanden ist, um Datei B vollständig in den Speicher zu laden.
        
        Mein Test mit einer Datei A mit 500 Zeilen (Kennzahl ist 5 Zeichen breit) und einer Datei B mit 1000 Zeilen braucht solange:
        
        Code: (dl )
        
        1 2 3 4 5 6 7 8 9
        
        # Variante 1 real 0m0.286s user 0m0.284s sys 0m0.001s # Variante 2 real 0m0.018s user 0m0.011s sys 0m0.005s
        
        edit:
        - beide Codes editiert; $criteria_size eingesetzt.
        - Code editiert in Beispiel 2; Referenz-Hash wird nun zeilenweise aufgebaut
        Last edited: 2013-02-01 13:52:18 +0100 (CET)
        meine Beiträge: I.d.R. alle Angaben ohne Gewähr und auf Linux abgestimmt!
        Die Sprache heisst Perl, nicht PERL. - Bitte Crossposts als solche kenntlich machen!
        
        +4 replies
        
        Gast Paul
        
        2013-02-01 11:00
        
        Hallo Linuxer,
        
        vielen vielen Dank!!!
        
        So funktioniert es perfekt. Ohne Eure Unterstützung wäre ich wohl eingegangen an der Problematik.
        
        Jedenfalls habe ich als Anfänger nun einiges gelernt.
        
        Die anderen Lösungen haben nur bedingt funktioniert.
        
        topeg
        
        2013-02-01 13:03
        
        User since
        2006-07-10
        2611 Artikel
        BenutzerIn
        
        Ein Hinweis darauf wäre hilfreich gewesen.
        Ach was nur "bedingt funktioniert" hätte geholfen.
        Wir können nur gut helfen, wenn du Rückmeldungen gibst.
        Ansonsten haben wir 100 Versuche bis du sagt "och ja, es funktioniert so."
        
        Es ist halt frustrierend, wenn ich einen Beitrag schreibe und kein Feedback dazu bekomme.
        
        +2 replies
        
        betterworld
        
        2013-02-01 15:42
        
        User since
        2003-08-21
        2614 Artikel
        ModeratorIn
        
        Guest Paul
        So funktioniert es perfekt.
        
        Freut uns ja, dass du weitergekommen bist. Trotzdem solltest du mal ein bisschen drüber nachdenken, wie du besser anerkennen kannst, dass wir uns hier alle in dein Problem reinzuversetzen versucht haben.
        
        Da die Lösung ja bei dir funktioniert, wäre es (auch für dich) hilfreich, zu zeigen, dass du den Code auch verstehst. Sowas wie "oh das mit den Hashes ist trickreich, das macht ja blahblahblah". Du schreibst ja nicht mal genau, ob du jetzt die erste oder zweite Lösung von Linuxer benutzt hast. Wegen solchen Sachen schreibe ich persönlich schon länger keine größeren Codestücke mehr in Threads wie diesen. Ich habe gleich zu Beginn geschrieben "solltest Du die Datei B am besten irgendwie zu einem Hash verarbeiten statt zu einem Array", was du ja inzwischen vermutlich auch getan hast, aber wenn du darauf nicht weiter eingehst, gibt es von mir auch keine Code-Hilfestellung.
        
        Aber ich weiß schon, es ist manchmal etwas viel verlangt von einem Anfänger, auf all die komplizierten Fragen einzugehen.
        Last edited: 2013-02-01 15:43:58 +0100 (CET)
        Lieblingsmodule: IPC::System::Simple, Path::Class
        
        Gast Paul
        
        2013-02-03 18:31
        
        Hallo zusammen,
        
        ausführliches Feedback wird kommen. Ich muss das ein oder andere selbst erstmal nachvollziehen. Bin wie gesagt Anfänger und habe bisher noch nie mit Hashes gearbeitet. In dem konkreten Fall war die letzte Lösung von Linuxer zielführend. Wieso die Hash Operationen allerdings soviel schneller sind und was da genau gemacht wird versuche ich gerade nachzuvollziehen.
        
        Gruß
        Paul
        Last edited: 2013-02-03 18:44:21 +0100 (CET)
- +2 replies
- topeg
  
  2013-01-31 10:10
  User since
  2006-07-10
  2611 Artikel
  BenutzerIn
  Überlasse das Suchen perl, Indem du einen Hash benutzt. Ich gehe einfach mal davon aus dass die gesuchten Zeilen einzigartig sind, sodass man sie in einen Hash Packen kann, denn ansonsten hättest du mit deiner Herangehensweise noch andere Probleme.
  
  Code (perl): (dl )
  
  1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43
  
  #!/usr/bin/perl use strict; use warnings; my %index; my $file_ref='/was/weis/ich.txt'; my $file_data='/keine/Ahnung/wo.txt'; my $file_out='/irgend/wo/hin.txt'; open(my $fh, '<', $file_ref) or die("Can't open $file_ref ($!)\n"); while(my $line=<$fh>) { chomp($line); # weiteres Aufbreiten der Zeile... # du weißt was noch gemacht werden sollte... $index{$line}=1; } close($fh); open(my $fho, '>', $file_out) or die("Can't open $file_out ($!)\n"); open(my $fhi, '<', $file_data) or die("Can't open $file_data ($!)\n"); while(my $line=<$fhi>) { chomp($line); # weiteres Aufbreiten der Zeile... # du weißt was noch gemacht werden sollte... if(exists($index{$line}) and $index{$line}) { print $fho "$line\n"; # wenn eine Zeile nicht doppelt gefunden werden darf: #delete($index{$line}); } } close($fhi); close($fho);
  
  Edit: Tippfehler beseitigt. Danke Muffi
  Last edited: 2013-01-31 11:35:02 +0100 (CET)
  - Muffi
    
    2013-01-31 10:21
    
    User since
    2012-07-18
    1465 Artikel
    BenutzerIn
    
    Zeile 26 = $fhi ?
    1 + 1 = 10
- pq
  
  2013-02-01 11:56
  
  User since
  2003-08-04
  12209 Artikel
  Admin1
  
  darf ich an der stelle nochmal fragen, was das problem mit CGI zu tun hat? irgendeinen grund wird es ja geben, dass du das im cgi-forum gepostet hast.
  Always code as if the guy who ends up maintaining your code will be a violent psychopath who knows where you live. -- Damian Conway in "Perl Best Practices"
  lesen: Wie frage ich & perlintro brian's Leitfaden für jedes Perl-Problem
- pq
  
  2013-02-03 18:44
  
  User since
  2003-08-04
  12209 Artikel
  Admin1
  
  Verschoben von Perl/CGI nach Allgemeines zu Perl
  Always code as if the guy who ends up maintaining your code will be a violent psychopath who knows where you live. -- Damian Conway in "Perl Best Practices"
  lesen: Wie frage ich & perlintro brian's Leitfaden für jedes Perl-Problem

View all threads created 2013-01-30 21:28.

Navi

Gast Paul

betterworld

Gast Paul

Muffi

Gast Paul

Muffi

Gast Paul

Muffi

Gast Paul

Muffi

Linuxer

Gast Paul

betterworld

topeg

Gast Paul

Muffi

Gast Paul

Muffi

Linuxer

Gast Paul

Muffi

Linuxer

Gast Paul

topeg

betterworld

Gast Paul

topeg

Muffi

pq

pq