2 .txt-Dateien miteinander vergleichen - #74620 (Allgemeines zu Perl)

ptk

2003-12-05 19:28

User since
2003-11-28
3645 Artikel
ModeratorIn
[default_avatar]

[quote=Strat,05.Dec..2003, 16:52]wenn die Dateien 3-4 MB gross sind, sollte man die vielleicht nicht 1:1 in den RAM einlesen...
[/quote]

Das ist ja nicht besonders viel, auch wenn bei Perl vielleicht doppelt so viel Speicher durch den Overhead eines SV* verbraucht wird.

Quote

da faellt mir folgende Idee ein:

Code: (dl )

use warnings;
use strict;
use Tie::File;

tie (my @file1, 'Tie::File', $filename1) or die $!;
tie (my @file2, 'Tie::File', $filename2) or die $!;

# sortieren
@file1 = sort(@file1);
@file2 = sort(@file2);

Ich bezweifle, dass Tie::File das performant durchfuehren kann.
Im Zweifelsfall ist es besser, die Sortierung im Speicher vorzunehmen
oder eine andere Datenstruktur zu waehlen, z.B. einen Btree mittels DB_File.

Quote

Code: (dl )

open (OUT, ">$outfile") or die $!;

my $i = 0; my $j = 0; # indices fuer file1, file2
while ($file1[$i] or $file2[$j]) {

  # absicherung fuers ende
  unless (defined $file1[$i]) {
    print OUT $file1[$j]; $j++; next;
  } # unless
  unless (defined $file2[$j]) {
    print OUT $file2[$i++]; next;
  } # unless

  # vergleiche zwei Zeilen
  my $compare = $file1[$i] cmp $file2[$j];

  if ($compare < 0) { # file1 ist kleiner
    print OUT $file1[$i++];
  }
  elsif ($compare > 0) { # file2 ist kleiner
    print OUT $file2[$j++];
  }
  else { # gleich gross
    $i++; $j++;
  }

} # while

close (OUT);
untie(@file1);
untie(@file2);