[quote=Strat,05.Dec..2003, 16:52]wenn die Dateien 3-4 MB gross sind, sollte man die vielleicht nicht 1:1 in den RAM einlesen...
[/quote]
Das ist ja nicht besonders viel, auch wenn bei Perl vielleicht doppelt so viel Speicher durch den Overhead eines SV* verbraucht wird.
Quoteda faellt mir folgende Idee ein:
use warnings;
use strict;
use Tie::File;
tie (my @file1, 'Tie::File', $filename1) or die $!;
tie (my @file2, 'Tie::File', $filename2) or die $!;
# sortieren
@file1 = sort(@file1);
@file2 = sort(@file2);
Ich bezweifle, dass Tie::File das performant durchfuehren kann.
Im Zweifelsfall ist es besser, die Sortierung im Speicher vorzunehmen
oder eine andere Datenstruktur zu waehlen, z.B. einen Btree mittels DB_File.
Quote
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
open (OUT, ">$outfile") or die $!;
my $i = 0; my $j = 0; # indices fuer file1, file2
while ($file1[$i] or $file2[$j]) {
# absicherung fuers ende
unless (defined $file1[$i]) {
print OUT $file1[$j]; $j++; next;
} # unless
unless (defined $file2[$j]) {
print OUT $file2[$i++]; next;
} # unless
# vergleiche zwei Zeilen
my $compare = $file1[$i] cmp $file2[$j];
if ($compare < 0) { # file1 ist kleiner
print OUT $file1[$i++];
}
elsif ($compare > 0) { # file2 ist kleiner
print OUT $file2[$j++];
}
else { # gleich gross
$i++; $j++;
}
} # while
close (OUT);
untie(@file1);
untie(@file2);