2014-11-17T15:51:41 MuffiAlso auf deutsch:
Wandere die 35.000 Datensätze einem nach dem anderen durch und suche mir aus den 3*500.000 Datensätzen die passenden Kundenstammdanten hinzu?
2014-11-17T15:51:41 MuffiAlso auf deutsch:
Wandere die 35.000 Datensätze einem nach dem anderen durch und suche mir aus den 3*500.000 Datensätzen die passenden Kundenstammdanten hinzu?
edit: warum steht "Kundennummern" im Plural?
edit2: Und falls es nur eine pro Datensatz ist: Das ist dein Verbindungsschlüssel?
Also wenn das so alles zutrifft würd ich sagen (zuzüglich Export der Daten): Gefühlt sollt sowas in 10sek durch sein.
2014-11-17T14:38:13 black_perlwelches beide Excel-Dateien einliest
2014-11-18T09:20:26 payx[*] Ich würde die Daten nicht in csv umwandeln. Erstens ist das ein zusätzlicher Arbeitsgang, der zur Belastung werden kann, wenn der Vorgang öfter wiederholt werden soll, zweitens ist das unter Umständen fehleranfällig, wenn die Excel-Daten etwa Trenn- oder Begrenzungszeichen oder Zeilenumbrüche o.ä. enthalten. Beim Auslesen aus Excel macht all das keine Probleme, und Dein Zielformat ist ja auch wieder Excel.
2014-11-18T16:51:24 RaubtierEs gibt viele Fälle, wo Excel-Dateien nur von Excel gelesen werden können.
2014-11-18T16:05:12 hlubenowIch bin trotzdem für csv, weil ich glaube, daß es relativ lange dauert, wenn ein Perl-Modul diese Microsoft-Klassen anspricht und dann aus einer Excel-Tabelle liest oder in diese schreibt. Soweit ich das kenne, funktioniert dieser Weg im Prinzip so wie die Makro-Sprache (VBA).
2014-11-18T16:05:12 hlubenowDas dürfte daher dann auch genauso langsam sein.
2014-11-18T22:58:21 hlubenow... weil das Office-Format ja nicht offen ist.
2014-11-18T17:22:56 payxExcel-Dateien mit 1,5 Mio Datensätzen
2014-11-19T07:14:48 Muffi"1,048,576 rows"
2014-11-17T14:38:13 black_perlDamit ist klar, dass es sich um das xlsx-Format handeln muss, was meine dahingehenden (und unbeantwortet gebliebenen) Rückfragen bei hinreichend genauem Hinsehen erübrigt hätte.... drei Tabellen mit je 500.000 Datensätzen
1
2
3
4
5
6
7
8
9
... Creating address file black_perl_adr.xlsx ...
Created address file black_perl_adr.xlsx in 211.786114 seconds
... Creating transation file black_perl_btr.xlsx ...
Created transaction file black_perl_btr.xlsx in 1.305074 seconds
... Reading data from transaction file black_perl_btr.xlsx ...
... Reading data from address file black_perl_adr.xlsx ...
All data read from black_perl_adr.xlsx, black_perl_btr.xlsx in 1642.366938 seconds
... Creating output file black_perl_out.xlsx ...
All data written to output file black_perl_out.xlsx in 7.947455 seconds
1
2
3
4
5
6
7
8
9
... Creating address file black_perl_adr.csv ...
Created address file black_perl_adr.csv in 6.162353 seconds
... Creating transation file black_perl_btr.csv ...
Created transaction file black_perl_btr.csv in 0.058533 seconds
... Reading data from transaction file black_perl_btr.csv ...
... Reading data from address file black_perl_adr.csv ...
All data read from black_perl_adr.csv, black_perl_btr.csv in 3.806632 seconds
... Creating output file black_perl_out.csv ...
All data written to output file black_perl_out.csv in 0.106645 seconds
2014-11-18T09:20:26 payxGerade in großen (DAX-notierten) Industrieunternehmen werden mitunter sehr wichtige Datenbestände in Excel-Dateien auf irgendwelchen Netzlaufwerken verwaltet. In der Regel handelt es sich dabei um "gewachsene Strukturen". Der Einstieg ist halt so schön einfach: Eine Excel-Datei kann jeder ohne spezielle Kenntnisse und vor allem ohne Interaktion mit der in großen Unternehmen meist schwerfälligen und bürokratischen IT anlegen. Die Probleme kommen dann, wenn mehrere Benutzer damit arbeiten sollen, wenn es skalieren soll, oder wenn die Datensicherheit auf irgendeine Weise überwacht werden soll.es wird auch oft zu Zwecken missbraucht, zu denen es nicht taugt
2014-11-18T09:54:54 MuffiEins interessiert mich noch. Die Aufgabe sieht (auch wenn die Beschreibung eher kurz ist) ja recht offiziell aus.
Wenns um irgendwas mit Adressen, Kunden, Geld geht, warum steht sowas in einer Exceltabelle?