Thread Komprimierte HashOfHashes
(9 answers)
Opened by topeg at 2010-06-17 20:20
Ich habe gerade keine genauen Werte zur Hand, aber ich würde sagen der Hash-Baum enthält ungefähr 2 Millionen Schlüssel (ursprünglich sollten es 1000-5000 pro Datei sein) jeder Hash hält ungefähr 30 Schlüssel (geschätzt) in 8 bis 10 Ebenen. Sie Schlüssellänge dürfte Durchschnittlich 8 Zeichen sein. Bei machen Zugriffen muss ich bis zu einem Drittel der Daten lesen, durch die Struktur geht das auch recht schnell, wenn alles in den Speicher passt. Das war auch ursprünglich der Grund auf einen Hash-Baum zu setzen. Hätte ich geahnt, welche Datenmengen jetzt damit verarbeitet werden, hätte ich eine andere Struktur gewählt.
Das Hauptproblem sind, denke ich, nicht Größe der Werte sondern die Anzahl in ihrer verschachtelten Struktur. Ich werde mal Testweise ein kleines Modul schreiben, dass den Baum als flache Struktur im Speicher hält. Mal sehen, ob das etwas bringt. |