Schrift
[thread]10638[/thread]

OPTIMIZE verfälscht MD5 ?



<< |< 1 2 >| >> 11 Einträge, 2 Seiten
Froschpopo
 2007-10-23 20:06
#101241 #101241
User since
2003-08-15
2653 Artikel
BenutzerIn
[default_avatar]
Ich füge bei MediumBlob-Datensätzen immer beim INSERT die MD5-Summe des Blobs hinzu.
So kann ich später doppelte Blobs auffinden, was in einer großen Fotokartei recht praktisch ist. So lässt sich sicherstellen, dass ein Foto auch wirklich nur einmal vorkommt.

In letzter Zeit beschleicht mich allerdings der Verdacht, dass OPTIMIZE TABLE die MD5-Summen verfälscht.

Fakten: mySQL
Die MD5-Summe wird durch der mySQL-Eigenen Funktion ermittelt die auch so heißt.
Linuxer
 2007-10-23 20:39
#101242 #101242
User since
2006-01-27
3890 Artikel
HausmeisterIn

user image
Zum Post:
Recht dünne Angaben ohne konkrete Beispiele; findest Du nicht auch?
Hast Du nur den Verdacht oder hast Du ihn auch schon mal kontrolliert und bestätigt?
Wenn ja, wie?
Wenn nein, soll hier jemand das für Dich tun?

Was soll der Punkt "Fakten" aussagen?

Zum MD5 selbst:
Quote
So lässt sich sicherstellen, daß ein Foto auch wirklich nur einmal vorkommt.


Ich würde eher sagen, "die Wahrscheinlichkeit, dass ein Foto doppelt vorkommen kann, ist dadurch gering".

Es besteht bei MD5 durchaus die Möglichkeit, dass 2 Dateien (oder Datenströme, o.ä.) die gleiche Summe erzeugen. Das Problem besteht darin, solche 2 Dateien zu finden.
Die Wahrscheinlichkeit, daß zwei solcher Dateien in einem System vorkommen, mag gering sein, ist aber durchaus vorhanden.

Also magst Du zwar durchaus sicherstellen, daß das gleiche Foto nicht nochmal vorkommt; aber ein Foto, das eine gleiche MD5 Summe wie ein bereits erfasstes Foto hat, kommt dann auch nicht mehr vor.

[edit]Formulierungs- und andere kleine Korrekturen[/edit]
meine Beiträge: I.d.R. alle Angaben ohne Gewähr und auf Linux abgestimmt!
Die Sprache heisst Perl, nicht PERL. - Bitte Crossposts als solche kenntlich machen!
nepos
 2007-10-23 22:24
#101244 #101244
User since
2005-08-17
1420 Artikel
BenutzerIn
[Homepage] [default_avatar]
Das gleiche Bild 2x leicht unterschiedlich gespeichert und schon hast du zwei absolut verschiedene MD5-Summen...
Froschpopo
 2007-10-24 07:26
#101247 #101247
User since
2003-08-15
2653 Artikel
BenutzerIn
[default_avatar]
ich möchte lediglich vermeiden, dass ich ein Bild versehendlich doppelt hochlade. Ich verändere die Bilder nicht. Das ganze ist also weniger ein Schutz, vielmehr eine kleine Hilfe.
GwenDragon
 2007-10-24 11:04
#101251 #101251
User since
2005-01-17
14748 Artikel
Admin1
[Homepage]
user image
Warum verwendest du keine längeren Hashes wie CPAN:Digest-SHA? Da sollte dann keine Doppelung bei der "Prüfsumme" mehr vorkommen (können).
pq
 2007-10-24 11:46
#101258 #101258
User since
2003-08-04
12208 Artikel
Admin1
[Homepage]
user image
naja, wenn ich beliebig lange strings auf strings fester länge mappe, *muss* es ja kollisionen
geben. je länger der string, desto unwahrscheinlicher, aber möglich.
Always code as if the guy who ends up maintaining your code will be a violent psychopath who knows where you live. -- Damian Conway in "Perl Best Practices"
lesen: Wiki:Wie frage ich & perlintro Wiki:brian's Leitfaden für jedes Perl-Problem
nepos
 2007-10-24 11:47
#101259 #101259
User since
2005-08-17
1420 Artikel
BenutzerIn
[Homepage] [default_avatar]
Hast du denn mal einen Test gemacht, wegen OPTIMIZE und dem Verfälschen der MD5-Summe?
sid burn
 2007-10-24 18:46
#101282 #101282
User since
2006-03-29
1520 Artikel
BenutzerIn

user image
Mann kann ja von einem Bild gleichzeitig eine MD5, SHA1, SHA-512 Summe berechnen.

Mann kann zwar mit Manipulationen auch unterschiedlichen Dateien erstellen die die selbe MD5 Summe ergeben. Aber das Ergebnis gleichzeitig so zu Manipulieren das alle drei hash Algorithmen umgangen werden ist fast ein Ding der unmöglichkeit.
Nicht mehr aktiv. Bei Kontakt: ICQ: 404181669 E-Mail: perl@david-raab.de
Froschpopo
 2007-10-26 13:30
#101379 #101379
User since
2003-08-15
2653 Artikel
BenutzerIn
[default_avatar]
ich habe jetzt mal ein paar Tests gemacht und kann nun eindeutig sagen, dass es nicht an MD5 liegt. Das hat was damit zu tun, dass sich auch durch Verschieben der Dateien der Fotoheader ändert da hier ein Timestamp gesetzt wird (Erstellungsdatum) der dann logischerweise die Summe verfälscht.
Meine Methode würde also nur funktionieren wenn ich mich auf den Datenbereich beschränke und auf den Header verzichte. Wäre aber blöd, weil ich auch Informationen aus dem Header beziehe (z.B. Exif-Daten usw)
esskar
 2007-10-26 14:13
#101386 #101386
User since
2003-08-04
7321 Artikel
ModeratorIn

user image
hmm
wie verschiebst du denn die datei?
ein einfaches cpy oder mov sollte nix an der datei ändern.
<< |< 1 2 >| >> 11 Einträge, 2 Seiten



View all threads created 2007-10-23 20:06.