Thread Modul zur Darstellung von Merkmalsräumen
(10 answers)
Opened by pktm at 2008-11-20 23:04 pktm+2008-11-21 22:18:39-- Ich glaube ja, man berechnet einfach den Abstand oder Winkel zwischen der Suchanfrage, die man so wie die Dokumente als Merkmalsvektor kodiert, und allen Dokumenten. Das Dokument mit dem kleinsten Abstand oder Winkel zur Anfrage ist dann der beste Treffer. Ich glaube ferner, Du suchst vielleicht gar keinen Weg da irgendwas zu differenzieren, sondern eher eine clevere Projektion Deines hochdimensionalen Merkmalsraumes auf zwei oder drei Dimensionen derart, dass die Abstände oder Winkel zwischen den Dokumenten halbwegs orginalgetreu erhalten bleiben und somit eine grafische Darstellung zumindest die korrekte Identifikation von Clustern erlaubt. Um das zu bewerkstelligen, würde ich vielleicht versuchen, wenige Dokumente im Zentrum von Clustern als Basisvektoren auszuwählen und dann in den von diesen Vektoren erzeugten Untervektorraum zu projizieren. Dieses Verfahren könnte man auch mehrfach iterieren. Um von den Polarkoordinaten normierter Vektoren auf planare kartesische zu kommen, könnte man zum Beispiel eine stereographische Projektion verwenden. Die ist winkeltreu und gibt in der Regel einen guten Eindruck von der Kugeloberfläche. Für bessere Ideen ist es im Moment zu spät, wenn mir noch etwas schlaues einfällt, sage ich Bescheid ;-) When C++ is your hammer, every problem looks like your thumb.
|