Thread Modul zur Darstellung von Merkmalsräumen (10 answers)
Opened by pktm at 2008-11-20 23:04

murphy
 2008-11-22 05:05
#116522 #116522
User since
2004-07-19
1776 Artikel
HausmeisterIn
[Homepage]
user image
pktm+2008-11-21 22:18:39--
[...] Dann hat man eine Beschreibung eines Vektors, und zwischen diesem Vektor und dem Merkmalsraum kann man die Divergenz bilden (bitte korrigieren, wenn das nicht exakt stimmt, ich bin mit dem Thema noch nicht so warm). [...]


Ich glaube ja, man berechnet einfach den Abstand oder Winkel zwischen der Suchanfrage, die man so wie die Dokumente als Merkmalsvektor kodiert, und allen Dokumenten. Das Dokument mit dem kleinsten Abstand oder Winkel zur Anfrage ist dann der beste Treffer.

Ich glaube ferner, Du suchst vielleicht gar keinen Weg da irgendwas zu differenzieren, sondern eher eine clevere Projektion Deines hochdimensionalen Merkmalsraumes auf zwei oder drei Dimensionen derart, dass die Abstände oder Winkel zwischen den Dokumenten halbwegs orginalgetreu erhalten bleiben und somit eine grafische Darstellung zumindest die korrekte Identifikation von Clustern erlaubt.

Um das zu bewerkstelligen, würde ich vielleicht versuchen, wenige Dokumente im Zentrum von Clustern als Basisvektoren auszuwählen und dann in den von diesen Vektoren erzeugten Untervektorraum zu projizieren. Dieses Verfahren könnte man auch mehrfach iterieren.

Um von den Polarkoordinaten normierter Vektoren auf planare kartesische zu kommen, könnte man zum Beispiel eine stereographische Projektion verwenden. Die ist winkeltreu und gibt in der Regel einen guten Eindruck von der Kugeloberfläche.

Für bessere Ideen ist es im Moment zu spät, wenn mir noch etwas schlaues einfällt, sage ich Bescheid ;-)
When C++ is your hammer, every problem looks like your thumb.

View full thread Modul zur Darstellung von Merkmalsräumen