das rauswerfen von stoppwörtern, wie esskar es gesagt hat, ist sicher
voraussetzung. im idealfall hast du deine themen über einen volltextindex
indiziert.
vielleicht gibt es auch schon fertige lösungen zu sowas.
als groben ansatz gehst du durch jedes indizierte wort deines
themas (nach häufigkeit) und schaust nach, ob und wo das wort noch
vorkommt. mit jedem wort nimmt die liste der gefundenen ähnlichen
themen ab.
dann sortierst du diese liste; die themen, die die meisten ähnlichen worte
haben, haben die grqßte relevanz.