Thread Probleme mit RegEx und Worttypen
(49 answers)
Opened by Dingels at 2008-07-25 19:00
Hallo zusammen,
habe ein Problem, bei dem ich nicht weiter weiß. Und zwar habe ich einen Hash, in dem die Schlüssel aus Worttypen eines Korpus bestehen, die dazugehörigen Werte aus Tags. Ich möchte jetzt alle Komposita herausfiltern, also zusammengesetzte Wörter, wie z.B. "Abendsonne". Mein Ansatz war, dass wenn die einzelnen Bestandteile des Kompositums auch einzeln vorkommen, es sich bei einem Wort um ein Kompositum handelt. D.h., wenn mindestens eines der Wörter "Abend" und "Sonne" einzeln als Schlüssel vorkommen, dann ist "Abendsonne" ein Kompositum. Mit einem regulären Ausdruck lässt sich das sicherlich verwirklichen. Nur wie? Folgender Ansatz funktioniert bei mir nicht: Code: (dl
)
1 use strict; Rekursionen scheinen in regulären Ausdrücken nicht erlaubt zu sein. Habt ihr eine Idee, wie ich die Komposita herausfiltern kann? Besten Dank. Gruß, Dingels |