Thread Probleme mit RegEx und Worttypen (49 answers)
Opened by Dingels at 2008-07-25 19:00

LanX-
 2008-07-25 19:54
#112735 #112735
User since
2008-07-15
1000 Artikel
BenutzerIn

user image
ich baue eine Regex der Form (Abend|haus|Sonne)(Abend|haus|Sonne) da kannst du auch die einzelnen Komposita greifen.

Code (perl): (dl )
1
2
3
4
5
while ( $text =~ m/\b($words_re)($words_re)\b/gi) {
        my $word1="\u$1";
        my $word2="\u$2";
        print "$word1 ->" , $hash{$word1},"\n";
}

Sonne ->NN
Abend ->NN
Haus ->NN


Aber ich vermute du willst lieber klassisch rangehen mit 3 Schleifen
die erste iteriert über die wörter
die zwote vergleicht den Wortanfang mit allen Komposita
die dritte vergleicht den Wortrest mit allen Komposita

View full thread Probleme mit RegEx und Worttypen