Thread Tokenisierung
(8 answers)
Opened by Beat at 2013-07-10 13:15
Wie gesagt: Ich möchte gerne Fälle wie: Klammer-Text-Klammer-Komma erkennen, und das Token nach der zweiten Klammer trennen. (Und zwar so trennen, wie im Beispiel getrennt wird)
Was die Zeichen dort bedeuten, ist nicht wichtig. Das war einfach ein Beispiel an einer anderen Stelle meines Codes. Zudem würde ich gerne Internetadressen und Emailadressen erkennen und diese als nur 1 Token erkennen (d.h. eben nicht trennen). Last edited: 2013-07-12 00:59:54 +0200 (CEST) |