Thread Viele RegExp Checks auf viele Dateien (17 answers)
Opened by Tr0Nix at 2007-12-21 10:51

Tr0Nix
 2007-12-21 11:10
#104089 #104089
User since
2006-11-21
44 Artikel
BenutzerIn
[default_avatar]
renee+2007-12-21 09:58:59--
Kann man so allgemein nicht sagen. Wenn es Bedingungen gibt, die ein "Abbruch" der Analyse bedingen, ist es eher kontraproduktiv. Wenn Du aber Reguläre Ausdrücke hast, die im Prinzip über viele Zeilen (der einzulesendende) gehen, kann es sinnvoll sein.


Das ist ein guter Input! Aktuell geht jede Zeile komplett durch alle Checks durch und es könnte auch mehrere Checks triggern (wieso erläutere ich bei deiner nächsten Frage).

Quote
Das "Compilieren" der RegEx ist schon relativ aufwändig. Deshalb wäre es eventuell geschickt, vorkompilierte RegEx zu verwenden.

Ganz interessant wäre zu wissen, was das eigentliche Ziel ist. Was analysierst Du denn mit den Regulären Ausdrücken? Ist es Perl-Code?


Aktuell gibt es 2 Versionen des Parsers, eine für Java und eine für PL1. Im Prinzip sind beide Scripts jedoch 90% gleich und unterscheiden sich nur in ein paar syntaxabhängigen Regular Expressions - deshalb möchte ich das so überarbeiten, dass man ein Hauptprogramm hat, welches die Checks abhängig der Sprache hinzulinkt (falls in Zukunft noch andere Sprachen kommen würden).

Quote
Über was geht denn die Diplomarbeit?

Um das Erkennen von möglicherweise ungewünschten Informationen in Sourcecodes. Beispielsweise in Kommentaren oder Ausdrücken, die auf schlechten bzw. hartkodierten Programmierstil hinweisen (if $kunde == "foo@bar.com"...). Hier können natürlich auch mehrere Checks "aufleuchten" - wegen einer E-Mail und wegen eines Vergleichs mit einer Konstante.


// Edit:
Hab gerade gebrowsed nach vorkompilierten Regular Expressions - das ist wirklich ein guter Tipp! Aktuell sind die das nämlich nicht!

View full thread Viele RegExp Checks auf viele Dateien