Thread Viele RegExp Checks auf viele Dateien (17 answers)
Opened by Tr0Nix at 2007-12-21 10:51

renee
 2007-12-21 10:58
#104086 #104086
User since
2003-08-04
14371 Artikel
ModeratorIn
[Homepage] [default_avatar]
Tr0Nix+2007-12-21 09:51:41--
Hallo zusammen

[...]

Umfang:
Die Files sind in erster Linie Sourcecode. Sprich in den allermeisten Fällen < 1MB, dafür sehr viele Dateien.

Fragen die beispielsweise bei mir aufgetaucht sind:
- Macht es Sinn, die Datei zuerst komplett ins Memory einzulesen statt Zeilenweise mittels $zeile = <FD>?


Kann man so allgemein nicht sagen. Wenn es Bedingungen gibt, die ein "Abbruch" der Analyse bedingen, ist es eher kontraproduktiv. Wenn Du aber Reguläre Ausdrücke hast, die im Prinzip über viele Zeilen (der einzulesendende) gehen, kann es sinnvoll sein.

Quote
- Die aktuellen Regular Expressions nutzen alle markierte Subexpressions (also die runden Klammern () um anschliessend mit $1, $2... zuzugreifen) auch wenn diese Informationen teilweise nicht genutzt werden. Kann das die Performance beeinträchtigen?
- Sind Regular Expressions CPU-lastig? Das Script läuft zeitweise auf einem Multi-CPU Sun Server -> Multithreading

Das "Compilieren" der RegEx ist schon relativ aufwändig. Deshalb wäre es eventuell geschickt, vorkompilierte RegEx zu verwenden.

Ganz interessant wäre zu wissen, was das eigentliche Ziel ist. Was analysierst Du denn mit den Regulären Ausdrücken? Ist es Perl-Code?

Auf jeden Fall lässt sich nichts eindeutig beantworten, ohne Code und Ziel zu kennen.

Über was geht denn die Diplomarbeit?
OTRS-Erweiterungen (http://feature-addons.de/)
Frankfurt Perlmongers (http://frankfurt.pm/)
--

Unterlagen OTRS-Workshop 2012: http://otrs.perl-services.de/workshop.html
Perl-Entwicklung: http://perl-services.de/

View full thread Viele RegExp Checks auf viele Dateien