Thread Platzhalter für HTML-Ausdrücke (reguläre Ausdrücke) (47 answers)
Opened by vitopetre at 2010-04-02 09:42

GwenDragon
 2010-04-03 09:36
#135668 #135668
User since
2005-01-17
14787 Artikel
Admin1
[Homepage]
user image
Mit Regex HTML zu parsen ist eine gute Idee aber schlecht in der Praxis.
Sagt auch die PerlFAQ

Denn was machst du bei folgendem gültigen HTML:
Code: (dl )
1
2
3
4
5
6
7
8
9
<a 
href=
"king/03king.html"
>
An Approach to Open Access Author
<!-- keep this here! -->

Payment
</a>



Ich empfehle zum Parsen eines von: CPAN:HTML-Parser, CPAN:Web-Scraper, CPAN:XML-XPath, CPAN:HTML-Selector-XPath.

Schau dir doch auch mal den Artikel zu Wiki:FaqBenutzungModuleHTMLParser HTML parsen im WIki an.
Last edited: 2010-04-03 09:41:45 +0200 (CEST)

View full thread Platzhalter für HTML-Ausdrücke (reguläre Ausdrücke)