Schrift
Wiki:Tipp zum Debugging: use Data::Dumper; local $Data::Dumper::Useqq = 1; print Dumper \@var;
[thread]5908[/thread]

Alle HTML-Tags entfernen: REGEX

Tags: Ähnliche Threads

Leser: 5


<< |< 1 2 >| >> 17 Einträge, 2 Seiten
steinwolf
 2003-11-14 16:30
#71843 #71843
User since
2003-08-04
367 Artikel
BenutzerIn
[default_avatar]
Hi,
wie entferne ich in einer Variable alle HTML-Tags?
Ich habs so versucht:
$source =~tr/<(.*)>//s;

funktioniert bloss leider nicht..
"Did you know? You can use your old motor oil to fertilize your lawn." - Blinkster - Professionelles EDV Forum
renee
 2003-11-14 16:37
#71844 #71844
User since
2003-08-04
14371 Artikel
ModeratorIn
[Homepage] [default_avatar]
Probier's mal damit:

$source =~ s/<[^>]+?>//g;
OTRS-Erweiterungen (http://feature-addons.de/)
Frankfurt Perlmongers (http://frankfurt.pm/)
--

Unterlagen OTRS-Workshop 2012: http://otrs.perl-services.de/workshop.html
Perl-Entwicklung: http://perl-services.de/
steinwolf
 2003-11-14 16:41
#71845 #71845
User since
2003-08-04
367 Artikel
BenutzerIn
[default_avatar]
Geht schon besser :p

danke renee
"Did you know? You can use your old motor oil to fertilize your lawn." - Blinkster - Professionelles EDV Forum
[E|B]
 2003-11-14 16:42
#71846 #71846
User since
2003-08-08
2561 Artikel
HausmeisterIn
[Homepage] [default_avatar]
Hi!

Code: (dl )
1
2
3
4
my $string = "<html>Dies ist<b> ein Test</b></html>";
$string =~ s/<.*?>//g;

print $string;
Gruß, Erik!

s))91\&\/\^z->sub{}\(\@new\)=>69\&\/\^z->sub{}\(\@new\)=>124\&\/\^z->sub{}\(\@new\)=>);
$_.=qq~66\&\/\^z->sub{}\(\@new\)=>93~;for(@_=split(/\&\/\^z->sub{}\(\@new\)=>/)){print chr;}

It's not a bug, it's a feature! - [CGI-World.de]
format_c
 2003-11-14 18:34
#71847 #71847
User since
2003-08-04
1706 Artikel
HausmeisterIn
[Homepage] [default_avatar]
perldoc HTML::Parser

Gruß Alex
jan
 2003-11-14 21:08
#71848 #71848
User since
2003-08-04
2536 Artikel
ModeratorIn
[Homepage] [default_avatar]
HTML::Parser ist vielleicht ein klitze kleines bisschen übertrieben, meinst du nicht?
ich mein, nur, um alle html-tage zu entfernen?
pq
 2003-11-14 22:57
#71849 #71849
User since
2003-08-04
12208 Artikel
Admin1
[Homepage]
user image
[quote=jan,14.11.2003, 20:08]HTML::Parser ist vielleicht ein klitze kleines bisschen übertrieben, meinst du nicht?
ich mein, nur, um alle html-tage zu entfernen?[/quote]
übertrieben?
Code: (dl )
1
2
3
4
5
6
$_=<<EOM;
<html>Dies ist<b> ein Test</b><!-- Kommentar <tag> -->
<mehrzeiligestag
></html>
EOM
s/<.*?>//g;

das sieht mir jedenfalls nicht nach einer funktionierenden lösung aus. im dem
falle finde ich 'übertrieben' nicht sehr passend.
Always code as if the guy who ends up maintaining your code will be a violent psychopath who knows where you live. -- Damian Conway in "Perl Best Practices"
lesen: Wiki:Wie frage ich & perlintro Wiki:brian's Leitfaden für jedes Perl-Problem
esskar
 2003-11-14 23:10
#71850 #71850
User since
2003-08-04
7321 Artikel
ModeratorIn

user image
kommt drauf an...
wenn man weiß, was für einen html code man parsen muss - hat man die seiten vielleicht selbst geschrieben - ist es übertrieben...

daten, die von außen kommen, sollte man so sensitive wie möglich behandeln, also nicht übertrieben...
jan
 2003-11-14 23:21
#71851 #71851
User since
2003-08-04
2536 Artikel
ModeratorIn
[Homepage] [default_avatar]
gut, mit dem tag innerhalb des kommentars erledigt sich der regexp, mehrzeilige tags sollten ja mit einem s zum g ohne weiteres zu erfassen sein.
mit
while(s/<[^><]*?>//gs){}
lässt sich aber auch das bereinigen. aber natürlich, da hast du schon recht, nicht sauber, da
<!-- hallo ><< -->
das auch wieder sprengen würde.
insofern stimme ich zu, dass ein vorheriges parsen womöglich besser wäre.
wie säh's mit
s/<!--.*?-->//gs;
s/<.*?>//gs;
aus? schwächen? wenn wir mal von sauberem html ausgehen, also &gt; innerhalb von attributen (wäre > nur unsauber oder ungültig?) etc?
pq
 2003-11-14 23:25
#71852 #71852
User since
2003-08-04
12208 Artikel
Admin1
[Homepage]
user image
[quote=jan,14.11.2003, 22:21]wenn wir mal von sauberem html ausgehen, also &gt; innerhalb von attributen (wäre > nur unsauber oder ungültig?) etc?[/quote]
keine ahnung, ob gültig oder nicht, kenne mich ehrlich gesagt nicht soo gut
in HTML aus. genau deswegen würde ich das eher einem modul überlassen
:)
Always code as if the guy who ends up maintaining your code will be a violent psychopath who knows where you live. -- Damian Conway in "Perl Best Practices"
lesen: Wiki:Wie frage ich & perlintro Wiki:brian's Leitfaden für jedes Perl-Problem
<< |< 1 2 >| >> 17 Einträge, 2 Seiten



View all threads created 2003-11-14 16:30.