Schrift
[thread]7935[/thread]

URLs ohne Module filtern

Leser: 2


<< |< 1 2 >| >> 11 Einträge, 2 Seiten
steinwolf
 2006-05-02 12:26
#65440 #65440
User since
2003-08-04
367 Artikel
BenutzerIn
[default_avatar]
Hallo,

ich möchte aus einer HTML-Datei alle URLs filtern, egal ob relativ oder absolut.

Knackpunkt: Ich will das ohne irgendwelche Perl-Module realisieren.

Hat da jemand nen Regex-Ansatz?

mfg
steinwolf
"Did you know? You can use your old motor oil to fertilize your lawn." - Blinkster - Professionelles EDV Forum
Relais
 2006-05-02 12:53
#65441 #65441
User since
2003-08-06
2254 Artikel
ModeratorIn
[Homepage] [default_avatar]
Warum willst Du es ohne Perl-Module tun?

Sind die Dir etwa nicht geut genug? =)
Nein, das kann es nicht sein, dann hättest Du ja schon einen Ansatz präsentiert.
Erst denken, dann posten --
27. Deutscher Perl- u. Raku -Workshop 12. bis 14. Mai 2025 in München.

Winter is Coming
steinwolf
 2006-05-02 12:58
#65442 #65442
User since
2003-08-04
367 Artikel
BenutzerIn
[default_avatar]
den hab ich zwar, aber der funkioniert nicht!!!

while( $page =~ m/<A[\s|\w]HREF=[\"|'|\S](.*?w)[\"|'|\S]>(.*?)<\/A>/gi ) {

print "$1 : $2\n";
}
"Did you know? You can use your old motor oil to fertilize your lawn." - Blinkster - Professionelles EDV Forum
Relais
 2006-05-02 13:00
#65443 #65443
User since
2003-08-06
2254 Artikel
ModeratorIn
[Homepage] [default_avatar]
Das "WARUM" hast Du noch nicht beantwortet...

Wenn der Ansatz nicht funktioniert, ist er schonmal nicht besser, als diverse Perl-Module.
Erst denken, dann posten --
27. Deutscher Perl- u. Raku -Workshop 12. bis 14. Mai 2025 in München.

Winter is Coming
renee
 2006-05-02 13:13
#65444 #65444
User since
2003-08-04
14371 Artikel
ModeratorIn
[Homepage] [default_avatar]
Wenn Du nur mit einer normalen RegEx arbeitest, wirst Du Dich darauf einstellen müssen, dass Du diese immer wieder anpassen musst, weil Dir neue Besonderheiten auffallen.

Das hier funktioniert. Ist aber nicht großartig getestet:
Code: (dl )
1
2
3
4
5
6
7
8
9
10
11
12
#!/usr/bin/perl

use strict;
use warnings;

my $html = qq~<a href="http://test.de">Test</a><br />Jede Menge
Text<a class="verweis" href="#">Noch ein Test</a>~;

my @links = $html =~ m~<a.*?href="([^"]+)"[^>]*>(.*?)</a>~isg;
for(my $i = 0; $i < scalar(@links); $i +=2){
print $links[$i],": ",$links[$i+1],"\n";
}
OTRS-Erweiterungen (http://feature-addons.de/)
Frankfurt Perlmongers (http://frankfurt.pm/)
--

Unterlagen OTRS-Workshop 2012: http://otrs.perl-services.de/workshop.html
Perl-Entwicklung: http://perl-services.de/
steinwolf
 2006-05-02 13:39
#65445 #65445
User since
2003-08-04
367 Artikel
BenutzerIn
[default_avatar]
danke renee

@relais:

weils für meine anforderungen ausreicht und ich kein lahmes modul gebrauchen kann.
"Did you know? You can use your old motor oil to fertilize your lawn." - Blinkster - Professionelles EDV Forum
Relais
 2006-05-02 13:48
#65446 #65446
User since
2003-08-06
2254 Artikel
ModeratorIn
[Homepage] [default_avatar]
[quote=steinwolf,02.05.2006, 11:39]weils für meine anforderungen ausreicht und ich kein lahmes modul gebrauchen kann.[/quote]
Hmm, bei Dir geht Geschwindigkeit in der Ausführung über Geschwindigkeit in der Herstellung und auch noch über Qualität und Zukunftsicherheit?

Dann nimm ein schnelles Modul.
Erst denken, dann posten --
27. Deutscher Perl- u. Raku -Workshop 12. bis 14. Mai 2025 in München.

Winter is Coming
pq
 2006-05-02 14:21
#65447 #65447
User since
2003-08-04
12208 Artikel
Admin1
[Homepage]
user image
[quote=steinwolf,02.05.2006, 11:39]weils für meine anforderungen ausreicht und ich kein lahmes modul gebrauchen kann.[/quote]
so ähnlich waren auch die letzten worte des herrn S., bevor er auf die intensiv-
station eingeliefert wurde: ich will ja nur kurz um die ecke fahren, da
dauert es mir zu lange, um mich anzuschnallen.
Always code as if the guy who ends up maintaining your code will be a violent psychopath who knows where you live. -- Damian Conway in "Perl Best Practices"
lesen: Wiki:Wie frage ich & perlintro Wiki:brian's Leitfaden für jedes Perl-Problem
steinwolf
 2006-05-02 15:56
#65448 #65448
User since
2003-08-04
367 Artikel
BenutzerIn
[default_avatar]
*lol*

okay, aber ich parse den code manuelle, sprich ohne irgendein html-Modul.

Und das was ich an MOdulen bisher gesehn habe, wirdn kompletter Parser geladen.

Was habt ihr denn für MOdulvorschläge?
"Did you know? You can use your old motor oil to fertilize your lawn." - Blinkster - Professionelles EDV Forum
renee
 2006-05-02 22:59
#65449 #65449
User since
2003-08-04
14371 Artikel
ModeratorIn
[Homepage] [default_avatar]
CPAN:Regexp::Common::URI
OTRS-Erweiterungen (http://feature-addons.de/)
Frankfurt Perlmongers (http://frankfurt.pm/)
--

Unterlagen OTRS-Workshop 2012: http://otrs.perl-services.de/workshop.html
Perl-Entwicklung: http://perl-services.de/
<< |< 1 2 >| >> 11 Einträge, 2 Seiten



View all threads created 2006-05-02 12:26.