Thread Platzhalter für HTML-Ausdrücke (reguläre Ausdrücke) (47 answers)
Opened by vitopetre at 2010-04-02 09:42

vitopetre
 2010-04-06 01:50
#135728 #135728
User since
2010-02-14
25 Artikel
BenutzerIn
[default_avatar]
Außerdem weiß ich jetzt immer noch nicht, ob es irgendwie eine Möglichkeit gibt bei Perl Platzhalter einzufügen die mir helfen "allgemeine" Anfangs- und Endpunkte in einem aus HTML-gebauten Array festzulegen und dann dort gezielt Infos zwischen von mir festgelegten Markierungen auszuschneiden, wie z. B. hier:

In einem HTML-Quelltext bzw. einem daraus von Perl erstellten und eventuell zugeschnittenen Text-Array steht irgendwo mittendrin die Zeichenkette:

<a href="blablabla.com"> Blubblubblub Blubber blub blub </a> oder
<a href="blubblubblubblub.de"> Bla blabedi bla blaa bla blaa </a>.

Ich habe also mehrere Zeichenketten, die mit " <a href=" " anfangen, worauf dann immer irgendeine andere Zeichenkette (ein Dateiname, eine URL, was auch immer) folgt bzw. Bestandteil der Gesamtzeichenkette ist, für die ich ja eigentlich einen PLATZHALTER (siehe Thema des Threads) suche und das ganze dann wieder mit " </a> " schließt; wie sage ich Perl jetzt, dass ich gerne immer dann wenn etwas mit " <a href=" ">
anfängt hier beginnen möchte einige Infos auszuschneiden und zwar z. B. den Link der in den Anführungszeichen hinter dem Gleichheitszeichen steht aber auch einige Infos die dahinter in anderen Klammern stehen, bei obigem Beispiel soll mir Perl also folgendes ausspucken:

LINK: blablabla.com
TITEL: Blubblubblub Blubber blub blub

LINK: blubblubblubblub.de
TITEL: Bla blabedi bla blaa bla blaa

Ja ich weiß, das ist genau das, was mir das WWW::Mechanize-Programm von Bianca ausspuckt, nur verstehe ich nicht wie ich damit selbst arbeiten soll, deshalb hier noch ein anderes Beispiel (mit einer etwas anderen Fragestellung):

<itemrdf:about="http://bla.blub.bl/12.3456/blablabla-blub">
<title>Bla Bla Blubber Systems: Systematic Blubbering for Blubbies</title>
<description>Article by Bla Blubb, Blubby Blaa and Bl-Bl Blubo, Institute of Blubbery Blubs, Blubb-Town Blubania </description>

Wie sage ich Perl, bitte schneide mir alles aus, was in den Anführungszeichen der ersten Klammer also hinter <item rdf:about=" steht aus und anschließend, alles was zwischen den TITEL-Klammern steht und dann alle Wörter bis zum "by" zwischen den DESCRIPTION-Klammern und zum Schluss noch alle Wörter hinter dem "by" bis zum Komma nach dem "and" in der selben Klammer.

Als Ergebnis soll mir das Programm folgendes ausspucken:

LINK: http://bla.blub.bl/12.3456/blablabla-blub
TITEL: Bla Bla Blubber Systems: Systematic Blubbering for Blubbies
KATEGORIE: Article
AUTOREN: Bla Blubb, Blubby Blaa and Bl-Bl Blubo

Bitte entschuldigt meine dreiste Fragerei und mein tollpatschiges bzw. euch gegenüber ungeschicktes Benehmen, ich weiß ihr seid Meister in eurem Gebiet und ich bin ein doofer Anfänger, der versucht das was ihm sein Lehrer gezeigt hat nachzumachen, obwohl ich meinem Lehrer leider nicht immer ganz folgen konnte, weil der oft schon zwei Schritte weiter in seiner Erklärung war, während ich noch immer zu verstehen versuchte was der da vor 5 Minuten gemacht hat.

Trotzdem bitte ich euch: Schreibt mir nicht einfach die Lösung auf, sondern erklärt mir bitte was man da machen muss bzw. was daran nicht funktioniert, warum es nicht funktioniert oder wie man das besser machen kann.

Ich weiß ich verlange sehr viel und bin mir auch bewusst, dass ihr so was nicht so gerne macht, weil ein Perl-Programm ja eigentlich für sich selbst spricht - aber ich hoffe, dass es vielleicht trotzdem jemand von euch versucht.

Vielen vielen Dank

Ich hoffe ich falle euch nicht zu sehr auf die Nerven!

Liebe Grüße

Vito

Last edited: 2010-04-06 02:22:17 +0200 (CEST)

View full thread Platzhalter für HTML-Ausdrücke (reguläre Ausdrücke)