Thread 3 Fragen: Trefferliste umstrukturieren, mit gefunden Links weiterarbeiten + wie kann ich nur Teile eines Treffers anzeigen?
(47 answers)
Opened by vitopetre at 2010-04-11 23:27
Entschuldigt bitte, wenn ich mich so doof anstelle, aber ich hab die letzten Tage versucht mich in Regex einzuarbeiten und hab damit zumindest einigermaßen Fortschritte gemacht, jetzt sagt ihr mir ich darf das nicht benutzen und jetzt hab ich wieder keine Ahnung wie ich weiter machen soll.
Die CPAN-Seiten sind für einen Anfänger wie mich irgendwie zu kryptisch ich verstehe einfach nicht genau wie ich das umsetzten soll. Wie sage ich denn z. B. dem Treebuilder, dass ich z. B. aus diesem Stück HTML: <head> <meta http-equiv="Content-Type" content="text/html; charset=ISO-8859-1" /> <meta name="DOI" content="10.1045/march2010-kucsma" /> <meta name="description" content="D-Lib Magazine" /> <meta name="keywords" content="D-Lib Magazine, Digital Libraries, Digital Library Research" /> <link rel="metadata" href="03kucsma.meta.xml" /> <link href="../../../style/style1.css" rel="stylesheet" type="text/css" /> <link rel="shortcut icon" href="/favicon.ico" type="image/x-icon" /> <title>Using Omeka to Build Digital Collections: The METRO Case Study</title> </head> z. B. die Keywords oder die DOI ausschneiden will? Warum ist denn der Treebuilder besser als der einfache HTML-Parser oder andere Module wie der Web-Scraper oder Mechanize? |