Thread HTML file nach infos duchsuchen od. parsen??
(22 answers)
Opened by Gast at 2007-10-23 03:13
hallo leute nochmal
Ich arbeite jetzt an ein Projekt, Diplomarbeit;und würde ich mich auf jede mögliche Hilfe; Ich habe mich mit tree::Builder und element beschäftigt, und meine erste Aufgabe wäre dann -ich habe ein html file, und besteht aus mehreren Bloöcke von TR-tags 100 so etwa: 1-check ob irgendein 'Met'-string im TT-tag vorkommt, wenn ja, dann 2- look up zum oberen gehörigen TR-tag 3-dann ist bissle schwierig, ich arbeite auch daran, gib mir den Wert von VALUE attribut von INPUT-tag, aber nur der wert von der Ladung, in diesem Fall '2+' (steht zwischen from()innerhalb der VALUE attr oben) dazu der Wert von 'FinneganScanNumber' ist in diesem Fall gleich '3539'und lieget in ' title() 'siehe auch oben. 4-gib mir alle werte der unten stehenden TT-tags. ich habe bis jetzt das probiert aber irgendwie klappt nicht?? Code (perl): (dl
)
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 use warnings; use HTML::Element; use HTML::TreeBuilder; my $tree = HTML::TreeBuilder->new; $tree->parse_file('C:/Documents and Settings/Issa/Desktop/test.html'); foreach my $table_row ($tree->look_down('_tag' => 'tr')) { foreach my $table_cell ($table_row->look_down('_tag' => 'td')) { #foreach my $input_field ($table_cell->look_down('_tag' => 'input')) { foreach my $input_field ($table_cell->look_down('_tag' => 'tt')) { foreach my $test ($input_field->as_text){ if ($test =~ /Met/) { print $test, "\n"; #als test ob es funzt!! foreach my $lookup ($tree->look_up('_tag'=>'tr')) { my @tags = $lookup->content_list; foreach my $tag(@tags) { print $tag->as_text; } } } } } } } print "ok!!!!!!"; und HTML Beispiel [html] <TR> <TD align=right><INPUT type=checkbox CHECKED value="1060.542634 from(531.278593,2+) title(Elution%20from%3a%20777%2e777%20to%20777%2e777%20period%3a%20dimer_02%2eraw%20experiment%3a%201%20cycles%3a%201%20precIntensity%3a%2080142%2e0%20FinneganScanNumber%3a%203539) query(5104)" name=QUE></TD> <TD align=right><TT><A onmouseover="statusString = h1_q5104; if (!browser_EXCLUDE) activateEl('Q5104', event)" onmouseout=clearEl() href="http://pc15.unbi.pg.de/mascot/cgi/peptide_view.pl?..." target=_blank>5104</A> </TT></TD> <TD align=right><TT><FONT color=#ff0000><B>531.27859 </B></FONT></TT></TD> <TD align=right><TT><FONT color=#ff0000><B>1060.54263 </B></FONT></TT></TD> <TD align=right><TT><FONT color=#ff0000><B>1060.54001 </B></FONT></TT></TD> <TD noWrap align=right><TT><FONT color=#ff0000><B>0.00263 </B></FONT></TT></TD> <TD align=right><TT><FONT color=#ff0000><B>0 </B></FONT></TT></TD> <TD noWrap align=right><TT><FONT color=#ff0000><B>(19) </B></FONT></TT></TD> <TD noWrap align=right><TT><FONT color=#ff0000><B>2.4 </B></FONT></TT></TD> <TD align=right><TT><FONT color=#ff0000><B>1 </B></FONT></TT></TD> <TD noWrap><TT><FONT color=#ff0000><B>R.TLLEGEESR.M + di-MetCarboxylation (R)</B></FONT></TT></TD></TR>[/html] ich freue mich auf irgendeine Hilfe, egal wie, vorschläge, wie man da vorgehen kann?? bis jetzt kann ich alle TT-tags die 'MET' string enthalten ausgeben. aber das mit look _up nicht. Greezzz and peaceeee:-)) |