Thread HTML file nach infos duchsuchen od. parsen?? (22 answers)
Opened by Gast at 2007-10-23 03:13

outaleb
 2007-11-02 18:37
#101701 #101701
User since
2007-10-23
1 Artikel
BenutzerIn
[default_avatar]
hallo leute nochmal

Ich arbeite jetzt an ein Projekt, Diplomarbeit;und würde ich mich auf jede mögliche Hilfe; Ich habe mich mit tree::Builder und element beschäftigt, und meine erste Aufgabe wäre dann
-ich habe ein html file, und besteht aus mehreren Bloöcke von TR-tags 100 so etwa:
1-check ob irgendein 'Met'-string im TT-tag vorkommt, wenn ja, dann
2- look up zum oberen gehörigen TR-tag
3-dann ist bissle schwierig, ich arbeite auch daran, gib mir den Wert von VALUE attribut von INPUT-tag, aber nur der wert von der Ladung, in diesem Fall '2+' (steht zwischen from()innerhalb der VALUE attr oben)
dazu der Wert von 'FinneganScanNumber' ist in diesem Fall gleich '3539'und lieget in
' title() 'siehe auch oben.
4-gib mir alle werte der unten stehenden
TT-tags.
ich habe bis jetzt das probiert aber irgendwie klappt nicht??

Code (perl): (dl )
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
use warnings;
use HTML::Element;
use HTML::TreeBuilder;

my $tree = HTML::TreeBuilder->new;

$tree->parse_file('C:/Documents and Settings/Issa/Desktop/test.html');

foreach my $table_row ($tree->look_down('_tag' => 'tr')) {

foreach my $table_cell ($table_row->look_down('_tag' => 'td')) {

#foreach my $input_field ($table_cell->look_down('_tag' => 'input')) {

foreach my $input_field ($table_cell->look_down('_tag' => 'tt')) {
foreach my $test ($input_field->as_text){
if ($test =~ /Met/) {
print $test, "\n"; #als test ob es funzt!!

foreach my $lookup ($tree->look_up('_tag'=>'tr')) {
my @tags = $lookup->content_list;

foreach my $tag(@tags) {
print $tag->as_text;

}
}
}
}
}
}
}

print "ok!!!!!!";


und HTML Beispiel


[html]
<TR>
<TD align=right><INPUT type=checkbox CHECKED
value="1060.542634 from(531.278593,2+) title(Elution%20from%3a%20777%2e777%20to%20777%2e777%20period%3a%20dimer_02%2eraw%20experiment%3a%201%20cycles%3a%201%20precIntensity%3a%2080142%2e0%20FinneganScanNumber%3a%203539) query(5104)"
name=QUE></TD>
<TD align=right><TT><A
onmouseover="statusString = h1_q5104; if (!browser_EXCLUDE) activateEl('Q5104', event)"
onmouseout=clearEl()
href="http://pc15.unbi.pg.de/mascot/cgi/peptide_view.pl?..."
target=_blank>5104</A> </TT></TD>
<TD align=right><TT><FONT
color=#ff0000><B>531.27859 </B></FONT></TT></TD>
<TD align=right><TT><FONT
color=#ff0000><B>1060.54263 </B></FONT></TT></TD>
<TD align=right><TT><FONT
color=#ff0000><B>1060.54001 </B></FONT></TT></TD>
<TD noWrap align=right><TT><FONT
color=#ff0000><B>0.00263 </B></FONT></TT></TD>
<TD align=right><TT><FONT
color=#ff0000><B>0 </B></FONT></TT></TD>
<TD noWrap align=right><TT><FONT
color=#ff0000><B>(19) </B></FONT></TT></TD>
<TD noWrap align=right><TT><FONT
color=#ff0000><B>2.4 </B></FONT></TT></TD>
<TD align=right><TT><FONT
color=#ff0000><B>1 </B></FONT></TT></TD>
<TD noWrap><TT><FONT color=#ff0000><B>R.TLLEGEESR.M + di-MetCarboxylation
(R)</B></FONT></TT></TD></TR>[/html]


ich freue mich auf irgendeine Hilfe, egal wie,
vorschläge, wie man da vorgehen kann??
bis jetzt kann ich alle TT-tags die 'MET' string enthalten ausgeben. aber das mit look _up nicht.
Greezzz and peaceeee:-))

View full thread HTML file nach infos duchsuchen od. parsen??