Hallo allerseits!
Ich sitze hier immer noch an meinem Vorhaben, die Text-Inhalte von HTML-Seiten zu parsen (XPath). Dabei hat mir
diese Seite schon die meisten Fragen beantwortet. Was ich noch nicht kapiert habe, ist Folgendes:
<div id="Text">
Dies ist Satz 1.
<p>Dies ist Satz 2.</p>
Dies ist Satz 3.
<div id="Box">Satz 4 gehört nicht zum Text.</div>
</div>
Wie schaffe ich es KORREKTERWEISE, sowohl die Sätze 1 und 3 als auch Satz 2 zu erfassen, aber bspw. nicht Satz 4. In der Praxis scheint zwar
für alle drei Sätze zu funktionieren. Aber sollte es das auch? Bzw. wie käme ich nur an die Sätze 1 und 3 heran? Ich hätte jetzt Folgendes gesagt, aber das funktioniert nicht:
Es dankt einmal mehr
Bob