Thread RegExp - HTML Detection
(9 answers)
Opened by Gast at 2005-11-14 02:14
Wenn ich die ursprüngliche Frage richtig verstanden habe, geht es darum festzustellen, ob eine Datei HTML enthält. Das ist sehr allgemein formuliert und mir ist auch nicht klar in welchem Kontext das verwendet werden soll. Ein Definition ist, dass HTML-Dateien <html> + </html> enthalten sollten. Etwas formaler wird es, wenn Du Dich auf den DOCTYPE gemäß W3C zurückziehst. Eine dritte Definition könnte sein, "wenn es ein Browser anzeigen kann". Da ein Browser aber auch Text-Dateien anzeigt, hilft das nicht wirklich. Was ist also nach Deiner Definiton eine HTML-Datei?
Gruß
Thomas |