Thread Text::Markdown: Markdown+HTML-Mix Probleme vermeiden (5 answers)
Opened by GwenDragon at 2010-12-18 20:00

clms
 2010-12-19 19:37
#143714 #143714
User since
2010-08-29
373 Artikel
BenutzerIn
[default_avatar]
2010-12-18T19:00:31 GwenDragon
Es ist eben ein Drama, wenn Leuten einfach zu schreibendes Markup geboten werden soll. :(

Nutzer verwenden in einer Anwendung CPAN:Text::Markdown mit Markdown-Syntax.
Markdown verbietet aber kein HTML, deswegen führt so manches zu einem nichtwohlgeformten HTML.

Wie kann ich das nun das im Markdown-Code eingesetzte HTML auf Probleme prüfen oder sowas vermeiden?

Oder weiß jemand anderes Pseudomarkup außer BBCode oder Textile zur Abhilfe?

Ich kenne CPAN:Text:Markdown nicht und hab' gerade keine Lust/Zeit es mir näher anzuschauen.

Aber bei ähnlichen Aufgabenstellungen/Problemen habe ich mir angewöhnt den ganzen HTML-Input in CPAN:HTML::TreeBuilder einzulesen und wieder auszugeben. Dann kommt (fast immer) gültiges HTML raus und ettliche typische Fehler - wie '<' oder '&' als Zeichen im Text oder HTML-Elemente, die nicht geschlossen werden - werden durch recht gute Heuristiken so gefixt, wie es der Schreiber vermutlich wollte. (In Einzelfällen wird das Markup und der Inhalt natürlich trotzdem zerschossen.)

Als kleinen Bonus kann man dann recht einfach zusätzliche Filter über den HTML-Tree jagen. Ich begrenze z.B. den Satz zulässiger HTML-Tags, prüfe Links oder stelle den Kontext sicher.

View full thread Text::Markdown: Markdown+HTML-Mix Probleme vermeiden