Thread Idee: Transformation einer Datei in ein Objekt (17 answers)
Opened by rosti at 2011-03-30 11:06

topeg
 2011-03-30 13:02
#147121 #147121
User since
2006-07-10
2611 Artikel
BenutzerIn

user image
Ich sehe durchaus die Idee. Doch der Ansatz ist ein wenig naiv. Du setzt Regeln voraus, die so nicht gegeben sein müssen.
Das Problem eine unbekannte Konfiguration-Format zu erkennen ist beinahe so komplex wie eine unbekannte Sprache zu verstehen.
Wenn es dich wirklich interessiert, dann fange an dich mit Kryptographie und möglicherweise mit Linguistik auseinander zu setzen.

Ich habe mir gerade kurz ein paar Gedanken darüber gemacht.
Man könnte ganz grob ein paar Regeln für Konfigurationsformate aufstellen:
  • Eine Konfiguration besteht aus Schlüsselwörtern, Trennzeichen und Werten.
  • Lesbare Zeichenfolgen könnten Schlüsselwörter sein und sollten von einem Trennzeichen gefolgt werden.
  • Auf ein Schlüsselwort folgt ein Trennzeichen gefolgt von einem Wert.
  • Trennzeichen sollten eine oder wenige Zeichen sein, die in den Schlüsselwörtern nicht vorkommen. Wahrscheinlich aber nicht zwingend ein nichtalphanumerisches Zeichen.
  • Sollte ein Konfigurationswert mehrzeilig sein, so braucht es einen Fortsetzungszeichen, oder ein Abschlusszeichen. Ein Abschlusszeichen kann auch das nächste Schlüsselwort darstellen.

Das wäre was mir so auf Anhieb dazu einfiele. Daraus müsstest du Heuristiken entwickeln, die z.B. Trennzeichen an ihrer Häufigkeit erkennt und das dann mit anderen Regeln gegen prüft.

Das ganze ist bei weitem nicht so trivial wie es scheint. Darüber haben sich schon andere den Kopf zerbrochen. Aus dem Grund gibt es eine Bewegung, die XML als Konfigurationsformat weitgehend durchsetzen will, oder wenigstens einen kleinen Satz von verschiedenen Formaten.

Aber wenn du dich wirklich da rein knien willst, so helfe ich dir gerne dabei, soweit ich kann.

View full thread Idee: Transformation einer Datei in ein Objekt