User since
2005-09-17
51
Artikel
BenutzerIn
Hallo,
ich bin am überlegen, eine Art Dokumentenkonvertierung zu bauen (oder bauen zu lassen). Diese kann Teil eines CMS oder eines Redaktionssystems sein.
Idee/Hintergrund:
Im Sinne der allgemeinen Zugänglichkeit (Barrierefreiheit, ...) ist es wichtig, daß Dokumente in verschiedenen Formaten zum Download bereit gestellt werden.
Wenn man jedoch in einem Betrieb oder einer Orga arbeitet, wo aus unterschiedlichen Gründen es nicht mnöglich ist, daß ein Mitarbeiter alle verschiedenen Formate bereitstellt (z.B. weil er nur MS Office hat aber kein OpenOffice), hat man ein Problem.
Am Ende gibt es dann im Netz nur eine Worddatei und man sagt einfach, dies ist Standard und wird immer Standard bleiben.. (Haha, so wie Netscape oder der IE5 mal..).
Deswegen denke ich, wäre folgendes Skript sinnvoll:
1. Benutzer können ein Dokument hochladen. Sie haben nur ein Uploadfeld, und sonst brauchen sie nichts anzugeben.
2. Es wird erkannt (anhand Dateiendung), was es ist: XSLT, Word Doc, Open Text, OpenOffice Text, ...
3. Wenn es ein verarbeitbares Format ist (also z.B. kein PDF), dann werden die anderen Formate automatisch erstellt.
Ich weiß es gibt einige Module und Libs, die bei der Erstellung eines solchen Skripten helfen könnten. Aber eine Zusammenfassung im obigen Sinne hab ich noch nicht gefunden.
Hat jemand vielleicht trotzdem sowas schon entdeckt?
Ansonsten: Wie sind die Meinungen zu einem solchen Skript? Sinnvoll, machbar?
Ciao,
Wolfgang
User since
2005-01-13
782
Artikel
BenutzerIn
ich denke, dass es schon zu jedem schritt ein Modul auf CPAN geben dürfte (habe jetzt aber nicht nachgeschaut)
man kann auf jeden fall Word-Dokumente auslesen/knovertieren, XML sowieso, wenn man einmal XML hat sollte alles andere kein problem mehr darstellen.
Ich denke es wäre machbar. So einen allrounder gesehen habe ich in Perl zumindest noch nicht
User since
2003-08-04
14371
Artikel
ModeratorIn
So etwas ist sicherlich recht sinnvoll, und es gibt wohl zu einigen Sachen schon Konverter... Vor allem wenn Du OpenOffice im ServerModus laufen lässt, kannst Du das Konvertieren von Word <-> Open Document und jeweils noch in PDF durch OpenOffice machen lassen...
User since
2003-08-04
7321
Artikel
ModeratorIn
pdf ist so ne sache.
das muss ja kein text sein, sondern kann ein image sein... und muss dann geOCRt werden
User since
2005-09-17
51
Artikel
BenutzerIn
[quote=renee,23.06.2006, 17:47]Vor allem wenn Du OpenOffice im ServerModus laufen lässt, kannst Du das Konvertieren von Word <-> Open Document und jeweils noch in PDF durch OpenOffice machen lassen...[/quote]
Wie sieht es denn mit der Performance von OpenOffice im Servermodus aus? Wenn ich es im Client mache, kann es mitunter eine gewisse Zeit dauern.
Wenn ich das übertrage auf auf ein Programm, welches über CGI läuft, dann muss man ja damit rechnen, daß der Benutzer nicht so lange Geduld hat und während er Verarbeitung abbricht.
Dem könnte man natürlich beikommen, aber schön ist das nicht unbedingt...
User since
2005-09-17
51
Artikel
BenutzerIn
[quote=esskar,23.06.2006, 20:22]pdf ist so ne sache.
das muss ja kein text sein, sondern kann ein image sein... und muss dann geOCRt werden[/quote]
Naja, PDF als Quelldokument ist ohnehin auch schon auf der normalen Clientseite blöd.
Ich denke als Eingabedokumente könnte man sich auf XSLT, Word oder ODT begrenzen. Wobei letztere beiden sicherlich am häufigsten von den Usern kommen werden. (Ich glaub nicht, daß man die vielen MS-Office-User schnell dazu bringen kann, etwas in XML zu speichern...)
User since
2003-08-04
7321
Artikel
ModeratorIn
[quote=xwolf,23.06.2006, 20:42]Wenn ich das übertrage auf auf ein Programm, welches über CGI läuft, dann muss man ja damit rechnen, daß der Benutzer nicht so lange Geduld hat und während er Verarbeitung abbricht.[/quote]
idee:
der user muss auch sein e-mail-adresse angeben (oder besser, damit es nicht zu spam kommt: mitglied in dem system sein)
dann kannst du im das resultat zuschicken.
wir haben solch ein ähnlcihes system: du nimmst mindestens ein dokument von format deiner wahl und schickst es an eine bestimmte email adresse. nach einer weile bekommst du dann eine email, in dem das dokument im pdf format an dich zurück geschickt wurde.