Thread Sequencing Analysis - Problem Verarbeitung der Masse
(3 answers)
Opened by Bells at 2011-12-26 17:24
So, ich bin ehrlich, dass ich so meine Probleme mit dem Programmieren habe. Wir haben ein Programmierprojekt an der Uni, für Sequencing Analysis. Die Aufgabe bestand darin: Wir haben Reads und unterschiedliche Chromosomen bekommen. Alles fein und schick, die soll man gegeneiander alignen, dafür haben wir in der Gruppe den Needlerman-Wunsch Algorithmus zu einem Programm umgeschrieben, was auch so läuft das es alignen tut und könnte in der Theorie nach beim raussuchen behilflich werden.Es kann den Match Score berechen, denGap Scoreund den Best Score raussuchen kann.Alles schön und gut - jetzt setzt das Problem ein.
Erst einmal ist die Masse an Daten viel zu groß - das Programm kann bei Eingabe im Terminal nur begrenzt Daten aufnehmen. Wir sollen mehere Chromosomen untersuchen, die reads die zum absuchen gedacht sind, sind 4000 Basen allein bereits lang. Die Masse der Daten,das Programm kann nur eine begrenzte Daten überhaupt berechnen und gegenseitig alginen.Das ist schon einmal ein Problem. Mir stellt sich die Frage, ob man ein Programm überhaupt so umstricken kann das es auch die Masse an Daten abarbeiten tut und die Ergebnisse dann in einer weiteren Datei abspeichern tut. Denn zur Aufgabe gehört es, wir sollen eine Datei erstellen, Format ist uns überlassen, wo die Ergebnisse anschaulich dargestellt sind. Alle Datein, mit den Basen und Sequenzen sind im Fastaformat vorgegeben. Ich bin ehrlich, wir sind wirkliche Perl - Noobs, und habe zu zweit an dem Programm die 3 Tage über Weihnachten gehockt und sind froh, dass es so erstmal läuft, aber das klappt einfach vorn hinten nicht mit dem abarbeiten der Masse an Daten die es zu bearbeiten gibt und irgedwie müsste das Programm rund um die Uhr laufen und die Abgleiche machen und irgendwie speichern in einer Datei. Nur - wie soll das gehen? Da fehlt jeder Ansatz. Last edited: 2011-12-26 19:05:12 +0100 (CET) |