Quote:
Originariamente inviato da Lorekon
essendo strutturato cosė
>nome sequenza
ACATGATGACGAT......etc....
tutti i nomi sono nella riga dispari, tutte le sequenze nella riga pari.
|
Potevi dirlo subito che aveva quella struttura, in questo caso č molto semplice da fare.
sto codice funziona, salvalo nel file split ed esegui:
python split InputFile X
che crea tanti file con ognuno X sequenze al suo interno.
(occhio alle tabulazioni!!! devono essere uguali)
Codice:
import sys
inputFile = open(sys.argv[1], "r")
numeroFile=0
sequenzeCopiate=0
sequenzePerFile=int(sys.argv[2])*2
outputFile = open(str(numeroFile)+".txt", "w")
for linea in inputFile:
if sequenzeCopiate == sequenzePerFile:
outputFile.close()
numeroFile = numeroFile+1
outputFile = open(str(numeroFile)+".txt", "w")
sequenzeCopiate=0
outputFile.write(linea)
sequenzeCopiate = sequenzeCopiate+1
inputFile.close()
outputFile.close()