METODE* Per tal de convertir l'arxiu a format gff es va utilitzar el programa parseblast realitzat per Josep F. Abril , amb la comanda:
parseblast -Gi AC090953.blast.est | gawk ' BEGIN {OFS = "\t"} { $2=$9; $6=$7=".";print}' > AC090953.blast.est.gff
Executem el programa gff2ps : gff2ps AC090953.blast.est.gff > AC090953.blast.est.ps (Imatge)
En primer lloc es va modificar l'arxiu de sortida del blast (AC090953.blast.est) de manera que Plus i Minus (orientació del marc de lectura de les seqüències) es presentés en forma de + ó - , amb la intenció final d'aconseguir per separat els resultats en forward i en revers.
-npe ' if ($_=~m/^\s*Strand: /o) { $_ =~ s/plus/+/og; $_ =~ s/minus/-/og; }' < AC090953.blast.est > AC090953.blast.fixedEs va executar a continuació el programa Parseblast per obtenir aquest fitxer en format gff de la mateixa manera que s'ha explicat en el cas anterior.
* Per seleccionar aquells ESTs presents més d'un cop en la nostra seqüencia fem servir l'script en awk (R.Guigó):
BEGIN{
OFS="\t";
}
{
nhsp[$9]++;
hsp[$9,nhsp[$9]]=$0;
}
END{
for (i in nhsp)
if (nhsp[i]>1)
for (j=1;j<=nhsp[i];j++)
print hsp[i,j];
}
Amb l'objectiu d'aplicar la separació de forward i reverse i de mostrar els ESTs com a 3' o 5', es va fer servir el següent programa dissenyat per Josep F.Abril: programa.est.pl
L'arxiu de sortida d'aquest programa (AC090953.blastout.fixed.gff ) conté només aquells ESTs que es troben repetits en l'arxiu de sortida del Blast i a més de la informació referida a la seva orientació, conté la informació necessària per classificar-los en 3' o 5'.
Per visualitzar tota aquesta informació de manera clara, es va crear una arxiu Custfile de paràmetres, el qual pot ser llegit pel programa gff2ps i que adjudica dos colors segons la seqüència sigui 3' (blau) o 5' (violeta).
Arxiu Custile:
# F #
est5'::feature_color=violet
est3'::feature_color=blueCorrem el programa gff2ps:
gff2ps -C custfile -- AC090953.geneid.gff AC090953.genscan.gff AC090953.blastout.fixed.gff > AC090953.fixed.out.ps Imatge
Obtenció del forward i el reverse per separat i en din-A3:
gff2ps -s a3 -f -T AC090953_Reverse -C custfile -- AC090953.geneid.gff AC090953.genscan AC090953.blast.fixed.best.gff > AC090953.fixed.outR.ps [Resultat de les seqüències en reverse]
gff2ps -s a3 -r -T AC090953_Forward -C custfile -- AC090953.geneid.gff AC090953.genscan AC090953.blast.fixed.best.gff > AC090953.fixed.outF.ps [Resultat de les seqüències en forward]