METODE

  * Per tal de convertir l'arxiu a format gff es va utilitzar el programa parseblast realitzat per Josep F. Abril , amb la comanda:

   parseblast  -Gi AC090953.blast.est  |  gawk ' BEGIN {OFS = "\t"} { $2=$9; $6=$7=".";print}' > AC090953.blast.est.gff

  Executem el programa gff2ps : gff2ps AC090953.blast.est.gff > AC090953.blast.est.ps   (Imatge)

   Enrera


Modificacions

En primer lloc es va modificar l'arxiu de sortida del blast  (AC090953.blast.est) de manera que Plus i Minus (orientació del marc de lectura  de les seqüències) es presentés en forma de + ó - , amb la intenció final d'aconseguir per separat els resultats en forward i en revers.
 -npe ' if ($_=~m/^\s*Strand: /o) { $_ =~ s/plus/+/og; $_ =~ s/minus/-/og; }' < AC090953.blast.est > AC090953.blast.fixed

 Es va executar a continuació el programa Parseblast per obtenir aquest fitxer en format gff de la mateixa manera que s'ha explicat en el cas anterior.

* Per seleccionar aquells ESTs presents més d'un cop en la nostra seqüencia fem servir  l'script en awk (R.Guigó):

    BEGIN{
    OFS="\t";
}
{
    nhsp[$9]++;
    hsp[$9,nhsp[$9]]=$0;
}
END{
    for (i in nhsp)
        if (nhsp[i]>1)
            for (j=1;j<=nhsp[i];j++)
                print hsp[i,j];
}
 

Amb l'objectiu d'aplicar la separació de forward i reverse i  de mostrar els ESTs com a  3' o 5',  es va fer servir el següent programa dissenyat per Josep F.Abril: programa.est.pl

L'arxiu de sortida d'aquest programa (AC090953.blastout.fixed.gff ) conté només aquells ESTs que es troben repetits en l'arxiu de sortida del Blast i a més de la informació referida a la seva orientació, conté la informació necessària per classificar-los en 3' o 5'.

Per visualitzar tota aquesta informació de manera clara, es va crear una arxiu Custfile de paràmetres, el qual pot ser llegit pel programa gff2ps i que adjudica dos colors segons la seqüència sigui 3' (blau) o 5' (violeta).
Arxiu Custile:
# F #
est5'::feature_color=violet
est3'::feature_color=blue

Correm el programa gff2ps:

gff2ps -C custfile -- AC090953.geneid.gff AC090953.genscan.gff  AC090953.blastout.fixed.gff  > AC090953.fixed.out.ps Imatge

Enrera


Obtenció del forward i el reverse per separat i en din-A3:

gff2ps -s a3 -f  -T AC090953_Reverse -C custfile -- AC090953.geneid.gff AC090953.genscan AC090953.blast.fixed.best.gff  > AC090953.fixed.outR.ps   [Resultat de les seqüències en reverse]

Imatge en Reverse

gff2ps -s a3 -r -T AC090953_Forward -C custfile -- AC090953.geneid.gff AC090953.genscan AC090953.blast.fixed.best.gff  > AC090953.fixed.outF.ps   [Resultat de les seqüències en forward]

Imatge en Forward

Enrera