Materials i mètodes


Materials

Shell
blastall → Programa que serveix per fer BLASTs.
parseblast → Programa que serveix per a modificar l'output que proporciona el BLAST.
fastasubseq → Programa per tallar una seqüència dins d'una altra més gran.
fastarevcomp → Programa per invertir seqüències a l'hora de treballar amb genewise d'strand negativa.
exonerate → Programa de predicció de gens en línia de comanda.
Internet
NCBI → Base de dades on-line que emmagatzema i actualitza constantment la informació referent, entre d'altres, a seqüències genòmiques en el GenBank, publica un índex d'articles científics referents a biomedicina, biotecnologia, bioquímica, genètica i genòmica en PubMed i realitza una recopilació de malalties genètiques humanes en l'OMIM, a més de recopilar dades biotecnològiques de rellevància en diverses bases de dades. Totes les bases de dades del NCBI estan disponibles en internet de manera gratuïta.
SelenoDB → Base de dades on-line de selenoproteïnes.
GeneWise → Programa de predicció de gens on-line.
ClustalW → Programa d'aliniament múltiple on-line.
SECISearch 2.19 → Programa on-line que identifica gens de selenoproteïnes de mamífers mitjançant el reconeixement dels elements SECIS segons la seva estructura primària i secundària.
tRNAscan-SE 1.21 → Programa on-line dissenyat per a localitzar gens de tRNA en seqüències d'àcids nucleics.

Mètodes

Per a començar a buscar al genoma de Leishmania infantum s'ha creat una base de dades amb tots els seus cromosomes, d'aquesta manera es accessible des de línia de comanda.

Es va partir de la base de dades de SelenoDB, d'on es va extreure un arxiu multifasta amb totes les seves proteïnes.


Homo sapiens SelP TR SelH1
eEFSec SelR1 - 3 Tetraodon nigroviridis SelK1
GPx1-8 SelS Sel15 Sel T
DI SelT Drosophila melanogaster Caenorhabditis elegans
MsrA SelU1 - 3 MsrA Sel15
SBP2 SelV SPS1-2 SelK
SPS1-2 SelW1 - 2 Sel15 SelR
Sel15 TR1-3 SelH1- 3 SelT1-2
SelH Pan troglodytes SelK1- 2 SelU
SelI GPx1-7 Sel T TR
SelK SPS1-2 Anopheles gambiae Saccharomyces cerevisae
SelM SelP MsrA MsrA
SelN Mus musculus SPS1-2 SelO
SelO MsrA Sel15 SelR


Degut a la gran quantitat d'informació a tractar es va proposar un procediment per a filtrar i tractar aquestes dades per a poder maniobrar amb elles amb més facilitat.

Protocol:
1. Es va començar per a fer un TBLASTN amb el programa BLASTALL des de la línia de comanda per mirar les proteïnes de SelenoDB al genoma de Leishmania infantum. Es va utilitzar el programa parseblast per a ordenar l'output.
[u30096.est12.alu.upf@am75689 Proteines]$ blastall -p tblastn -d ~/.novell-servers/REC-C1AU.UPF.ES/PUBLIC/FOLDERS/3361/12306-1/

disc8/disc8/genomes/L.infantum/genome -i SelB | perl parseblast -P -W
2. Es crea un programa en perl per a poder filtrar l'output que aconseguim al BLAST. Aquest programa ens mostra els identificadors de proteïna i cromosoma, i en el cas de tenir una U (selenociteïna) ens mostra la porció d'aliniament. [Veure programa]

3. De l'output filtrat mitjançant el programa perl, es decideix manualment els BLASTs que creu que ha d'analitzar. S'utilitzen els següents criteris de selecció:
  1. Es prendran màxim tres BLAST per proteïna.
  2. e-value > 0,01
  3. Score > 45
  4. Aliniament > 50% dels aminoàcids

4. Es fa una predicció amb exonerate des del shell per a acotar i verificar la zona del cromosoma on es farà la predicció final. Mitjançant el programa fastasubseq s'acota la zona desitjada.
[u30096.est12.alu.upf@am75689 predictions]$ /disc8/bin/exonerate/bin/fastasubseq -f /home/u30096.est12.alu.upf/Desktop/

cr34.fasta -s 1075000 -l 15000
5. La subseqüència cromosòmica es corre al programa GeneWise amb la seqüència de la proteïna desitjada per a fer-ne una predicció ja definitiva. D'aquest pas ja es treurà l'acotació final de la proteïna al genoma de l'organisme, la seqüència proteica i del cDNA.

Arribat a aquest punt es va meditar la opció d'ampliar les proteïnes a buscar en el genoma. Per un costat es va veure que mancaven algunes proteïnes de la maquinària o essencials per a la síntesi com serien PSTK, SECp43 i SelA. D'altra banda, es va creure interessant buscar les noves selenoproteïnes trobades recentment a Plasmodium (Lobanov et al) ja que és una espècie bastant pròxima (Sel1, Sel2, Sel3 i Sel4).

Amb les noves proteïnes es repeteix el procediment amb el protocol establert per les proteïnes de SelenoDB.

Una vegada predites totes les proteïnes, es realitza una cerca d'elements SECIS a la regió 3'UTR del gen. Per a realitzar la cerca es va acotar una regió de 5000pb que es va passar pel programa SECISearch.

A més, es fa un anàlisi amb tRNAscan per predir els possibles tRNA que hi hagi en el genoma i trobar aquell que contingui l'anticodó TCA d'una possible selenocisteïna. Per realitzar la cerca s'utilitzat una opció del programa que predia l'estructura sense tenir en compte l'anticodó, ja que la selenocisteïna no era trobada per defecte.


Tornar a la pàgina inicial

[Selenoproteïnes] [Leishmania infantum] [Resultats] [Discusió]