Selenoproteïna 1

Cerca en Protistes

El primer pas per la cerca de selenoproteïna 1 en els genomes dels protistes què han estat seqüenciats el darrer any ha estat fer un alineament d’ambdues seqüències amb el TblastN. Hem comprovat tots els E-values i no hem trobat cap hit significatiu. Considerem un hit significatiu aquell que té un valor menor de 10-14. A la següent taula representem els resultats.

Organisme E-value
Thalassiosira pseudonana 4,3
Phytophthora sojae 1,4
Phytophthora ramorum 0,64
Theileria annulata 0,24
Theileria parva 0,007
Babesia bovis 1,5
Entamoeba histolytica 0,23
Entamoeba terrapinae 0,069
Trypanosoma cruzi 1,00
Monosiga brevicollis 1,1
Giardia intestinalis 2,5

Llista dels protistes amb els valors de E-value després de l'alineament del genoma corresponent amb la seqüència proteica de Sel1 per mitjà del TblastN.

Tot i no trobar cap hit significatiu vam voler comprobar-ho. Vam agafar el valor més baix, que correspon a Theileria parva (0,007), i vam analitzar el hit obtingut seguint el procés estipulat fins obtenir un resultat negatiu, el qual ens confirma l'absència de la selenoproteïna1 en aquest organisme. L'exonerate ens ha creat un fitxer out en blanc, interpretant d'aquesta manera, que no ha trobat coincidències. En aquest moment, podem afirmar que no es troba selenoproteïna1 en cap dels protistes seqüènciats el darrer any.

Cerca en Plasmodium

Durant la recerca bibliogràfica de Sel1 (veure referència), vam veure que aquesta selenoproteïna ha estat descrita en algunes espècies del gènere Plasmodium. Per aquesta raó vam repetir el protocol en aquests protistes tot i no ser inclosos en la llista dels seqüenciats el darrer any. Veiem els resultats en la següent taula.

Organisme E-value
P.vivax 1·10-15
P.knowlesi 8·10-14
P.Berghei 6·10-11
P.chabaudi 5·10-11
P.yoelii 3·10-12
P.falciparum 3·10-28
P.gallinaceum 0,016

Valors de E-value de 7 espècies diferents del gènere plasmodium del alineament per TblastN dels seus genomes amb la seqüència de Sel1.

Observem que la Sel1 es troba present en la majoria de les espècies del gènere estudiat, tal com esperàvem. Inesperadament, P.gallinaceum és l’únic Plasmodium que presenta un E-value no significatiu. Els E-values de 10-11 i 10-12 es consideren significatius, tot i no entrar en el rang establert, ja que anteriorment ja s'ha confirmat la presència de Selenoproteïna 1 en aquests protistes. És per aquest motiu que vam decidir seguir el procés amb P.falciparum i P.gallinaceum paral·lelament per comprovar la presència o absència d’aquesta selenoproteïna. El motiu pel qual hem escollit l’espècie falciparum és perquè és la que presenta un E-value més significatiu, per tant, més fiable.

Hem seguit els mateixos passos amb les dues seqüències, però ens trobem que l’exonerate de P.gallinaceum no ens dóna cap resultat. Podem afirmar que, excepcionalment, P.gallinaceum, a diferència de les altres espècies del gènere plasmodium, no presenta Sel1.

Cerca en P.falciparum

Arribats a aquest punt seguim l’anàlisi amb la Selenoproteïna 1 de P.falciparum. El resultat de l'exonerate el podem veure en el següent link: P.falciparum.exonerate

Extraiem el fitxer.gff amb el fastaseqfrom i ens dóna el resultat del següent enllaç que correspon al cDNA de la selenoproteïna 1 predita: P.falciparum.cDNA

Per veure la seqüència proteica fem córrer el fitxer amb el cDNA al fastatranslate de manera que obtenim la seqüència proteica següent: P.falciparum.prot

A continuació, amb la seqüència de la proteïna predita i el programa T-COFFEE fem l'alineament per trobar les regions conservades. El resultat és el següent: P.falciparum.tcoffee

Per assegurar-nos de que realment la seqüència que hem trobat es correspon amb la selenoproteïna fem ús del blastp. Alhora, gràcies a aquest programa podem fer la cerca d'homòlegs.

Esquema de la Sintesi

Si introduim la seqüència de selenoproteïna predita de P.falciparum al blastp obtenim com a resultat varis alineaments, entre ells, amb un 100% d'identitat la Selenoproteïna Sel1 de P.falciparum. Entre els homòlegs trobem les possibles selenoproteïnes de les altres espècies de Plasmodium ( P.vivax, P.berghei. P.yoelii, P.knowlesi, P.chabaudi). Amb aquest assaig corroborem els nostres resultats anteriors (obtinguts amb TblastN i Exonerate), determinant que la Selenoproteïna 1 queda restringida al gènere Plasmodium a excepció de l'espècie P.gallinaceum.


Esquema de la Sintesi

Per acabar d'afinar l’anàlisi podem buscar elements que són imprescindibles per la síntesi d'una selenoproteïna. Un d'aquests elements és el SECIS. Tota selenoproteïna disposa d’un element SECIS que té una estructura 3D determinada. SECISearch es basa en aquest caràcter i en la seqüència consens, podem trobar seqüències que es comporten com element SECIS. És evident que si trobem, en la següència de selenoproteïna, un element SECIS podem dir que es tracta d’una cerca positiva, de la selenoproteïna1.

Si utilitzem el programa de cerca de SECIS els resultats que obtenim per P.falciparum són positius. Com era d'esperar, trobem un element SECIS al cromosoma 14:





1 Pfa3D7|chr14|2002.10.03|GENOMIC|TIGR:subseq(131554 10000): 1737 1840 
UAUAUAUAUU UUAAAUG AAUAUACUCAUAA AUGAU UUGCUAAUUUGAA AA UACAGAAAAAUAAAUG 
UAUAAAUUAGUAA UGAG AAAU GAUGUUA UAUUCAUUUA

Sel S

Cerca en Protistes

En primer lloc vam realitzar un TblastN per alinear la seqüència de la selenoproteïna S amb els 11 genomes dels organismes seqüenciats aquest últim any. A continuació trobem una taula amb els resultats, on mostrem el menor E-value per a cada un dels organismes.

Organisme E-value
Thalassiosira pseudonana 0,001
Phytophtora sojae 0,011
Phytophtora ramorum 0,001
Theileria annulata 0,85
Theileria parva 0,0,10
Babesia bovis 8·10-4
Entamoeba histolytica 0,002
Entamoeba terrapinae 0,003
Trypanosoma cruzi 0,026
Monosiga brevicollis 0,008
Giardia intestinalis 0,009

Llista dels protistes amb els valors de E-value després de l'alineament del genoma corresponent amb la seqüència proteica de SelS per mitjà del TblastN.

Com es pot observar, no vam trobar cap E-value significatiu. Aleshores, vam decidir canviar la selenocisteïna de la seqüència query per un asterisc en comptes d'una X. D'aquesta manera, podem obtenir millors alineaments. Però tot i això no vam observar cap canvi en els E-value dels organismes.

Cerca en B.Bovis

Per aquesta raó, vam decidir continuar amb el protocol per a realitzar l'Exonerate amb l'organisme que posseïa el hit amb l'E-value més baix de tots, Babesia bovis (8·10-4), tot i que no era molt bo. Després de dur a terme tot el procés, l'Exonerate ens va proporcionar un arxiu output en blanc. Per tant, podem afirmar que Babesia bovis no presenta la selenoproteïna S en el seu genoma.

Cerca en M.Brebicollis

Aleshores vam començar a qüestionar-nos quina era la dificultat afegida que ens presentava SelS. La seqüència de SelS que disposem prové de Mus musculus, cosa que ens comporta alguns problemes. En primer lloc, és difícil fer bons alineaments d'una seqüència d'un mamífer amb el genoma d'un protista degut a la seva llunyania filogenètica. Com a conseqüència d'aquest fet, els resultats del TblastN són més difícils d'interpretar. Tot i tenir uns E-values elevats per a l'alineament, no podem descartar els hits des d'un inici pel seu valor ja que aquest valor major pot ser degut a les diferències de seqüència entre mamífers i protistes, no necessàriament perquè SelSno estigui present en aquest organisme. Per aquesta raó, vam arribar a la conclusió que havíem de revisar un per un cada hit per comprovar si hi havia alguna selenocisteïna alineada.

Després de revisar els hits, només vam trobar en un cas dos asteriscs alineats, a Monosiga brevicollis. Per tant, podríem haver trobat la nostra selenoproteïna en un dels organismes seqüenciats el 2009. A més, vam trobar en diversos casos la selenocisteïna alineada amb una glicina (G), però vam descartar aquests alineaments degut a que en la regió que envolta la selenocisteïna a la seqüè de Mus musculus hi havia diverses glicines i ens alineava aquestes glicines amb la seqüència de l'organisme ja que aquests presentaven una regió amb abundància de glicines.

El hit que presenta Monosiga brevicollis amb els dos asteriscs alineats no era el de valor més baix, tenia un valor de 0,15. Tot i això, vam dur a terme el protocol amb l'organisme Monosiga brevicollis per comprovar la presència de SelS en el seu genoma. Un cop realitzat el fastaindex, fastafetch, fastasubseq i l'Exonerate, aquest ens dóna un arxiu output en blanc. Vam modificar les opcions de l'Exonerate per tal de maximitzar les possibilitats d'alineament. En primer lloc, vam afegir la comanda -E, que ens realitza un Exonerate més exhaustiu i per tant ens donarà el resultat òptim per al model donat.

$ exonerate -E -m p2g --showtargetgff -q SelS.fa -t monosigagenomic.fa 
> exoneratemonosiga.fa

Amb aquesta nova comanda, tampoc vam obtenir resultats positius, l'Exonerate ens va proporcionar de nou un arxiu output en blan. Per últim, vam fer córrer l'Exonerate amb la comanda p2g:bestfit, que ens inclou la proteïna completa en l'alineament.

$ exonerate -E -m protein2genome:bestfit --showtargetgff -q SelS.fa -t 
monosigagenomic.fa > exoneratemonosiga.fa

Però aquesta nova comanda tampoc ens va aportar cap nou resultat.

Com no vam obtenir cap mena de resultat amb l'Exonerate vam dur a terme el Genewise. Amb el Genewise vam obtenir un alineament de 60 nucleòtids que s'acabava just en el codó anterior al codó TGA que codificaria la selenocisteïna. Però tot i obtenir aquest alineament, el vam descartar com a possible selenoproteïnaS degut a que 60 nucleòtids és un alineament massa curt per poder codificar una proteïna sencera.

Per tant, podem afirmar que SelS no està present en cap dels organisemes que han estat seqüenciats el darrer any. En el cas de Monosiga brevicollis, es podria continuar l'estudi amb altres eines mé complexes per tal de verificar més profundament la presència o absència d'aquesta selenoproteïna.