Odobenus rosmaurs divergens

DISCUSSIÓ

Selenoproteïnes i homòlogues de cisteïna

Família DI

La família DI no presenta cap selenoproteïna anotada a selenoDB en Felis catus, per tant tot i que aquesta espècie està més pròxima filogèneticament a l'Odobenus osmarus divergens, ho compararem amb l’Homo sapiens ja que és el mamífer amb el genoma millor anotat.


DI1

Per DI1, obtenim 6 hits a través del blast, dels quals en descartem 3 pel baix percentatge d’identitat que presenten. Dels 3 restants, ens quedem amb els dos que tenen l’e-value més petit, els quals es troben en el mateix Scaffold, KB228992.1. D’aquests 2 hits restants (amb coordenades 3228246-3228569 i 3240928-3241143), la identitat i els e-value són molt semblants. A més, els dos alineaments són bons però mirant el subseq de cadascun observem que la regió on es troba el hit amb les coordenades 3240928-3241143 està millor anotat. Per aquest motiu escollim aquest hit. Observant el T-coffee del hit escollit no hi ha X alineades entre les dos seqüències. Per tant, creiem que pot haver hagut una delecció en el genoma de la morsa pel que fa a la regió on es troba la selenocisteïna en humà. Una altra possibilitat seria que com que el genoma d’Odobenus rosmarus divergens no està tan ben anotat, no estiguem veient una hipotètica selenocisteïna en la morsa. A més, observem que la part de la seqüència que es troba alineada entre les dues espècies presenta una regió amb alguns gaps, indicant que pot ser que s’hagi produït una inserció en Homo sapiens o una delecció en Odobenus rosmarus divergens.


Pel que fa a l’exonerate s’ha predit una proteïna codificada per un gen d’1 exó, amb un raw score de 459.

Tenint en compte la predicció dels elements SECIS en el hit escollit, s’ha trobat SECIS amb un grau B. Tot i això, no podem afirmar que sigui una selenoproteïna degut al que hem comentat abans.

Amb aquesta informació, només podríem dir que es tracta d’una proteïna homòloga.



DI2

Per la proteïna DI2, obtenim 5 hits a través del blast, dels quals descartem 3 pel baix percentatge d'identitat que presenten. Dels dos hits restants (amb coordenades 952443-953018 i 961022-961267), que pertanyen al mateix Scaffold KB229801.1, hem buscat els alineaments en el T-coffee. En els dos possibles hits que hem escollit, veiem la presència de X alineades entre les dues seqüències. Tot i que els dos hits presenten alineaments, en el segon hit (961022-961267) hi ha alineament de tota la proteïna mentre que en el primer hit hi ha un gap molt gran en la seqüència de l’Odobenus rosmarus divergens. Per aquest motiu hem escollit aquest hit. En aquest cas, en el hit escollit veiem altres X en la seqüència de la morsa que podrien correspondre a possibles selenocisteïnes presents en Odobenus rosmarus divergens però no en Homo sapiens. A continuació, s’ha buscat la predicció dels elements SECIS en aquest hit mitjançant SECISearch3 i Seblastian, i se n’ha trobat 1.


La proteïna predita mitjançant exonerate està formada per 3 exons i 2 introns, i presenta un raw score de 1318. La selenocisteïna alineada per les dues espècies, es troba en l’exó 3 en la posició 170 de la proteïna. S’observa una altra selenocisteïna en la seqüència de l’humà en l’exó 2 i en la posició 90 de la proteïna que no s’alinea amb cap selenocisteïna ni cap cisteïna amb la seqüència proteica de la morsa. Per altra banda, en l’exó 2, en la posició 77, s’observa una possible selenocisteïna només present en la nostra espècie. Per tant, pot ser que la nostra espècie hagi perdut alguna selenocisteïna present en humà, i que l’humà hagi perdut alguna selenocisteïna que sí que s’ha conservat en la morsa.


Pel que fa a l’element SECIS predit, és de grau A.

Havent vist per tant l’alineació per T-coffee, la predicció d’exonerate i l’element SECIS, queda validada la teoria de que DI2 és una selenoproteïna en Odobenus rosmarus divergens.



DI3

Per la selenoproteïna DI3, obtenim 5 hits a través del blast. Escollim el primer hit ja que és el que presenta una identitat notablement més alta. Aquest hit (amb les coordenades 2199238-2200035) pertany a l'Scaffold KB228920.1. En el T-coffee observem un bon alineament de les dues seqüències i veiem que la X està alineada. A continuació, s’ha buscat la predicció d’elements SECIS mitjançant SECISearch3 i Seblastian, però no s’ha trobat cap d’aquests elements. Això podria ser a causa de que s’hagi perdut durant l’evolució en l’Odobenus rosmarus divergens o perquè l’element SECIS es troba lluny del nostre hit i no s’hagi pogut detectar.
La proteïna predita mitjançant exonerate només conté un exó, i presenta un raw score de 1413. Trobem la selenocisteïna en la posició 144 de la proteïna.



En conclusió pel que fa a la família DI, veiem que hi ha diferència entre elles, en Odobenus rosmarus divergens DI1 ja no és selenoproteïna, en canvi en les altres dues sí que es conserva aquesta en les dues espècies estudiades, encara que en DI3 no trobem element SECIS. A més, pel que fa a DI2 hem vist com no només hi havia una possible selenocisteïna al llarg de la seqüència estudiada, sinó que en tenim més que no estan presents en Homo sapiens.


Família GPx

En aquest cas tenim un conjunt d’isoenzims que formen part de la mateixa família, les Gluthatione peroxidases. Hem observat que en humans n’hi ha 8 de les quals 5 corresponen a selenoproteïnes i les altres 3 són proteïnes de maquinària. El fet que siguin d’una mateixa família provoca que hi hagi un elevat grau d’homologia, això implica que els hits que obteníem a través del blast de les diferents GPxs en gran part es trobaven en els mateixos Scaffolds, tot i que amb diferents valors de identitat i e-value.



GPx1

Per aquesta proteina utilitzem la query de l’Homo sapiens, ja que el genoma del Felius catus no presenta anotació per aquesta. Al realitzar el blast hem trobat múltiples hits. Molts d’ells es trobaven en els mateixos Scaffolds i ens hem basat amb el valors d’e-value i el % d’identity, així com la llargada i les posicions de la query per decidir amb quin d’ells ens quedàvem. És així que hem escollit el de l’Scaffold KB229954.1 que presentava el e-value més petit, amb coordenades 371840-372385.


Per problemes en el programa, és l’única proteïna que ens dóna error a l’hora de crear el T-coffee. Tot i això, sí que tenim exonerate. En la proteïna predita per exonerate conté només 1 exó i cap intró, amb un raw score de 831. En aquest alineament veiem com s’alinea la selenocisteïna de la seqüència humana amb una selenocisteïna amb la seqüència de la morsa, en la posició 49. En la predicció d’elements SECIS per SECISearch3, s’ha trobat un element SECIS de grau B.

Per tant, podríem dir que GPx1 és una selenoproteïna en la nostra espècie d’estudi.



GPx2

Per aquesta proteïna utilitzem la query de l’Homo sapiens, ja que el genoma del Felius catus no presenta anotació per aquesta. Realitzem el blast i obtenim múltiples hits com en el cas de GPx1, molts d’ells es troben en Scaffolds diferents i és mitjançant l’observació dels valors d’e-value, d’identity i les posicions d’inici i final de la query que determinen quin podria ser el millor hit per alinear i observar-ne el T-coffee. És així que seleccionem l’Scaffold KB229305.1 en el qual hi ha dos hits, dels quals escollim el que presenta una identity major, amb posicions 2027962 a 2028183. Triem aquest perquè observant l’alineament realitzat per T-coffee veiem com les X de totes dues queries coincideixen. A continuació amb l’ajuda de SECISearch3 i Seblastian predim l’element SECIS a la posició 3’, i n’obtenim dos de diferents.


Una vegada escollit el hit, amb l’exonerate determinem que és una sola proteïna formada per 2 exons i 1 intró, amb un raw score de 960. Veiem que la proteïna predita presenta una selenocisteïna alineada entre les dues seqüències a l’exó 1 en la posició 40 de GPx2.

Pel que fa als dos elements SECIS predits, un és de grau A i l’altre de grau B.

És gràcies a tota aquesta informació que podem determinar la presència d’una selenoproteïna en Odobenus rosmarus divergens.



GPx3

Pel que fa a GPx3 la trobem a Felis catus, però la proteïna està mal anotada ja que observant T-coffee veiem que no comença per metionina. Aleshores agafem la proteïna anotada per Homo sapiens i veiem també com en les altres GPx’s en surten múltiples hits en diferents Scaffolds. Per % d’identitat, e-value, posicions d’inici i final i llargada de la query alineada seleccionem uns dels Scaffolds i un dels hits. En aquest cas hem agafat el hit que va de 2628842-2629072 de l’Scaffold KB229053.1, ja que tenia una identitat elevada i un e-value més petit. Per altra banda observant l’alineament fet per T-coffee veiem la coincidència de la X entre les dues espècies, donant la possibilitat de la presència de selenocisteïna en l’Odobenus rosmarus divergens. Al realitzar Seblastian i SECISearch3, no podem predir cap element SECIS a 3’ de la nostre proteïna.


Per l'exonerate del hit escollit predim una proteïna que presenta 4 introns i 5 exons i un raw score de 1069. Conté el codó UGA a la posició 74, en l’exó 1.

Aquest resultat pot indicar que hi ha hagut la pèrdua de la selenoproteïna en Odobenus rosmarus divergens o podria ser que l’element SECIS es trobi lluny del nostre hit i no l’haguem pogut detectar. Per tant, no podem afirmar, tot i que la X estigui alineada entre les dues espècies, que GPx3 per Odobenus rosmarus divergens sigui una selenoproteïna, per tant, només podem dir que és una homòloga.



GPx4

Pel que fa a GPx4 la trobem a Felis catus, però la proteïna està mal anotada ja que observant T-coffee veiem que no comença per metionina. Aleshores agafem la proteïna anotada per Homo sapiens i veiem també com en les altres GPx’s en surten múltiples hits en diferents Scaffolds. Per % d’identitat, e-value, posicions d’inici i final i llargada de la query alineada seleccionem un dels Scaffolds i un dels hits. En aquest cas trobem un hit que va de 4512468 a 4512566 del Scaffold KB228918.1 que presenta un e-value més petit que la resta de hits aconseguits i un % d’identitat superior també. Per altra banda observant l’alineament fet per T-coffee veiem la coincidencia de les X entre les dues seqüències, donant la possibilitat de la presència de selenocisteïna en Odobenus rosmarus divergens. A continuació amb l’ajuda de SECISearch3 i Seblastian, predim un element SECIS a la posició 3’.


Per exonerate del hit escollit predim una proteïna que presenta 5 introns i 6 exons i amb un raw score de 837. En aquesta, el codó UGA es troba a l’exó 2 a la posició 73 de la proteïna.

Pel que fa a l’element SECIS que obtenim, presenta grau A i es troba a 426 nucleòtids de Sec - UGA.


En conclusió podem dir que GPx4 és una proteïna conservada, la qual tant en Homo sapiens com en Odobenus rosmarus divergens presenta una selenocisteïna i elements SECIS, per tant es tracta d’una selenoproteïna en les dues espècies.



GPx5

Per aquesta proteïna utilitzem la query de l’Homo sapiens, ja que el genoma del Felius catus no presenta anotació per aquesta. Realitzem el blast i obtenim múltiples hits en diferents Scaffolds. Per % d’identitat, e-value, posicions d’inici i final i llargada de la query alineada seleccionem uns dels Scaffolds, i dins d’aquest, un dels hits. En aquest cas escollim un hit que va de 763436 - 763657 de l’Scaffold KB229423.1. Observem T-coffee per aquest hit i veiem que no hi ha presència de selenocisteïna ni en Odobenus rosmarus divergens ni en Homo sapiens. Tot i això, en la búsqueda d’elements SECIS en posició 3’ mitjançant SECISearch3 i Seblastian, en trobem un.


Per tant, amb l’exonerate no veiem cap codó UGA present en la proteïna predita en cap de les dues espècies. Aquesta proteïna predita, està codificada per 5 introns i 6 exons, i presenta una raw score de 837.

L’element SECIS a la posició 3’ predit, és de grau B, però com que no hi ha cap selenocisteïna, no podem dir que sigui una selenoproteïna tot i contenir un element SECIS.

Pot ser que durant l’evolució, en totes dues espècies s’hagi perdut la selenocisteïna i no l’element SECIS, i per això tot i no veure selenocisteïna veiem un element SECIS. Veiem aleshores com és una proteïna conservada en les dues espècies, i que en totes dues es tracta d’un homòleg en cisteïna.



GPx6

Pel que fa a GPx6 la trobem a Felis catus, on es tracta d’una proteïna homòloga en cisteïna. Per altra banda, la proteïna està mal anotada ja que observant T-coffee veiem que no comença per metionina. Aleshores agafem la proteïna anotada per Homo sapiens,on sí que és una selenoproteïna, i veiem també com en les altres GPx’s en surten múltiples hits en diferents Scaffolds. El hit escollit es troba a l'Scaffold KB229423.1 entre 801662 i 801865, presenta un e-value petit respecte els altres hits i una identitat major. Observem aleshores l’alineament realitzat per T-coffee el qual és bo, però veiem que la X d’Homo sapiens està alineada amb Cys d’Odobenus rosmarus divergens. Tot i això, hem observat que en introduir el fasatsubseq del hit escollit en Seblastian i SECISearch3, s’ha trobat un element SECIS en 3’ de grau B.


Observem la proteïna predita per aquest hit amb exonerate i veiem que es tracta d’una proteïna de 6 exons i 5 introns amb un raw score de 914. Tal i com s’ha comentat, veiem que la selenocisteïna de la seqüència humana, es troba alineada amb una cisteïna de la seqüència de la nostra espècie, per tant no observem cap selenocisteïna en Odobenus rosmarus divergens.


En conclusió podríem dir que la proteïna estudiada correspondria a un homòleg en cisteïna respecte l’Homo sapiens, la qual potser per evolució ha perdut la selenocisteïna que tenia en aquesta proteïna, ja que sí que manté l’element SECIS. Per tant, podríem dir que la pèrdua de la selenocisteïna en aquesta proteïna, és probable que es donés abans que divergissin Felis catus i Odobenus rosmarus divergens, ja que en tots dos GPx6 es tracta d’una proteïna homòloga en cisteïna.



GPx7

Per aquesta proteïna utilitzem la query de l’Homo sapiens, ja que el genoma del Felius catus no presenta anotació per aquesta. En els resultats del blast obtenim múltiples hits en diferents Scaffolds. Per % d’identitat, e-value, posicions d’inici i final i llargada de la query alineada seleccionem uns dels Scaffolds i dins d’aquest, un dels hits. En aquest cas seleccionem el hit que presenta un e-value més petit, i presenta una identitat molt elevada que correspon al Scaffold KB228992.1 i va des de 2061846 a 2062115. Observem T-coffee per aquest hit i veiem un bon alineament, tot i que no hi ha presència de selenocisteïna ni en Odobenus rosmarus divergens ni en Homo sapiens (proteïna homòloga en cisteïna). Quan predim elements SECIS a la posició 3' mitjançant Seblastian i SECISearch3, no en trobem cap. Podria ser aleshores que tot i que la proteïna estigui conservada l’element SECIS es troba fora de la seqüència que nosaltres hem utilitzat per analitzar amb SECISearch3, o bé que aquest s’hagi perdut al llarg de l’evolució.

Amb l’exonerate veiem que la proteïna predita conté 2 exons i 1 intró i presenta un raw score de 638. Tal i com hem vist en el T-coffee, en l’exonerate no hi veiem cap selenocisteïna, és a dir, cap codó UGA en cap de les dues espècies.


Amb tots aquests resultats, podem dir que en Odobenus rosmarus divergens GPx7 també és una proteïna homòloga en cisteïna. Per tant, aquesta selenocisteïna segurament s’ha perdut al llarg de l’evolució, així com el seu element SECIS (pot ser que hi sigui però no el trobem). O bé, en altres espècies aquesta proteïna ha esdevingut una selenoproteïna, mentre que ni en Homo sapiens ni en Odobenus rosmarus divergens ho ha fet.



GPx8

Per aquesta proteïna utilitzem la query de l’Homo sapiens, ja que el genoma del Felius catus no presenta anotació per aquesta. Realitzem el blast i obtenim múltiples hits en diferents Scaffolds. Mitjançant l’observació dels valors d’e-value, d’identitat i les posicions d’inici i final de la query que determinen quin podria ser el millor hit per alinear correspon al Scaffold KB230075.1 desde 756863 a 757126. A través de T-coffee veiem que no hi ha selenocisteïna en cap de les dues queries (proteïna homòloga en cisteïna). Quan predim elements SECIS a la posició 3’, no en trobem cap. Podria ser aleshores que tot i que la proteïna estigui conservada l’element SECIS es troba fora de la seqüència que nosaltres hem utilitzat per analitzar amb SECISearch3 i Seblastian, o bé que aquest s’hagi perdut al llarg de l’evolució.



Amb l’exonerate veiem que la proteïna predita conté 2 exons i 1 intró i presenta un raw score de 671. Tal i com hem vist en el T-coffee, en l’exonerate no hi veiem cap selenocisteïna, és a dir, cap codó UGA en cap de les dues espècies. Per altra banda, cal comentar que la proteïna predita no comença per metionina, i observant els resultats del T-coffee, podem comentar que probablement aquesta regió del genoma de la morsa no està ben anotada. Una altra hipòtesis és que el genoma de la morsa sí que està ben anotat, i que per tant, s’ha produït una delecció en aquesta regió genòmica de la nostra espècie.


Amb tots aquests resultats, podem dir que en Odobenus rosmarus divergens GPx8 també és una proteïna homòloga en cisteïna. Per tant, aquesta selenocisteïna segurament s’ha perdut al llarg de l’evolució, així com el seu element SECIS (pot ser que hi sigui però no el trobem). O bé, en altres espècies aquesta proteïna ha esdevingut una selenoproteïna, mentre que ni en Homo sapiens ni en Odobenus rosmarus divergens ho ha fet.


En conclusió, hem vist que la família GPx és gran i que encara que totes les proteïnes que en formen part són Glutatió peroxidases, totes són diferents entre elles. Algunes són selenoproteïnes conservades en les dues espècies comparades, com GPx1, GPx2, GPx3 i GPx4. També hi ha les homòlogues en cisteïna humanes que es conserven en Odobenus rosmarus divergens com GPx5, GPx7 i GPx8. I finalment un cas curiós, el de la GPx6 la qual és selenoproteïna en humà, però en Odobenus rosmarus divergens i Felis catus és homòloga en cisteïna, és a dir han perdut el grup seleni al llarg de l’evolució però abans que divergissin una de l’altre ja que es conserva en totes dues.


Per altra banda, es pot veure que el blast de GPx3, GPx5 i GPx6 ens dóna possibles hits en els mateixos Scaffolds i amb coordenades similars d'una mateixa espècie. Això es correspon a la duplicació de GPx3 que va originar GPx5 i GPx6 durant l'evolució tal i com s'ha vist en estudis anteriors.



MsrA

Pel que fa a MsrA la trobem present tant en Homo sapiens com en Felis catus. En aquest útlim cas, la proteïna està mal anotada ja que observant T-coffee veiem que la seqüència no comença per metionina. Per aquest motiu, ho compararem amb Homo sapiens.


Per aquesta proteïna obtenim 7 hits a través del blast. Segons la identitat i els e-values hem escollit el hit amb les coordenades 184993-185157 de l’Scaffold KB229723.1. El hit escollit presenta molt bona alineament de seqüència i no s’observa en el T-coffee cap X per cap de les seqüències (proteïna homòloga en cisteïna). A continuació, s’ha buscat la predicció dels elements SECIS en el hit escollit mitjançant SECISearch3 i Seblastian, però no se n’ha trobat cap.

Pel que fa a l’exonerate, s’ha predit una proteïna codificada per un gen d’1 exó, amb un raw score de 277, on lògicament no hi trobem cap codó UGA.


Amb tots aquests resultats, podem dir que en Odobenus rosmarus divergens MsrA també és una proteïna homòloga en cisteïna. Per tant, aquesta selenocisteïna segurament s’ha perdut al llarg de l’evolució en les tres espècies, així com el seu element SECIS (pot ser que hi sigui però no el trobem). O bé, en altres espècies aquesta proteïna ha esdevingut una selenoproteïna, mentre que ni en Homo sapiens, ni en Felis catus, ni en Odobenus rosmarus divergens ho ha fet. Per tant, MsrA es troba conservada en aquestes tres espècies.



Sel15

Aquesta proteïna la trobem tant en humà com en gat, però en aquesta última espècie no està ben anotada així que nomès analitzarem els resultats obtinguts comparant amb la query humana. Escollim un dels hits obtinguts amb el blast segons e-value, identitat, llargària del hit i alineament, aquest es troba a l'Scaffold KB229690.1 amb les coordenades 131363 - 131542. Amb T-coffee aconseguim un alineament correcte amb un gap al final d’aquest, que podria ser degut a la delecció d’aquesta regió en la morsa o a una anotació incorrecte d'aquesta espècie. Veiem que al llarg de l’alineament trobem una X en morsa alineada amb una L de l'humà i més endavant, dues X alineades.

Aquesta informació es suporta amb els resultats obtinguts amb exonerate on veiem que la proteïna predita presenta 2 exons i 1 intró i té un raw score de 665. Observem també que hi ha les X’s alineades de T-coffee corresponents a un codó UGA a la posició 94, on es localitza la selenocisteïna. Per altre banda, hi ha també una possible selenocisteïna a la posició 47 només a la morsa, ja que a humà es correspon a Leu.

Al realitzar Seblastian i SECISearch3 no predim cap element SECIS, això podria indicar que no és una selenoproteïna o que l’element SECIS es troba massa lluny del nostre hit i no l'hem pogut detectar.



SelH

En aquest cas tenim la proteïna anotada tant per Homo sapiens com per Felis catus , és per això que en parlarem de totes dues, però cal comentar primer que en el cas del gat, per T-coffee l’inici de l’alineament no presenta Met indicant un problema amb l’anotació del genoma del gat. En tots dos casos només obtenim un hit que es troba a l'Scaffold K229300.1 a les coordenades 607472 - 607834 en comparació amb query humana i en el mateix Scaffold i coordenades en gat. Pel que fa a T-coffee els alineaments són tots dos correctes, amb l’única diferència de la mala anotació esmentada anteriorment. Hi ha dues X’s alineades tant respecte l’humà com el gat.

Per exonerate la proteïna predita en humà presenta 3 exons i 2 introns amb un raw score de 496 i la presència d’una possible selenocisteïna a la posició 44, un codó UGA. Pel gat l’inici de la proteïna predita no està alineada, segurament per problemes en l’ensamblatge del seu genoma, tot i això presenta 2 exons i 1 intró amb un raw score menor de 321.

A través de SECISearch3 i Seblastian no predim cap element SECIS.

En conclusió, segons els resultats obtinguts veiem la possibilitat de que s’hagi conservat la selenoproteïna en Odobenus rosmarus divergens, però al no predir element SECIS podria ser que s’hagi perdut la capacitat de sintetitzar aquesta selenoproteïna o també podria ser que el nostre element SECIS es trobi massa lluny del hit i no s’hagi pogut detectar.



SelI

La Selenoproteïna I la trobem tant en Felis catus com en Homo sapiens. En el cas gat no està ben anotada, ja que la seqüència de la proteïna no comença amb metionina, i per això ens fixem fonamentalment en la SelI humana.


Pel que fa a l'humà, trobem 10 possibles hits, dels quals hem triat aquell que presentava un major percentatge d'identitat, un menor e-value i el millor alineament de T-coffee. Per això hem triat el hit amb coordenades 2561219-2561491 en l'Scaffold KB228913.1. En aquest hit hi veiem la X alineada entre les dues seqüències. Tot i això, quan mirem el T-coffee observem també que l’inici de la seqüència de la morsa hi ha molts gaps. Per tant, pot ser que s'hagi produït una delecció en la morsa, de manera que segurament s'ha perdut una part de la proteïna. Enlloc de la delecció podria ser que l’ensamblatge del genoma d’estudi no s’hagués realitzat correctament, i per això la proteïna predita de la morsa no comença per metionina. Tot i no tenir una bona predicció de la proteïna en l’Odobenus rosmarus divergens, podem veure igualment que més endavant a la proteïna, hi ha un alienament de selenocisteïnes. A més, utilitzant Seblastian i SECISearch3, hem vist que presenta un element SECIS.


Per exonerate del hit escollit veiem que la proteïna predita presenta 6 exons i 5 introns i una raw score de 1443. Aquesta proteïna que hem predit conté un codó UGA a l'exó 6 en la posició 386 de la SelI.

Pel que fa a l'element SECIS en 3' predit, és de grau B i es troba a 1435 nucleòtids de Sec – UGA.


Per tant, tenint en compte que la seqüència proteïca d’Odobenus rosmarus divergens té una selenocisteïna, i que s’ha detectat un element SECIS, podríem dir que SelI és una selenoproteïna en la nostra espècie d’estudi. Tot i això, degut segurament a la mala anotació del genoma de la morsa, no podem fer una bona predicció de la proteïna en la nostra espècie, ja que no comença per metionina.


Per altra banda, creiem que si estigués millor anotat el genoma del Felis catus, trobaríem una selenoproteïna homòloga amb Odobenus rosmarus divergens, ja que en el T-coffee del hit d'elecció, ens mostra un bon alineament, on s'alineen les X, i a més hi trobem un element SECIS.



SelJ

La selenoproteïna J només la trobem al Felis catus, mentre que no en Homo sapiens. Per aquesta proteïna només trobem 2 possibles hits en el blast, els dos situats a l'Scaffold KB229027.1. En aquest cas, veiem que tenen el mateix e-value, però per altra banda un presenta el doble d'identitat que l'altre, que a la vegada presenta un hit més llarg. És per això que triem el hit amb la identitat més alta, és a dir el de coordenades 2241351-2241467. No obstant, aquesta selenoproteïna no està ben anotada en Felis catus, ja que veiem en el T-coffee que no comença per metionina. Tot i això, hem observat que en Odobenus rosmarus divergens hi ha més selenocsiteïnes que en Felis catus i que no hi ha selenocsiteïnes alienades entre les dues espècies. El fet que la selenocisteïna present en Felis catus no estigui alineada entre les dues espècies, pot ser degut a la mala anotació d’aquesta proteïna, ja que veiem que l’alineament entre les dues espècies no és massa bo en general. Cal comentar que una de les X presents només en la seqüència d’Odobenus rosmarus divergens, està alineada amb una cisteïna de Felis catus. Això podria indicar que en l’evolució de Felis catus, s’ha perdut aquella selenocisteïna. Pel que fa a les altres X de la nostra espècie no alineades amb cisteïna, pot ser que o bé les hagi perdut el gat, o bé que hagin aparegut en la nostra espècie selenocisteïnes noves a la seqüència de la proteïna. Per altra banda, utilitzant SECISearch3 i Seblastian, hem observat la presència d'un element SECIS.

Per exonerate del hit escollit veiem que la proteïna predita presenta 2 exons i 1 intró. Aquesta proteïna que hem predit conté un codó UGA a l'exó 2 en la posició 59 de la SelJ i presenta un raw score de 243. Tot i això, veiem que en l’exonerate no es produeix el mateix alineament que en el T-coffee, degut a la mala anotació del genoma de Felis catus. Per tant, no sabem quin dels dos alineaments seria el que ens podria donar unes conclusions més vàlides.

Pel que fa a l'element SECIS en 3' predit per SECISearch3 és de grau B.


Vist això, podem dir que tot i que la proteïna de Felis catus no estigui ben anotada, havent trobat selenocisteïnes en la seqüència de SelJ de la morsa i un element SECIS, podríem dir que SelJ segurament es tracta d’una selenoproteïna en Odobenus rosmarus divergens. Tot i això, degut a la mala predicció de la proteïna i els mals alineaments, no podem treure una conclusió massa clara de SelJ.



SelK

La Selenoproteïna K la trobem conservada tant en Felis catus com en Homo sapiens. En aquest cas, ens fixarem sobretot en la SelK del gat a l'hora de comparar-ho amb la morsa, ja que sí que comença amb metionina i es troba més a prop filogenèticament.

Observant la identitat dels hits, els e-values i els alineaments amb T-coffee, hem escollit el hit que es troba a l'Scaffold KB230026.1 amb les coordenades 324437-324622. En l’arxiu de T-coffee, veiem una X alienada entre les dues seqüències, tot i això, l’alineament que es produeix no és massa bo. Per altra banda, amb l’ús de Seblastian i SECISearch3 es detecta la presència d'un element SECIS.

Per exonerate del hit escollit veiem que la proteïna predita presenta 1 exó i cap intró. Aquesta proteïna que hem predit conté un codó UGA a l'exó 1 en la posició 92 de la SelK i presenta un raw score de 446.

Pel que fa a l'element SECIS en 3' predit és de grau A.


Tot i que l’alineament no és massa bo, sí que veiem que s’alinea una selenocisteïna entre les dues espècies i que hi trobem un element SECIS. Per tant, podríem dir que SelK és una selenoproteïna en l’Odobenus rosmarus divergens.

Pel que fa a la comparació amb l'humà, hem escollit el hit que es troba a l'Scaffold KB230026.1 amb les coordenades 324437-324622. En el T-coffee d'aquest hit no veiem X alineades, i també veiem X en la seqüència de la morsa. Tot i això, en l’exonerate sí que veiem una selenocisteïna alineada i cap altra selenocisteïna en la morsa. Per altra banda, no veiem SECIS, podent ser que s’hagi perdut o bé que estigui massa lluny del hit i no el detectem. Per tant, quan ens fixem en humà no podem determinar si en la morsa SelK es tracta d'una selenoproteïna.



SelM

La selenoproteïna M la trobem conservada en Felis catus i en Homo sapiens . Veiem que en el gat aquesta proteïna està ben anotada, i per això ens fixarem fonamentalment en Felis catus ja que és més proper a nivell filogenètic.


En el cas del blast utilitzant com a referència el Felis catus, només tenim dos possibles hits situats a l'Scaffold KB228986.1. Tots dos hits presenten el mateix e-value, i per tal d'escollir-ne un, hem escollit aquell hit amb una identitat major i un millor alineament en T-coffee. Per això, triem el que es troba en les coordenades 990995-991072. Observant el T-coffee, veiem que les X estan alineades entre les dues espècies. Cal comentar que hi ha un gap molt gran al final de la seqüència de la morsa. Això ens indicaria que o bé s’ha produït una delecció d’aquesta regió en la nostra espècie, o bé, més probablement, sigui degut a la mala anotació del genoma de la morsa. Per altra banda, no trobem element SECIS en aquest cas en la búsqueda amb SECISearch3 i Seblastian. Això podria deixar-nos dues opcions, la primera és que aquest element SECIS s'hagi perdut en l'evolució d'Odobenus rosmarus divergens i la segona, és que aquest element SECIS es trobi massa lluny del nostre hit i no l'haguem pogut detectar. A part, podria ser per la mala anotació, tal i com hem dit.


Per exonerate del hit escollit veiem que la proteïna predita presenta 5 exons i 4 introns. Aquesta proteïna que hem predit conté un codó UGA a l'exó 2 en la posició 45 de la SelM i presenta un raw score de 678.

Pel que fa al blast amb referència l'Homo sapiens, tenim dos possibles hits situats a l'Scaffold KB228986.1, dels quals hem agafat el que presenta una major identitat i un millor alineament en el T-coffee, tenint en compte que presenten els mateixos e-values. Aquest hit es troba en les coordenades 990995-991072, i presenta un alineament de les X entre les dues espècies. Tot i així, no hi trobem elements SECIS, tal i com passa en la comparació amb Felis catus .


Quan mirem exonerate veiem que es prediu una proteïna de 4 exons i 3 introns, amb un raw score de 324. El codó UGA alineat entre les dues seqüències es troba a l’exó 2, en la posició 49 de la proteïna. A més, veiem que segurament al llarg de l’evolució, s’ha produït una inserció en l’humà o una delecció en la morsa en una regió del genoma.


Amb aquesta informació, tenint en compte que l’humà presenta una millor anotació i no hi veiem cap element SECIS, el fet de no trobar aquesta estructura, segurament és degut a que l'element SECIS s'ha perdut en l'evolució de la nostra espècie, o que es troba tan lluny del nostre hit que la podem detectar. Per tant, no podem afirmar amb seguretat amb cap de les dues espècies de referència, que SelM sigui una selenoproteïna en Odobenus rosmarus divergens. D’aquesta manera, només podríem dir que es tracta d’una proteïna homòloga.



SelN

La Selenoproteïna N la trobem tant en Felis catus com en Homo sapiens. En el cas gat no està ben anotada, la seqüència de la proteïna no comença per metionina, i per això ens fixem fonamentalment en la SelN humana.


En la realització del blast, trobem 11 possibles hits, dels quals hem descartat aquells amb l'e-value més baix i identitats més baixes. Tenint en compte aquests dos paràmetres, la llargària del hit i els alineaments del T-coffee hem triat el hit amb coordenades 3342894-3343109 en l'Scaffold KB228911.1. En aquest hit hi veiem les X alineades entre les seqüències de les dues espècies. Cal comentar que hi ha un gap molt gran a l’inici de la seqüència de la morsa. Això ens indicaria que o bé s’ha produït una delecció d’aquesta regió en la nostra espècie, o bé, més probablement, sigui degut a la mala anotació del genoma de la morsa. Aquest gap tan gran impedeix la bona predicció de la SelN en Odobenus rosmarus divergens . En la búsqueda amb Seblastian i SECISearch3, s'han trobat 3 elements SECIS.

Per exonerate del hit escollit veiem que la proteïna predita presenta 9 exons i 8 introns. Aquesta proteïna que hem predit conté un codó UGA a l'exó 5 en la posició 463 de la SelN, amb un raw score de 1960.

Dels 3 elements SECIS en 3' predits, un és de grau A i els altres dos de grau B.

Havent vist que la selenocisteïna està alineada en les dues espècies i que s’han trobat 3 elements SECIS, podem dir que SelN és una selenoproteïna en Odobenus rosmarus divergens


A més, creiem que si estigués millor anotat el genoma del Felis catus, trobaríem una selenoproteïna homòloga amb Odobenus rosmarus divergens, ja que en el T-coffee del hit d'elecció, ens mostra un bon alineament, on s'alineen les X, i a més hi trobem un element SECIS.



SelO

La Selenoproteïna O només la trobem en el genoma de Homo sapiens, per tant en aquest cas no podem utilitzar com a referència el genoma de Felis catus. En Felis catus aquesta proteïna és homòloga en cisteïna en conseqüència ja no presenta selenocisteïnes al llarg de la seva seqüència.


Com a resultat del blast amb referència a l'Homo sapiens, obtenim 9 possibles hits. D'aquests la majoria tenen una identitat similar, de manera que tenint en compte l'e-value, la llargària del hit, i l'alineació obtinguda en els diferents T-coffees, hem escollit el hit amb les coordenades 542872-543402 dins l'Scaffold KB229324.1. En l'alineament amb T-coffee, veiem la X de les dues seqüències alineades. Amb el T-coffee també podem veure que la proteïna en la morsa és més curta, per tant, segurament s’ha produït una delecció en la nostra espècie en aquesta regió del genoma, o bé una inserció en l’humà. En la búsqueda amb SECISearch3 i Seblastian, trobem un element SECIS.

Per exonerate del hit escollit veiem que la proteïna predita presenta 8 exons i 7 introns. Aquesta proteïna que hem predit conté un codó UGA a l'exó 8 en la posició 667 de la SelO i presenta un raw score de 2784. A més, veiem que en algunes regions, s’han produït insercions o deleccions en alguna de les dues espècies.

Pel que fa a l'element SECIS en 3' predit és de grau A i es troba a 80 nucleòtids de Sec - UGA.

Per tant, veient l’alineament de les selenocisteïnes i la presència de SECIS, podem dir que SelO és una selenoproteïna en Odobenus rosmarus divergens.


Respecte la proteïna en Felis catus, veiem com en l’espècie estudiada la proteïna està més conservada respecte a la del humà i que tot i que filogenèticament Felis catus i Odobenus rosmarus divergens estan més a prop, van divergir de manera que en la el gat es va perdre la selenocisteïna, mentre que en la morsa s’ha mantingut.



SelP

En la Selenoproteïna P no podem utilitzar com a referència el genoma de Felis catus ja que només la trobem en el genoma d'Homo sapiens.


Per aquesta proteïna només trobem 4 possibles hits del resultat del blast, tots situats a l'Scaffold KB229292.1. Tenint en compte els valors d'identitat, d'e-value, la llargària del hit i l'alineament a T-coffee, hem triat el hit de coordenades 2344327-2344542. En l'alineament del T-coffee veiem que hi diverses X que s'alineen entre les dues seqüències. A més, hi ha d'altres X en Odobenus rosmarus divergens que també podrien correspondre a altres selenocisteïnes que no es troben en la SelP humana, i també hi ha altres selenocisteïnes presents en humà però no en Odobenus rosmarus divergens. Per altra banda, veiem que en una regió, o bé ha hagut una inserció de repeticions d’His en la nostra espècie, o bé s’ha produït una delecció d’aquestes repeticions d’His en humà al llarg de l’evolució. Pel que fa a elements SECIS, n'hem trobat dos utilitzant Seblastian i SECISearch3.

Per exonerate del hit escollit veiem que la proteïna predita presenta 4 exons i 3 introns. Aquesta proteïna que hem predit conté 7 codons UGA que coincideixen entre les dues espècies, i presenta un raw score de 1328. El primer d’aquests es troba a l’exó 1 en la posició 59 de SelP, mentre que els altres 3 es troben a l’exó 4 amb posicions 318, 331, 346, 353, 368 i 370 de SelP. A més, s’observen selenocisteïnes a la seqüència de SelP humana que en Odobenus rosmarus divergens són cisteïnes, per tant aquestes han estat perdudes al llarg de l’evolució en la morsa. Per altra banda, hem trobat que en Odobenus rosmarus divergens hi ha 4 codons UGA que s’alineen amb Cys en la seqüència de SelP humana. Això ens podria estar indicant que en la nostra espècie hi ha altres selenocisteïnes a part de les mateixes que es troben en humà. Aquests codons UGA de la morsa es troben a l’exó 4 amb les posicions 278, 304, 305 i 344. A part, trobem més codons UGA en Odobenus rosmarus divergens tot i que no alineats amb Cys, per tant, aquests també podrien correspondre a selenocisteïnes en la nostra espècie. Aquests es troben en l’exó 4 en les posicions 242 i 262 de la proteïna.

Pel que fa als dos elements SECIS en 3' predits, el primer es troba a 730 nucleòtids de Sec – UGA i és de grau B. L’altre element SECIS que hem trobat és de grau A i es troba a 288 nucleòtids de Sec – UGA.


Amb tota aquesta informació, veiem que SelP és una selenoproteïna en Odobenus rosmarus divergens, i que ha conservat diverses selenocisteïnes que l’humà no ha conservat, i n’ha perdut d’altres presents encara en humà.


Família SelR

Aquesta família està formada per tres proteïnes diferents, SelR1, SelR2 i SelR3. La primera d’elles és selenoproteïna tant en Homo sapiens com en Felis catus. En canvi, les dues restants són homòlogues en cisteïna, SelR2 nomès anotada per humans i SelR3 per les dues espècies. Hem comparat amb Felis catus a SelR1.



SelR1

La Selenoproteïna R1 la trobem en Felis catus i Homo sapiens. En el nostre cas la comparem amb la seqüència del gat. Per aquesta proteïna, hem obtingut només 2 possibles hits, ubicats en el mateix Scaffold, KB229056.1. Tenint en compte els paràmetres d'identitat, e-value, llargària del hit i l'alienament, hem escollit aquell hit que té les coordenades 1683230-1683352. Tot i això, veiem que aquesta proteïna no està ben anotada en Felis catus, ja que no comença per metionina. No obstant, si mirem l'alineament T-coffee veiem que s'alineen les X en les dues espècies, i a més en la búsqueda mitjançant Seblastian i SECISearch3, trobem un element SECIS. Per tant, creiem que si estigués millor anotat el genoma del Felis catus, trobaríem una selenoproteïna homòloga amb Odobenus rosmarus divergens.


En l’exonerate veiem que la proteïna predita només té 1 exó i cap intró, però això podria ser degut a que està mal anotat el genoma del Felis catus. En aquesta proteïna predita trobem el codó UGA alineat entre les dues seqüències en la posició 89, i presenta un raw score de 208.

Pel que fa a l’element SECIS en 3' predit, es troba a 1656 nucleòtids de Sec – UGA i és de grau A.


Per tant, veient que les selenocisteïnes s’alineen entre les dues espècies i que es troba un element SECIS, podríem pensar que sí que es tracta d’una selenoproteïna. Tot i això, degut a la mala anotació de la proteïna, no podem afirmar res.



SelR2

Aquesta proteïna en humà és una homòloga en cisteïna, per tant a la seva seqüència no presenta cap selenocisteïna, però presenta cisteïnes que han perdut el grup seleni. Per aquesta proteïna obtenim diversos hits en diferents Scaffolds, segons e-value, identitat, la llargària del hit i l’alineament escollim el que es troba a la regió KB229306.1 que va al llarg de les coordenades 470279 - 470680. Observant T-coffee no veiem X’s al llarg de les seqüències i amb exonerate la proteïna predita no intrònica amb raw score de 692 no presenta cap codó UGA però hem vist que hi ha dues cisteïnes alineades. En conseqüència pot ser que en totes dues espècies s’hagi conservat la pèrdua del grup seleni i s’hagin convertit en homòlogues en cisteïna.



SelR3

Aquesta proteïna tant en humà com en el gat és una homòloga en cisteïna, per tant a la seva seqüència no presenta cap selenocisteïna, però presenta cisteïnes que han perdut el grup seleni. Seleccionem el hit que ens interessa tant en el gat com en l’humà segons e-value, identitat, llargària del hit i alineament escollit. En humà és de l'Scaffold KB229908.1 amb coordenades 1118956 - 1119120 i en gat, el hit escollit es troba en el mateix Scaffold però en les coordeandes 1127038-1127145. Observem T-coffee en els dos casos i veiem com en humà la proteïna està correctament anotada, comença per Met però en gat no, degut a problemes amb l’ensemblatge del genoma d'aquest últim.


En tots dos casos l’alineament comença després d’un gran gap en la seqüència de la morsa, no hi ha presència de selenocisteïnes i amb exonerate veiem que no hi ha presència de codons UGA. A més, en tots dos en l'exonerate, l’inici de la proteïna està fora del nostra alineament i en el cas del gat és prediu una proteïna amb 2 exons i 1 intró mentre que en l’humà, una proteïna no intrònica, amb raw score de 419 i 244. No hi trobem elements SECIS, en conseqüència podem determinar que totes elles són proteïnes altament conservades que continuen sent homòlogues en cisteïna.


En conclusió pel que fa a la família de SelR, no està del tot clar si en Odobenus rosmarus divergens es conserva la selenoproteïna en SelR1, però sí que es veu clarament la conservació de les proteïnes homòlogues en cisteïna pel que fa a les dues proteïnes restants de la família, remarcant que SelR2 només és existent en Homo sapiens.



SelS

La selenoproteïna S la trobem tant en Felis catus com en Homo sapiens. En aquest cas, veiem la SelS de Felis catus comença per metionina, per tant no està mal anotada, i la podem fer servir com a referència.


Per aquesta proteïna, trobem 4 possibles hits resultants del blast que es troben a l'Scaffold KB229132.1. Tenint en compte els paràmetres d'identitat, e-value, llargària del hit i l'alienament, hem escollit aquell hit que té les coordenades 132896-132982. Quan analitzem el T-coffee del hit escollit, no veiem alineament de les X entre les dues seqüències. Això pot ser degut a que les selenocisteïnes presents a la seqüència de SelS del gat, es troben en una regió on hi ha un gap molt gran a la seqüència de la morsa (al final de la proteïna). Aquest gap podria ser provocat per una delecció de la regió en el genoma de la morsa, o bé per una mala anotació del genoma de la morsa. Per tant, en cas que fos per mala anotació, podria ser que ens estiguéssim perdent la informació d’una possible selenocisteïna en aquesta regió. Per altra banda, en la búsqueda d’elements SECIS a través de Seblastian i SECISearch3, no trobem cap element. Per tant, podria ser que realment s’hagués produït una delecció, de manera que s’haguessin perdut tant la selenocisteïna com l’element SECIS.

Per exonerate del hit escollit veiem que la proteïna predita presenta 2 exons i 1 intró, no presenta cap codó UGA en els exons i té una raw score de 258.


En el cas de la query d’Homo sapiens veiem com també surten 4 hits del blast, segons paràmetres d’identitat, e-value, llargària del hit i alineament escollim el que presenta unes coordenades de 138553-2561219 i es troba al scaffold KB229132.1. Observem T-coffee i veiem que succeix el mateix que anteriorment, no hi ha alineament de les X ni tampoc presència d’elements SECIS. En Odobenus rosmarus divergens podria haver perdut la selenoproteïna o podria estar mal ensamblada. Pel que fa a exonerate no hi ha presència de codons UGA all llarg de la proteïna predita, que presenta 2 exons i 1 intró amb un raw score de 232.


En conseqüència, la nostra hipòtesis respecte l’espècie estudiada, és que aquesta no ha conservat la proteïna com els ha passat a les altres dues espècies, i l’ha perdut al llarg de l’evolució.



SelV

La Selenoproteïna V només la trobem en el genoma de Homo sapiens, per tant en aquest cas no podem utilitzar com a referència el genoma de Felis catus.


Per SelV només hi ha 2 possibles hits, un té el grau d'identitat bastant baix, per això triem el hit de coordenades 1086051-1086128 de l'Scaffold KB228931.1. Tot i això, no veiem un alineament gaire bo en el T-coffee, i tampoc veiem element SECIS mitjançant els programes Seblastian i SECISearch3 . Per tant, SelV no serà una selenoproteïna en Odobenus rosmarus divergens.

Per exonerate del hit veiem que la proteïna predita presenta 6 exons i 5 introns, amb un raw score de 100 i sense presentar cap codó TGA.


Degut al mal alineament que es dóna en el cas de SelV, no podem extreure cap conclusió. Podria ser que no existís la proteïna en Odobenus rosmarus divergens, que hagués divergit molt al llarg de l’evolució, o que per mala anotació del genoma de la morsa no puguem detectar SelV en aquesta espècie.


Família W

SelW1

La Selenoproteïna W1 la trobem tant en Felis catus com en Homo sapiens. En el cas gat no està ben anotada, és a dir la seqüència de la proteïna no comença per metionina, i per això ens fixem fonamentalment en la SelW1 humana.


Per aquesta proteïna, el blast només ens dóna un possible hit, ubicat a l'Scaffold KB229003.1 amb les coordenades 223843-223917. Quan mirem el T- coffee veiem que la X no s'alinea entre les dues seqüències, ja que en l’inici de la seqüència de la morsa hi veiem molts gaps. Tot i això, en la búsqueda amb Seblastian i SECISearch3, trobem un element SECIS. Per tant, pot ser que s'hagi produït una delecció en la morsa, de manera que segurament s'ha perdut una part de la proteïna, que és la part on es troba la selenocisteïna de la seqüència de l’humà. Enlloc de la delecció podria ser que l’ensamblatge del genoma d’estudi no s’hagués realitzat correctament, per tant, pot ser que aquests resultats siguin deguts a que el genoma de la morsa en aquesta regió, no està ben anotat, ja que amb exonerate veiem com l’alineament no s’inicia amb metionina.


La proteïna predita amb exonerate conté 2 exons i 1 intró, i presenta un raw score de 253. Per altra banda, no s’observa cap selenocisteïna en la seqüència d’Odobenus rosmarus divergens, resultats que suporten la informació obtinguda anteriorment. Amb tota aquesta informació, només podem dir que SelW1 d’Odobenus rosmarus divergens és homòloga a la proteïna humana.


En canvi en el cas de Felis catus, tot i que no estigui ben anotat, les X sí que estan alineades entre les dues seqüències i trobem un element SECIS. Per tant, creiem que si estigués millor anotat el genoma del Felis catus, trobaríem una selenoproteïna homòloga amb Odobenus rosmarus divergens.



SelW2

Per aquesta proteïna utilitzem la query de l’Homo sapiens, ja que el genoma del Felius catus no presenta anotació per aquesta. Realitzem el blast i obtenim múltiples hits en diferents Scaffolds. Mitjançant l’observació dels valors d’e-value, d’identity i les posicions d’inci i final de la query que determinen quin podria ser el millor hit per alinear correspon al Scaffold KB228916.1 des de 1192999 a 1193160. La proteïna SelW2 és una homòloga en cisteïna en humà per tant no trobem selenocisteïna, sinó que hi ha cisteïnes que podrien haver perdut el grup seleni al llarg del temps. En Odobenus rosmarus divergens tampoc veiem selenoproteïnes observant T-coffee. Si per altra banda estudiem la presència d’elements SECIS en el hit d’elecció, veiem que no n’hi ha. Amb exonerate veiem que codifica per una proteïna que conté 2 introns i 3 exons, i presenta una raw score de 458.


Amb tots aquests resultats, podem dir que en Odobenus rosmarus divergens SelW2 també és una proteïna homòloga en cisteïna. Per tant, aquesta selenocisteïna es pot haver perdut al llarg de l’evolució, així com el seu element SECIS (pot ser que hi sigui però no el trobem). O bé, en altres espècies aquesta proteïna ha esdevingut una selenoproteïna, mentre que ni en Homo sapiens ni en Odobenus rosmarus divergens ho ha fet.


En conclusió, per la família SelW podem dir que la selenoproteïna en Homo sapiens no sembla conservar-se en el genoma d’Odobenus rosamarus divergens pel que fa a SelW1 segons l’alineament que realitza T-Coffee. En canvi si sembla conservar-se l’estructura de proteïna homòloga en cisteïna respecte SelW2. Per tant, veiem que proteïnes d’una mateixa família que han evolucionat i divergit de forma diferent convertint-se en un tipus o un altre, perdent el grup seleni i el grup SECIS.


SPS2

La selenoproteïna SPS2 només la trobem en el genoma d’Homo sapiens, per tant en aquest cas no podem utilitzar com a referència el genoma de Felis catus.


Per aquesta proteïna tenim una llista llarga de hits, de manera que tenint en compte els paràmetres d'identitat, e-value, llargària del hit i l'alineament, hem escollit aquell hit que té les coordenades 3127522-3128898 en l'Scaffold KB228942.1. Quan observem el T-coffee per aquest hit, veiem que s'alineen dues X entre les seqüències de les dues espècies. Per altra banda, veiem que l’inici de la seqüència de SPS2 en la morsa, hi ha un gap molt gran, de manera que probablement no està ben anotada aquesta regió en el genoma de la morsa, o bé hi ha hagut una delecció al genoma de la nostra espècie. Per altra banda, utilitzant Seblastian i SECISearch3, trobem un element SECIS.

Per exonerate del hit veiem una proteïna no intrònica amb raw score de 2187 que presenta dos codons UGA en les posicions 59 i 449. Pel que fa a l’element SECIS predit, és de grau A i es troba a 1738 nucleòtids de Sec - UGA.


Amb tota aquesta informació, tot i que la proteïna predita en Odobenus rosmarus divergens no comenci per metionina, el fet que hi hagi alineació de les selenocisteïnes entre les dues espècies i que s’hagi trobat un element SECIS, indica que SPS2 és una selenoproteïna en Odobenus rosmarus divergens.


Família TR

La família TR no presenta cap selenoproteïna TR1 i TR2 anotada a selenoDB en Felis catus, i tot i que aquesta espècie està més pròxima filogèneticament a l'Odobenus rosmarus divergens, ho compararem amb l'humà ja que és el mamífer amb el genoma més ben anotat. Per la selenoproteïna TR3 ho compararem amb Felis catus.



TR1

Per la selenoproteïna TR1, si ens fixem en humà, obtenim 25 hits a través del blast. Tot i que gran part dels hits presenten bona identitat i e-values, hem escollit el hit amb millors valors pel que fa a aquests paràmatres i a la llargària del hit. Així hem escollit el hit amb les coordenades 836635-836733 de l’Scaffold KB229706.1. Si observem el T-coffee, gran part dels hits presenten bons alineaments de seqüència, però el hit seleccionat es l’únic que presenta alineament en X entre les dues seqüències. Quan mirem el T-coffee observem també que l’inici de la seqüència de la morsa hi ha molts gaps. Per tant, pot ser que s'hagi produït una delecció en la morsa, de manera que segurament s'ha perdut una part de la proteïna. Enlloc de la delecció podria ser que l’ensamblatge del genoma d’estudi no s’hagués realitzat correctament, i per això la proteïna predita de la morsa no comença per metionina. A continuació, s’ha buscat la predicció dels elements SECIS en el hit escollit gràcies a Seblastian i SECISearch3 i se n’ha trobat un.


La proteïna predita mitjançant exonerate presenta 3 exons i 2 introns i un raw score de 509. Veiem que el codó UGA, és a dir, la selenocisteïna es troba en l’exó 3 en la posició 648 de la proteïna. A més, tal i com hem comentat, hem vist que la proteïna predita no comença per metionina.


Pel que fa a l’element SECIS identificat, es tracta de grau A i es troba a 218 nucleòtids de Sec - UGA. Per tant, tot i que la proteïna TR1 predita en morsa no comenci per metionina, veient l’alineament de les selenocisteïnes entre les dues espècies i la presència d’element SECIS, podríem dir que TR1 és una selenoproteïna en Odobenus rosmarus divergens.



TR2

Per TR2, en la realització del blast utilitzant Homo sapiens com a referència, obtenim 28 hits a través del blast. Tenint en compte l’identitat, el valor e-value i la llargada del hit hem seleccionat el hit amb les coordenades 426453-426581 del Scaffold KB229806.1. En el T-coffee observem l’alineament de la X entre les dues seqüències, però tot i estar alienades des del primer aminoàcid, en la seqüència de la morsa, a l’inici no hi ha una metionina. Això pot ser degut a mala anotació del genoma de la morsa. A continuació, s’ha buscat la predicció d’elements SECIS amb Seblastian i SECISearch3, però no s’ha trobat cap d’aquests elements. Això podria ser a causa de que s’hagi perdut durant l’evolució en l’Odobenus rosmarus divergens o perquè l’element SECIS es troba lluny del nostre hit i no s’hagi pogut detectar.

La proteïna predita mitjançant exonerate presenta 17 exons i 16 introns i un raw score de 2253. Trobem la selenocisteïna en la posició 65 de la proteïna, alineada entre les dues seqüències.


Tot i veure l’alineament de la selenocisteïna, el fet de no trobar cap element SECIS no ens permet dir que TR2 sigui una selenoproteïna en Odobenus rosmarus divergens. Per tant, només podem dir que es tracta d’una proteïna homòloga i que en la nostra espècie ha perdut l’element SECIS però no el codó que codificaria per una selenocisteïna.



TR3

Pel que fa a TR3 la trobem a Felis catus, però la proteïna està mal anotada ja que observant T-coffee veiem que no comença per metionina. Per aquest motiu, ho compararem amb Homo sapiens. Tot i així, pel hit seleccionat per Felis catus en el Scaffold KB229706.1 trobem un bon alineament de seqüencia amb l’Odobenus rosmarus divergens en el T-coffee. A més, s’hi ha trobat un element SECIS en la búsqueda a Seblastian i SECISearch3. Tot i això, no podem afirmar que es tracta d’una selenoproteïna.


Pel que fa a la comparació de la morsa amb l’humà, trobem 27 possibles hits en el blast. Segons l’identitat, el e-value i la llargada del hit escollim el hit amb les coordenades 5709763-5709972 del Scaffold KB228921.1 com a millor opció. En el T-coffee observem que cap de les dues seqüències comença per metionina. Per tant, pensem que no està ben anotada en humà. Per altra banda, veiem un gap molt gran al final de la proteïna de la morsa, que és on es troba la selenocisteïna humana, per tant, no hi ha alineament de X. Pot ser que hi hagi hagut una delecció en la seqüència de Odobenus rosmarus divergens, justament en la regió on s’hauria de trobar la selenocisteïna. Una altre possibilitat és que per mala anotació del genoma de la morsa, no veiem aquesta part de la proteïna, de manera que podria ser que en aquesta regió que no veiem hi estigués present una selenocisteïna. En aquest cas, ens estem perdent aquesta informació. Per altra banda, utilitzant Seblastian i SECISearch3, no hem trobat cap element SECIS.

Mitjançant exonerate s’ha predit una proteina codificada per un gen de 10 exons i 9 introns, amb un raw score de 1805.Amb tota aquesta informació, no podem afirmar que es tracta d’una selenoproteïna, podem dir que és una proteïna homologa.


Tot i això, creiem que si estigués millor anotat el genoma del Felis catus, trobaríem una selenoproteïna homòloga amb Odobenus rosmarus divergens, ja que en el T-coffee del hit d'elecció, ens mostra un bon alineament, on s'alineen les X, i a més hi trobem un element SECIS.


En conclusió la família TR està formada per selenoproteïnes en totes tres espècies. Com hem vist tenim selenoproteïna tant en el genoma d’Homo sapiens, com en Odobenus rosmarus divergens i Felis catus.


Família SelU

La família de proteïnes SelU està formada per tres proteïnes diferents, SelU1, SelU2 i SelU3, totes elles homòlogues en cisteïna. En el cas de la primera i la tercera nomès estan anotades per Homo sapiens, en canvi la segona es troba també anotada per Felis catus.



SelU1

Comparem en aquest cas amb la query d’humà ja que no hi ha anotació per gat. Realitzem el blast i escollim un dels hits segons e-value, identitat, llargària del hit i alineament. En el nostre cas escollim el que es troba al scaffold KB229058.1 entre les coordenades 3446380 - 3446559. Observem aleshores T-coffee i veiem que hi ha un correcte alineament i anotació de totes dues seqüències comparades i que no hi ha presència de selenocisteïnes tal com era d’esperar. Amb exonerate tenim una proteïna predita de 4 exons i 3 introns amb un raw score de 916, no hi ha presència de cap codó UGA, és a dir cap “unknown” aminoàcid i veiem cisteïnes alineades al llarg de les seqüències que poden haver perdut el grup seleni. A través de Seblastian i SECISearch3 no predim cap element SECIS a 3’.

En conseqüència podem determinar que SelU1 en Odobenus rosmarus divergens igual que en Homo sapiens és una proteïna homòloga en cisteïna.



SelU2

En aquest cas tenim tant proteïna anotada en humà com en gat, escollim els hits que volem a partir d’e-value, identitat, llargària del hit i alineament. Escollim per humà el scaffold KB229214.1 amb coordenades 240400 - 240540 i per gat el mateix scaffold amb les mateixes coordenades. Per T-coffee veiem que en humà hi ha un bon alineament i no hi ha presència de selenoproteïnes, ho confirmem a través de l’exonerate. En aquest cas veiem que l’inici de la nostre proteïna no està alineat, segurament per problemes d’ensemblatge del genoma d’estudi, però tot i això predim una proteïna de 5 exons i 4 introns amb un raw score de 823.

Pel que fa al gat veiem que amb T-coffee no hi ha una bona anotació ja que no comença per Met, però hi ha un bon alineament. Pel que fa a exonerate predim una proteïna de 3 exons i 2 introns amb un raw score de 542 sense presència de cap codó UGA. A través de Seblastian i SECISearch3 i llargada de la query alineada seleccionem uns dels Scaffolds i dins d’aquest, un dels hits. En aquest cas era d'esperar que no trobem cap element SECIS a 3’. Podem determinar igual que en el cas anterior que SelU1 en Odobenus rosmarus divergens igual que en Homo sapiens és una proteïna homòloga en cisteïna.

Una dada curiosa en aquest cas és que la proteïna de morsa s’ha alineat a la mateixa regió en les altres dues espècies, per tant podria ser que fos una proteïna altament conservada o que sigués casualitat ja que la proteïna de gat està mal anotada.



SelU3

Per aquesta proteïna només utilitzem l’anotació de l’humà ja que el gat no en presenta. En aquest cas nomès en surt un hit a l'Scaffold KB229213.1 amb coordenades 1016624 - 1016830. Per T-coffee veiem que hi ha un bon alineament i que la proteïna està correctament anotada, a més no hi ha presència de selenoproteïnes al llarg de la seqüència.

Amb exonerate predim una proteïna de 7 exons i 6 introns amb un raw score de 660 i no veiem cap codó UGA. L’inici de la proteïna no està alineat, degut a un mal ensemblatge o anotació del genoma de morsa.

A través de Seblastian i SECISearch3, com era d’esperar no trobem cap element SECIS a 3’.

Podem determinar igual que en els casos anteriors que Odobenus rosmarus divergens igual que en Homo sapiens és una proteïna homòloga en cisteïna.

En conclusió les proteïnes de la família SelU no són selenoproteïnes, totes elles són homòlogues en cisteïna, amb l’afegit de que totes elles estan altament conservades.



Maquinària


Pel que fa a les proteïnes de la maquinària, les proteïnes anotades a selenoDB en Felis catus estan mal anotades ja que si observem els T-coffee veiem que no comencen per Met. Tot i que el gat està més pròxim filogèneticament a l'Odobenus rosmarus divergens, ho compararem amb l'humà ja que és el mamífer amb el genoma més ben anotat.



eEFsec

Obtenim 8 hits a través del blast. Segons la identitat i els e-values hem escollit el hit amb les coordenades 4175773-4175114 del Scaffold KB228921.1. Observant el T-coffee veiem un bon alineament de seqüència. Mitjançant l’exonerate s’ha predit una proteïna codificada per un gen de 4 exons i 3 introns, amb un raw score de 1320.


El gen eEFSec codifica per una proteïna de la maquinària molt conservada entre espècies. Això s’explica ja que la proteïna és essencial per a la incorporació del Sec-tRNASec a les selenoproteïnes de nova creació.



PSTK

Obtenim 4 hits a través del blast. Segons la identitat i els e-values hem escolilt el hit amb les coordenades 721258-721548 del Scaffold KB230089.1. Observant el T-Coffee veiem un bon alineament de seqüència. Mitjançant l’exonerate s’ha predit una proteïna codificada per un gen de 5 exons i 4 introns, amb un raw score de 999.


El gen PSTK codifica per una proteïna de la maquinària molt conservada entre espècies. Això s’explica ja que la proteïna és essencial per a la incorporació del Sec-tRNASec a les selenoproteïnes de nova creació.



RPL30

RPL30 no presenta cap anotació a selenoDB en Felis catus, i tot i que aquesta espècie està més pròxima filogèneticament a l'Odobenus rosmarus divergens, ho compararem amb l'humà ja que és el mamífer amb el genoma més ben anotat. Per Homo sapiens RPL30 és una proteïna de la maquinària.

De resultat en el blast, obtenim 58 hits. Segons la identitat i els e-values hem escollit el hit amb les coordenades 626481-626825 del Scaffold KB229137.1 El hit escollit presenta molt bon alineament de seqüència en el T-coffee. En l’alineament pel T-coffee, observem que en la sequència humana no hi ha presència de X mentre que per l’Odobenus rosmarus divergens sí que veiem una X. En la búsqueda d’elements SECIS per Seblastian i SECISearch3, es troba un element SECIS.

La proteïna predita mitjançant exonerate presenta 1 sol exó, amb raw score de 573. En aquesta proteïna predita en Odobenus rosmarus divergens, es veu una selenocisteïna en la posició 106. Tot i això, aquesta selenocisteïna present en la morsa, codificada per un codó UGA, s’alinea amb una Arg de la seqüència proteica humana. Pel que fa a l’element SECIS predit en 3’, es tracta d’un element SECIS de grau B.

Per tant, tot això ens indica, que mentre que en humà RPL30 és una proteïna de la maquinària, en l’Odobenus rosmarus divergens, RPL30 és una selenoproteïna, ja que conté una selenocisteïna i un element SECIS. En no poder-la comparar amb Felis catus , no sabem si és que en aquesta espècie no existeix o si no s’ha anotat però sí que existeix. En cas de que existís, seria interessant veure si és de la maquinària com en l’humà, o bé selenoproteïna com en la morsa.

SBP2

Obtenim 13 hits a través del blast per aquesta proteina de la maquinària. Segons la identitat i els e-values hem escolilt el hit amb les coordenades 1885092-1884871 del scaffold KB229338.1 amb un e-value més petit i una identitat elevada. Observant el T-Coffee veiem un alineament correcte de les sequències, però amb un gap gran abans de la seqüencia d’Odobenus rosmarus divergens. Mitjançant exonerate s’ha predit una proteïna codificada per un gen de 4 exons i 3 introns amb una raw score 987.


No trobem estructures SECIS ni tampoc selenocisteïnes cosa que valida que aquesta no és una selenoproteïna sinó que és una proteïna de la maquinària conservada entre les espècies.



SECp43

Obtenim 34 hits a través del blast. Segons la identitat i els e-values hem escolilt el hit amb les coordenades 384330-384656 del Scaffold KB229508.1. Observant el T-Coffee veiem un bon alineament de seqüència. Mitjançant l’exonerate s’ha predit una proteïna codificada per un gen d’1 exó, amb un raw score de 737.


El gen SECp43 codifica per una proteïna de la maquinària molt conservada entre espècies. Això s’explica ja que la proteïna és essencial per a la incorporació del Sec-tRNASec a les selenoproteïnes de nova creació.



SecS

Obtenim 11 hits a través del blast. Segons la identitat i els e-values hem escolilt el hit amb les coordenades 3261091-3260789 del Scaffold KB229054.1 Observant el T-Coffee veiem un bon alineament de seqüència. Mitjançant l’exonerate s’ha predit una proteïna codificada per un gen d’1 exó, amb un raw score de 389.


El gen SecS codifica per una proteïna de la maquinària molt conservada entre espècies. Això s’explica ja que la proteïna és essencial per a la incorporació del Sec-tRNASec a les selenoproteïnes de nova creació.



SPS1

Aquesta proteïna de maquinària és de la mateixa família que SPS2, una selenoproteïna en humà. A través del blast obtenim 12 hits i segons la identitat i els e-values hem escolilt el hit amb les coordenades 65608-66006 del Scaffold KB229658.1. Observant el T-Coffee veiem un bon alineament de seqüència. Mitjançant l’exonerate s’ha predit una proteïna codificada per un gen d’1 exó, amb un raw score de 295.


El gen SPS1 codifica per una proteïna de la maquinària molt conservada entre espècies. Això s’explica ja que la proteïna és essencial per a la incorporació del Sec-tRNASec a les selenoproteïnes de nova creació.