Discussió

Discussió dels resultats

En realitzar tot el procés d’obtenció de dades comparant les selenoproteïnes humanes amb el genoma de Nomascus leucogenys hem pogut inferir molta informació interessant que explicarem en aquest A partat.

eEFSec

El factor de maquinària mol·lecular eEFSec presenta 4 scaffolds en el genoma de Nomascus leucogenys. La regió corresponent al scaffold GL397475.1 és la que presenta una major homologia amb la query inicial així com també un major score, tots dos valors del 100%. Aquest scaffold presenta també el millor e-value amb diferència respecte la resta, de 1e-125. A part, l'exonerate del scaffold d'interès ens permet veure que conté el mateix número d'exons i introns que la query inicial descrita a SelenoDB. Així doncs, podem cocloure que eEFSec s'ha conservat intacte en Nomascus leucogenys.

GPx

La família de selenoproteïnes GPx és una de les millor estudiades i la més gran en vertebrats, en Homo sapiens està formada per 8 membres: GPx1, GPx2, GPx3, GPx4, GPx5, GPx6, GPx7 i GPx8. Mitjançant el BLAST hem pogut obtenir un seguit de scaffolds per a cadascuna de les proteines de la família GPx, alguns d'ells presents en totes. Aquests scaffolds han estat: GL397293, GL397312, GL397305, GL397406, GL397342, GL397269, GL397296 i GL397303.

GPx1

La selenoproteïna GPx1 presenta 8 scaffolds en el genoma de Nomascus leucogenys. La regió corresponent al scaffold GL397293.1 presenta una homologia mitjana amb la query inicial però el seu e-value de 3e-80 és el millor. A més, en aquesta regió trobem que es conserva la selenocisteïna, ja que trobem una U alineada amb una altra U. Observem que part del primer exó i tot l'últim exó no hi són presents. Tot i així, com la resta de scaffolds de GPx s'han relacionat amb les altres selenoproteïnes d'aquesta família, considerem que la seqüència obtinguda d'aquest scaffold correspon a la selenoproteïna GPx1. Segons la bibliografia i Selenoprofiles, sabem que GPx1 és un pseudogen en humans i ximpanzés, possiblement en Nomascus leucogenys també ho sigui.

GPx2

La selenoproteïna GPx2 presenta 7 scaffolds en el genoma de Nomascus leucogenys. La regió corresponent al scaffold GL397312.1 és la que presenta una major homologia amb la query inicial, del 100 %, així com també un score de 100. Aquest scaffold presenta també el millor e-value amb diferència respecte la resta, de 2e-64. A més, en aquesta regió trobem que es conserva la selenocisteïna ja que trobem una U alineada amb una altra U. A part, l'exonerate del scaffold d'interès ens permet veure que conté el mateix número d'exons i introns que la query inicial descrita a SelenoDB. La resta de scaffolds s'han relacionat amb les altres selenoproteïnes de la famíla GPx, fet que ens reforça la idea que la seqüència obtinguda del scaffold GL397312.1 correspon a la selenoproteïna GPx2. Segons aquests resultats podem concloure que aquesta selenoproteïna s'ha conservat en Nomascus leucogenys.

GPx3

La selenoproteïna GPx3 presenta també 7 scaffolds en el genoma de Nomascus leucogenys. La regió corresponent al scaffold GL397305.1 és la que presenta una major homologia amb la query inicial així com també un major score, tots dos valors del 100%. Aquest scaffold presenta també el millor e-value amb diferència respecte la resta, de 6e-38. A més, en aquesta regió trobem que es conserva la selenocisteïna ja que trobem una U alineada amb una altra U. A part, l'exonerate del scaffold d'interès ens permet veure que conté el mateix número d'exons i introns que la query inicial descrita a SelenoDB. S'observa també la presència de dos elements SECIs que es troben per sobre de la regió codificant. La resta de scaffolds s'han relacionat amb les altres selenoproteïnes de la famíla GPx, fet que ens reforça la idea que la seqüència obtinguda del scaffold GL397305.1 correspon a la selenoproteïna GPx3 que estudiem.

GPx4

La selenoproteïna GPx4 presenta 6 scaffolds en el genoma de Nomascus leucogenys. La regió corresponent al scaffold GL397406.1 és la que presenta una major homologia amb la query inicial així com també un major score, tots dos valors del 100%. Aquest scaffold presenta també el millor e-value amb diferència respecte la resta, de 6e-36. A més, en aquesta regió trobem que es conserva la selenocisteïna ja que trobem una U alineada amb una altra U. A part, l'exonerate del scaffold d'interès ens permet veure que conté el mateix número d'exons i introns que la query inicial descrita a SelenoDB. S'observa també la presència de dos elements SECIs que es troben per sobre de la regió codificant. La resta de scaffolds s'han relacionat amb les altres selenoproteïnes de la famíla GPx, fet que ens reforça la idea que la seqüència obtinguda del scaffold GL397406.1 correspon a la selenoproteïna GPx4. Així doncs, podem concloure que la selenoproteïna GPx4 s'ha conservat en Nomascus leucogenys.

GPx5

L'homòleg en cisteïna GPx5 presenta també 6 scaffolds en el genoma de Nomascus leucogenys. La regió corresponent al scaffold GL397342.1 és la que presenta una major homologia amb la query inicial així com també un major score, tots dos valors del 100%. Aquest scaffold presenta també el millor e-value amb diferència respecte la resta, de 4e-35. A més, en aquesta regió trobem que es conserva la cisteïna ja que trobem una C alineada amb una altra C. A part, l'exonerate del scaffold d'interès ens permet veure que conté el mateix número d'exons i introns que la query inicial descrita a SelenoDB. La resta de scaffolds s'han relacionat amb les altres selenoproteïnes de la famíla GPx, fet que ens reforça la idea que la seqüència obtinguda del scaffold GL397342.1 correspon a la selenoproteïna GPx5. Així doncs, podem concloure que la selenoproteïna GPx5 s'ha conservat en Nomascus leucogenys.

GPx6

La selenoproteïna GPx6 presenta 6 scaffolds en el genoma de Nomascus leucogenys. La regió corresponent al scaffold GL397269.1 presenta una bona homologia amb la query inicial així com també un bon score, amb valors de 71% i 93, respectivament. A més, en aquesta regió trobem que es conserva la selenocisteïna ja que trobem la U alineada amb una altra U. S'observa també la presència d'un element SECIs que es troba per sobre de la regió codificant. La resta de scaffolds s'han relacionat amb les altres selenoproteïnes de la famíla GPx, fet que ens reforça la idea que la seqüència obtinguda del scaffold GL397269.1 correspon a la selenoproteïna GPx6 que estudiem. Segons la bibliografia hem vist que GPx6 evoluciona especificament en mamífers placentaris. A partir d'una duplicació de GPx3, també hem vist en els nostres resultats que GPx6 presenta una gran homologia en una zona ja ocupada per GPx3 (GL397305.1). Segons selenoprofiles GPx6 és un pseudogen.

GPx7

L'homòleg en cisteïna GPx7 presenta 7 scaffolds en el genoma de Nomascus leucogenys. La regió corresponent al scaffold GL397296.1 és la que presenta una major homologia amb la query inicial així com també un major score, tots dos valors del 100%. Aquest scaffold presenta també el millor e-value amb diferència respecte la resta, de 3e-45. A més, en aquesta regió trobem que es conserva la cisteïna ja que trobem una C alineada amb una altra C. S'observa també la presència d'un element SECIs que es troba per sobre de la regió codificant reverse. A part, l'exonerate del scaffold d'interès ens permet veure que conté el mateix número d'exons i introns que la query inicial descrita a SelenoDB. La resta de scaffolds s'han relacionat amb les altres selenoproteïnes de la famíla GPx, fet que ens reforça la idea que la seqüència obtinguda del scaffold GL397296.1 correspon a la selenoproteïna GPx7. Així doncs, podem concloure que l'homòleg en cisteïna GPx7 s'ha conservat en Nomascus leucogenys.

GPx8

L'homòleg en cisteïna GPx8 presenta 7 scaffolds en el genoma de Nomascus leucogenys. La regió corresponent al scaffold GL397303.1 és la que presenta una major homologia amb la query inicial així com també un major score, tots dos valors del 100%. Aquest scaffold presenta també el millor e-value amb diferència respecte la resta, de 1e-43. A més, en aquesta regió trobem que es conserva la cisteïna ja que trobem una C alineada amb una altra C. A part, l'exonerate del scaffold d'interès ens permet veure que conté el mateix número d'exons i introns que la query inicial descrita a SelenoDB. La resta de scaffolds s'han relacionat amb les altres selenoproteïnes de la famíla GPx, fet que ens reforça la idea que la seqüència obtinguda del scaffold GL397303.1 correspon a la selenoproteïna GPx1. Així doncs, podem concloure que la GPx8 es conserva en Nomascus leucogenys.

També hem analitzat aquesta familia en Pan troglodytes. Hem vist que els scaffolds amb major homologia comparant humà amb Nomascus leucogenys coincideixen amb els scaffolds amb major homologia comparant Pan troglodytes amb Nomascus leucogenys.

DI

La família de selenoproteïnes Iodothyronine deiodinase (DI) en Homo sapiens està formada per tres membres: DI1, DI2 i DI3. En fer el blast d’aquestes tres selenoproteïnes hem obtingut els mateixos 3 scaffolds per a cada una: GL397280.1, GL397352.1 i GL397390.1.

DI1

Pel que fa a la selenoproteïna humana DI1, ens fixem que, de tots els resultats obtinguts, el % d’homologia més elevat correspon al scaffold GL397352.1, amb un 98% d’homologia amb la query inicial i un score de 99. Aquest scaffold, a més, presenta el millor e-value respecte els altres scaffolds (5e-48 respecte 1e-35 i 8e-32). Pel que fa a la presència de selenocisteïna, veiem que aquesta s’ha conservat en Nomascus leucogenys, ja que trobem una U a la mateixa posició de les dues seqüències comparades. Amb els resultats obtinguts mitjançant exonerate també podem observar que el scaffold d’interès presenta el mateix nombre d’exons i introns que la query. És per tot això que descartem els altres dos scaffolds i considerem que la seqüència obtinguda del scaffold GL397352.1 correspon a la selenoproteïna que estudiem (DI1).

DI2

Pel que fa a la selenoproteïna humana DI2, veiem que el % d’homologia obtingut més elevat pertany al scaffold GL397280.1, amb un 100% d’homologia amb la query inicial i un score de 100. Aquest scaffold, per tant, presenta homologia total amb la selenoproteïna humana comparada. A més, presenta el millor e-value respecte els altres scaffolds (4e-155 respecte 8e-32 i 7e-9). Pel que fa a la presència de selenocisteïna, veiem que aquesta s’ha conservat en Nomascus leucogenys, ja que trobem una U a la mateixa posició de les dues seqüències comparades. Els resultats obtinguts mitjançant el programa exonerate ens mostren que l'scaffold GL397280.1 presenta el mateix número d’exons i introns que la query inicial. Tots aquests resultats ens porten a descartar els altres dos scaffolds, de manera que considerem que la seqüència del scaffold GL397280.1 correspon a la selenoproteïna DI2. Pel que fa als elements SECIs hem trobat un a la regió correcta.

DI3

Finalment estudiem l’últim membre de la família DI: la selenoproteïna humana DI3. En els resultats obtinguts observem un 100% d’homologia en el scaffold GL397390.1 i un score de 100. Aquest scaffold, per tant, presenta homologia total amb la selenoproteïna humana comparada. A més, presenta el millor e-value respecte els altres scaffolds (1e-105 respecte 4e-35 i 2e-6). Pel que fa a la selenocisteïna present en la selenoproteïna humana, veiem que s’ha conservat en Nomascus leucogenys, ja que trobem una U a la mateixa posició de les dues seqüències comparades. Per acabar veiem que el número d’exons i introns que trobem en executar l’exonerate corresponen al número d’exons i introns de la query. Amb els resultats explicats considerem que els altres dos scaffolds es poden descartar i que la seqüència de GL397390.1 correspon a la selenoproteïna DI3. Pel que fa als elements SECIs hem trobat un a la regió correcta.

Amb tots aquests resultats podem concloure que els tres membres de la família de selenoproteïnes humanes DI es conserven en Nomascus leucogenys. El fet que en els tres membres es trobessin els mateixos scaffolds i tots presentessin certa homologia amb la selenoproteïna estudiada probablement es pot explicar perquè DI1, DI2 i DI3 formen part de la mateixa família i presenten una seqüència d’aminoàcids semblant. Això faria que en diferents punts del genoma Nomascus leucogenys trobéssim una seqüència d’aminoàcids similar.

MsrA

En fer el blast de l’homòleg en cisteïna Methionine sulfoxide reductase A (MsrA) hem obtingut un únic scaffold: GL397337.1. Aquest scaffold presenta un 100% d’homologia amb la query i un score de 100, tant en els resultats obtinguts mitjançant el programa exonerate com en els resultats del genewise. Per tant, l'scaffold s’alinea de manera perfecta a la selenoproteïna humana MsrA. L’e-value obtingut és de 3e-25 i la cisteïna d’interès que trobem a la query inicial està conservada en l'scaffold a la mateixa posició. El número d’exons i introns predits mitjançant exonerate es conserven respecte la selenoproteïna humana. És per tot això que considerem que la proteïna MsrA humana està conservada en Nomascus leucogenys.

SBP2

A partir dels resultats obtinguts del blast de la SECIs binding protein 2 (SBP2) obtenim quatre scaffolds diferents: GL397295.1, GL397306.1, GL397332.1 i GL397553.1. D'aquests quatre scaffolds obtinguts, l'últim (GL397553.1) és el que presenta més homologia amb la query (99.9%) i un score de 99. A més, és l'scaffold que té un millor e-value (5e-39) i el número d'introns i exons es conserva. En ser una proteïna de maquinària, no conté selenocisteïna. Tot i això s'ha de tenir en compte que quan vem afegir 50kb a l'start i end d'aquest scaffold el fastasubseq no s'executava bé i, per tant, tota la resta tampoc, de manera que no obteniem resultats. És per això que enlloc d'agafar 50kb vam probar d'agafar-ne 10kb (després de probar-ho amb 20kb, que tampoc va resultar), amb el que vam obtenir els resultats presentats. Amb tot això, considerem que el scaffold correspon a la SECIs binding protein 2 humana i que, per tant, aquesta està conservada en Nomascus leucogenys. Pel que fa als elements SECIs hem trobat un a la regió correcta.

SPS

La família de proteïnes selenophosphate synthetase (SPS) en Homo sapiens està formada per dos membres: SPS1 i SPS2. En fer el blast d’aquestes dues proteïnes hem obtingut els mateixos 15 scaffolds per a cada una: GL397261.1, GL397263.1, GL397271.1, GL397290.1, GL397313.1, GL397317.1, GL397334.1, GL397337.1, GL397338.1, GL397375.1, GL397393.1, GL397457.1, GL397496.1, GL397566.1 i GL397734.1.

SPS1

Pel que fa a SPS1, quan analitzem el t-coffee executat amb les dades resultants de l'exonerate veiem que hi ha tres scaffolds amb un 100% d'homologia amb la query inicial (GL397271.1, GL397334.1 i GL397566.1). D'aquests tres, veiem que el primer té un millor e-value i que, només en aquest scaffold, el número d'exons coincideix amb la query. D'altra banda, veiem que l'aminoàcid T es conserva en els tres scaffolds a la mateixa posició. És per tot això que creiem que SPS1 es troba conservada en Nomascus leucogenys. El fet que hi hagi tres scaffolds amb 100% d'homologia podria indicar que s'han produït duplicacions de la proteïna en altres punts del genoma.

SPS2

Pel que fa a SPS2, s'ha de tenir en compte el que s'ha comentat a l'apartat de resultats. D'aquesta manera veiem que el t-coffee on s'observa més homologia és en GL397566.1. Tot i així, aquest scaffold conté la proteïna SPS1, com ja hem comentat anteriorment, ja que no pot ser que trobem dues proteïnes diferents ocupant la mateixa regió del genoma. D'altra banda, GL397290.1 presenta molta homologia i la U de la query inicial es troba conservada a la mateixa posició en aquest scaffold. És per això que creiem que SPS2 es troba conservada en Nomascus leucogenys. Tot i així, apareixen altres scaffolds amb molta homologia que podrien ser duplicacions d'alguns dominis de la SPS2.

També hem analitzat aquesta familia en Pan troglodytes. Hem vist que els scaffolds amb major homologia comparant humà amb Nomascus leucogenys coincideixen amb els scaffolds amb major homologia comparant Pan troglodytes amb Nomascus leucogenys.

Sel15

Quan fem el blast de la selenoproteïna 15 (Sel15) obtenim un sol scaffold: GL397278.1. Aquest s’alinea amb la query de manera perfecta, ja que presenta un 100% d’homologia. L’e-value és de 1e-17, i la selenocisteïna d’interès es conserva a la mateixa posició en la seqüència de Nomascus leucogenys. Pel que fa al número d’exons i introns predit a partir de l’exonerate, veiem que coincideix amb el número d’exons i introns de Sel15 respectivament. A partir de tots aquests resultats podem considerar que la selenoproteïna humana Sel15 està conservada en Nomascus leucogenys. Pel que fa als elements SECIs hem trobat un a la regió correcta.

SelH

A partir dels resultats obtinguts del blast de la selenoproteïna H (SelH) veiem que obtenim un únic scaffold: GL397376.1. Aquest scaffold presenta una homologia perfecta amb la query (100%) quan fem el t-coffee a partir de l’exonerate com a partir del genewise. L’e-value del scaffold és de 2e-32 i el score de 100. La selenocisteïna present en SelH es troba conservada a la mateixa posició en el scaffold obtingut. El número d'exons del scaffold coincideix amb els descrits a selenoDB, mentre que en exonerate observem que hi ha un intró menys. Aquest intró es pot haver perdut respecte la selenoproteïna humana. Amb aquests resultats considerem que la selenoproteïna SelH està conservada en Nomascus leucogenys.

SelI

Quan fem el blast de la selenoproteïna I (SelI) obtenim 3 scaffolds diferents: GL397313.1, GL397326.1 i GL397331.1. Seguint els criteris que hem estat utilitzant per descriure els resultats obtinguts, creiem que el scaffold que conté la seqüència corresponent a SelI és el GL397331.1. Aquest és el scaffold que presenta més homologia amb la query (100% amb exonerate i 99,7% amb genewise), de manera que el t-coffee representa un alineament perfecte. A més, és el scaffold que té el millor e-value (2e-34 respecte 5e-8 i 8e-8). La selenocisteïna de la query està conservada a la mateixa posició. No obstant, el número d'exons i introns predits per l'exonerate no coincideix amb el descrit per selenoDB. En el scaffold d'interès trobem un intró i un exó de més. Mirant el transcript de la selenoproteïna (ho trobem a selenoDB) veiem que es transcriuen el mateix número d’aminoàcids que obtenim al final amb el t-coffee. Per tant, podria ser que hagués aparegut un intró a la seqüència del genoma de Nomascus leucogenys i que, d’aquesta manera s’haguessin separat dos exons. Si fos així, el número d’introns i exons que et detecta l’exonerate seria diferent. La inserció d'una seqüència en un exó podria provocar un canvi en la codificació de la proteïna. Tot i així, en el t-coffee resultant no s'observen canvis respecte la query, de manera que en principi considerem que SelI està conservada en Nomascus leucogenys. Pel que fa als elements SECIs hem trobat un a la regió correcta.

SelK

Aquesta selenoproteïna presenta quatre scaffolds en el genoma de Nomascus leucogenys. D'aquests, el que presenta millor homologia és el localitzat a la regió GL397269.1 amb un 100% d'homologia, un score de 100 i un e-value de 5e-10. Veiem que la selenocisteïna s'ha conservat ja que la U es troba alineada amb una U. Observem que falta un exó i un intró respecte la selenoproteïna humana però això es deu a que l'últim exó d'aquesta és no codificant. A més, observem la presència d'un element SECI al final de la regió codificant amb una seqüència idèntica a la de la selenoproteïna humana.

Pel que fa als altres scaffolds veiem que el GL397356.1 presenta molta homologia amb el t-coffe del genewise però no conserva la U. En canvi en el t-coffe de l'exonerate hi ha menys homologia (falta part de l'exó inicial) però la U es conserva, així doncs, podria tractar-se d'un pseudogen. En el cas de GL397261.1 i GL397266.1 també s'observa molta homologia (97,9% i 95,7% respectivament) pel que també podria tractar-se de pseudogens. Segons la bibliografia se sap que la SelK és la selenoproteïna amb més pseudogens (27 pseudogens en 11 organismes), per la qual cosa no podem descartar que es tracti d'un. Cal destacar que s'han trobat elements SECIs en tots els scaffolds (alguns d'ells idèntics a l'element SECI humà). Els e-values en tots els casos són inferiors a 1e-9.

Amb aquests resultats podem concloure que SelK està conservada en Nomascus leucogenys i que, a més, presenta pseudogens.

SelM

La selenoproteïna M presenta el 89% d'homologia al scaffold GL397272.1, també presenta un score de 99 i un e-value de 4e-20. La selenocisteïna s'ha conservat ja que una U es troba alineada amb una U. La part final de la selenoproteïna (corresponent a una part de l'exó 5) no s'ha alineat però considerem que SelM es conserva en Nomascus ja que els aminoàcids alineats són, en gran majoria, idèntics als de la selenoproteïna humana. Pel que fa al número d'exons i introns veiem que falten 2 exons no codificants i els seus dos 2 introns corresponents. Pel que fa als elements SECIs hem trobat un a la regió correcta.

SelN

La selenoproteïna N presenta 119 scaffolds diferents amb e-values inferiors a 0.001. Segons el resultat de Selenoprofiles, la selenoproteïna es troba al scaffold GL397339. Concretament aquesta regió es correspon al scaffold amb menor e-value de tot el blast (6e-29), presenta un 89% d'homologia i un score de 41. Aquest score s'explica ja que el resultat del programa exonerate conté moltes alineacions diferents. Hem analizat la primera alineació de l'exonerate per separat i, tot i que només s'alinea la segona meitat de la query, presenta un score de 99, ja que gairebé tots els aminoàcids alineats són idèntics. A més, es conserva la U en aquella regió. Com aquest resultat no pot donar-se només per atzar podem afirmar que la selenoproteïna N es troba conservada en Nomascus leucogenys.

SelO

La selenoproteïna O es troba al scaffold GL397546.1 amb una homologia del 79,2% i un score de 100. A més, presenta un e-value baix (2e-35). Tot i que una part extensa del primer exó no està alineada, hi ha una coincidència perfecta amb la resta d'aminoàcids. La selenocisteïna s'ha conservat, ja que la U es troba alineada amb una U. A més, té el mateix número d'exons i introns que la selenoproteïna humana. En aquesta selenoproteïna s'ha obtingut un element SECIs en la regió correcta.

Així doncs, podem concloure que SelO es troba conservada en Nomascus leucogenys.

SelP

Aquesta selenoproteïna es troba a la regió GL397362.1 de Nomascus leucogenys, amb un 99,7% d'homologia entre les dues seqüències, un score de 99 i un e-value de 4e-68. S'observa la presència d'un element SECI idèntic al que hi ha a la selenoproteïna humana. Les selenocisteïnes s'han conservat, ja que totes les U menys una (8 de 9) es troben alineades amb una U. També s'han conservat el número d'exons i introns.

Així doncs, concluim que SelP s'ha conservat en Nomascus leucogenys.

També hem analitzat aquesta selenoproteïna en Pan troglodytes. Hem vist que els scaffolds amb major homologia comparant humà amb Nomascus leucogenys coincideixen amb els scaffolds amb major homologia comparant Pan troglodytes amb Nomascus leucogenys.

SelR

La família de selenoproteïnes R està composta per tres membres: R1, R2 i R3. La primera és un selenoproteïna, mentre que les altres dues són homòlegs en cisteïna.

SelR1

La selenoproteïna R1 es troba a la regió GL397322.1. Presenta una homologia perfecta (100%), un score de 100 i, a més, conserva el número d'exons i introns. L'e-value és de 4e-24. També es conserva selenocisteïna, ja que una U s'alinea amb una U. A més, hi ha un element SECI i aquest és idèntic a l'humà.

També hi ha molta homologia a la regió GL397330.1 (99,13%) i amb score 99, amb presència d'un element SECIs i amb un e-value que segueix sent molt baix (1e-44). Els exons i introns no es conserven però la U. Podem suposar que la seqüència que codifica per la selenoproteïna R1 es troba en dues regions diferents (GL397322.1 i GL397330.1) tot i que aquest últim cas presenta menys homologia que el primer. Possiblement aquesta última opció és una duplicació del gen.

SelR2

L'homòleg en cisteïna R2 es troba a la regió GL397271.1 amb una homologia del 100% , amb un score de 64 i un e-value de 4e-22. La cisteïna es troba alineada amb una altra cisteïna, per la qual cosa es troba conservada. A més, la majoria d'aminoàcids alineats són idèntics. Pel que fa al número d'exons i introns, n'hi ha un de menys en tots dos casos. Probablement això sigui degut a què, en perdre's aquest intró, s'hagin ajuntat dos exons. Respecte als elements SECIs, hem trobat un a la regió correcta.

La regió GL397457.1 també presenta bona homologia (però pitjor que la regió anterior) per la qual cosa es pot pensar que part de la seqüència de la SelR2 s'ha copiat també en aquesta regió (falta primer, segon i part del tercer exó). Tot i així la cisteïna es troba conservada. Aquest scaffolds també presenta elements SECIs en la regió adequada.

SelR3

L'homòleg en cisteïna R3 es troba a la regió GL397276.1 amb una homologia del 98,9%, un score de 99 i un e-value de 3e-25 (el millor respecte els altres scaffolds). El número d'exons i introns s'ha conservat, així com la cisteïna, que s'ha alineat amb un altra cisteïna. Els altres scaffolds podem descartar-los, ja que el scaffold es troba ocupat per una altra selenoproteïna que presenta més homologia.

Segons aquests resultats podem concloure que els tres membres de la família de selenoproteïnes R s'han conservat en Nomascus leucogenys.

SelS

Es troba a la regió GL397555.1 amb una homologia del 99,5%, un score de 99 i un e-value de 1e-13. El número d'exons i introns s'ha conservat, així com la selenocisteïna, que s'alinea amb U. Hi ha un element SECI en la regió correcta que, a més, és igual al de la selenoproteïna humana. Així doncs, veiem que s'ha conservat.

SelT

Aquesta selenoproteïna es troba a la regió GL397268.1. Presenta una homologia total (100%), un score de 100 i una e-value de 5e-18. El número d'exons i introns s'ha conservat, així com la selenocisteïna, que s'alinea amb U. Trobem l'element SECI a la regió correcte, que a més és igual al de la selenoproteïna humana.

També trobem aquesta selenoproteïna a la regió GL397359.1 però amb menys homologia que en el cas anterior (falta part de l'exó inicial). En conservar la U i l'element SECI es pot dir que s'ha copiat part de la seqüència de la selenoproteïna T en aquesta regió del genoma de Nomascus leucogenys.

SelU

La família d'homòlegs en cisteïna SelU en Homo sapiens està formada per tres membres: SelU1, SelU2 i SelU3. S'han obtingut diferents scaffolds per a cada homòleg.

SelU1

Respecte a SelU1 veiem que hi ha dos scaffolds que s'adeqüen a la query: GL397324.1 i GL397364.1. El primer presenta un 97% d'homologia i un score de 99, el segon un 73% d'homologia i un score de 93. Els e-value són 8e-95 i 4e-27 respectivament. Pel que fa a la presència de cisteïna veiem que aquesta s'ha conservat en els dos alineaments. Consultant el resultat de Selenoprofiles hem decidit que la selenoproteïna U1 es troba a la regió GL397364.1, ja que els aminoàcids alineats són pràcticament idèntics als de la query, mentre que a la regió GL397324.1 hi ha més variacions. Tot i així, no podem descartar que trobem una duplicació a GL397324.1. També hem vist, mitjançant la cerca d'elements SECIs, que aquests s'han perdut.

SelU2

Pel que fa a SelU2 el scaffold amb major homologia és el GL397279.1, amb un 100%, un score de 100 i un e-value de 3e-18. A més, la cisteïna també s'ha conservat. Mitjançant l'exonerate veiem que s'han conservat tots els exons i també tots els introns, però no ha conservat l'element SECI. Tot i que l'e-value de GL397279.1 no és el més baix, veiem que l'homologia és perfecta. L'altre scaffold, GL397348.1, no alinea correctament la cisteïna, ja que l'alinea amb una fenilalanina.

SelU3

Finalment, veiem que SelU3 conserva un 100% d'homologia en el scaffold GL397470.1, així com conserva la cisteïna i el número d'exons i introns de l'homòleg en cisteïna humà. Té un score de 100 i un e-value de 1e-36. Aquest homòleg en cisteïna també té un altre scaffold diferent (GL397339.1) on no troba exons. Així doncs, escollim GL397470.1. Aquest, sí que ha conservat un element SECI en la regió correcta.

Amb tots aquests resultats podem concloure que els tres membres de la familia SelU estàn conservats en Nomascus leucogenys, no només conservant gran part de la seqüència, sinó que també conserven l'aminoàcid d'interés, en aquest cas la cisteïna.

SelV

Respecte la selenoproteïna SelV veiem que la regió que alinea la selenocisteïna GL397394.1 està ocupada per la SelW1. A part de mostrar homologia en aquesta regió, també obtenim uns bons resultats a la regió GL397330.1 on hi ha la selenocisteïna alineada amb una prolina. Tot i així, l'homologia és del 87%, el score de 71 i el e-value de 3e-41. Així doncs, contrastant amb el Selenoprofiles i la bibliografia podem concloure que la selenoproteïna V és una duplicació de SelW (igual que passa amb GPx3-GPx6), que no conserva la U.

SelW

La família de selenoproteïnes SelW en humans està formada per dos membres: SelW1 i SelW2, sent la primera una selenoproteïna i la segona un homòleg en cisteïna.

SelW1

Respecte SelW1 veiem que ha donat homologia en tres scaffods diferents. El que té una homologia més elevada és GL397394.1 amb un 97% homologia respecte un 79% i 58% dels altres scaffolds. Té un score de 89 i un e-value de 8e-16. Pel que fa a la presència de selenocisteïna, hem vist que està conservada, ja que la selenocisteïna s'alinea amb una altra selenocisteïna. El scaffold d'interès no ha conservat tots els exons (1 dels 6 de la query) i possiblement s'han fusionat. També hem vist que els SECIs no s'han mantingut.

El scaffold GL397544.1 també té una bona homologia (79%) i un score de 100. Podria tractar-se d'un pseudogen que no conserva la selenocisteïna.

SelW2

L'homòleg en cisteïna SelW2 ha donat una homologia del 50% en el scaffold GL397430.1, un score de 100 i un e-value de 8e-18. Mitjançant l'exonerate veiem que la cisteïna s'ha conservat, també s'han conservat els exons i introns respecte a la proteïna homòloga en humans. Mitjançant l'exonerate també veiem que hi ha una part de la nostra proteïna que no és coneguda i pot ser que correspongui a una regió no anotada del genoma de Nomascus leucogenys. Els elements SECIs no s'han conservat en aquest homòleg en cisteïna.

Així doncs, podem concloure que tant SelW1 com SelW2 s'han conservat en Nomascus leucogenys.

TR

La família de selenoproteïnes TR en humans està formada per tres membres: TR1, TR2 i TR3. Les dues primeres han obtingut els mateixos scaffoldds (GL397326.1, GL397380.1, GL397492.1), mentre que TR3 ha obtingut aquests mateixos i alguns més (GL397298.1, GL397506.1, GL397318.1, GL397262.1).

TR1

Respecte la selenoproteïna TR1, veiem que el scaffold amb el % d'homologia més elevat és GL397326.1 amb casi un 100% i un score de 100. Els altres scaffolds també tenen una homologia elevada, encara que no tant. També hem vist que els exons i introns s'han conservat casi tots (13 de 15 i 13 de 14 respectivament), tot i que els que falten corresponen a exons no codificants. El scaffold escollit també presenta el e-value més baix, amb un 1e-36 respecte els 2e-30 i 2e-16 dels altres scaffolds. Respecte a la selenocisteïna hem vist resultats contradictoris entre l'exonerate i el t-Coffee. En l'exonerate la selenocisteïna s'alinea amb un altra selenocisteïna, mentre que en el t-Coffee ho fa amb una glicina. Aquesta contradicció pot ser deguda a què la selenocisteïna està situada al final de la proteïna i, per tant, s'ha pogut produir un error de predicció en el t-Coffee. Així doncs, podem concloure que la selenocisteïna s'ha alineat correctament amb un altra selenocisteïna. Respecte al SECI, veiem que sí que l'ha conservat i que, a més, té una seqüència d'aminoàcids igual a la de l'element SECI de TR1 en humans.

TR2

Pel que fa a la selenoproteïna TR2, veiem que el scaffold amb més homologia és GL397492.1, amb casi un 100% i un score de 100. També té el e-value és més baix respecte els altres scaffolds (1e-27 respecte 4e-21 i 8e-20). Els exons i introns s'han conservat tots (sense comptar l'exó no codificant). Respecte la selenocisteïna, també hem vist resultats contradictoris, com ha passat amb TR1. Per tant, concluïm que la selenocisteïna s'ha conservat. L'element SECI també s'ha conservat, i també és molt semblant a l'element SECI en humans.

TR3

Pel que fa a la selenoproteïna TR3, veiem que el millor scaffold és GL397380.1, amb un 74% d'homologia, un score de 100 i un e-value de 4e-35. Respecte la selenocisteïna hem observat que també s'ha conservat, tot i que també hi ha els mateixos errors que en TR1 i TR2. Els exons i introns estan casi tots conservats (15 de 17 i 13 de 16, respectivament). Pel que fa a l'element SECI, no s'ha conservat en aquesta selenoproteïna. Els altres scaffolds resultants tenen poca homologia respecte la selenoproteïna model. Així doncs, ja no els analitzem.

Amb tots aquests resultats podem concloure que totes les selenoproteïnes TR s'han conservat. TR1 i TR2 també han conservat els elements SECIs. També hem vist que les tres selenoproteïnes es troben en els mateixos scaffolds, això és degut a que són de la mateixa família i tenen seqüències similars.

Blast contra les seqüències no-redundants de NCBI

Per acabar de confirmar els nostres resultats hem fet un BLAST de les seqüències de les proteïnes predites en Nomascus leucogenys contra la base de dades NCBI. Hem vist que a partir de les nostres selenoproteïnes es poden predir altres selenoproteïnes en diferents organismes, situació que recolza les nostres conclusions. Només la SelU2 i SelU3 no prediuen selenoproteïnes. Aquests resultats no els hem considerat perquù utilitzant la selenoproteïna humana SelU2 i SelU3 registrada al SelenoDB dóna el mateix resultat.