<i><i>Scleropages formosus</i></i>

DISCUSSIÓ



La major part de les proteïnes han estat identificades correctament mentre que l’anàlisi d’altres ha mostrat major dificultat S’han descartat, per una part, les proteïnes que presentaven un mal alineament a l’observar els resultats del T-coffe, i per una altra, aquelles en què el primer aminoàcid de l’espècie de refereéncia no és una Metionina.

Davant d’aquesta última limitació, s’ha tornat a buscar les seqüències proteiques a través d'una base de dades equivalents com Uniprot, o bé s’ha substituït l’espècie a comparar per la d’humà.

Les seqüències de proteïnes zebrafish extretes de l'Uniprot són Gpx4a, Gpx4b, Gpx8, Msr1, Sel15 i SelM. Les seqüènicies de proteïnes humanes extretes del Selenodb són DI3b, Gpx7, SelI, SelO2, SelU1a, SelU1b, SelU1c, SelU1d, Sel U2, Sel U3a, SelU3b, TR1, TR2, PSTK, SBP2a i SBP2b.

La major part de les proteïnes que s’han obtingut a través del programa dissenyat han estat confirmades per el programa SEBLASTIAN. Tot i això, hi ha casos en que el programa no ha estat capaç de predir elements SECIS però això no vol dir necessàriament que no existeixin. Aquest fet es pot produir per una limitació del propi programa.

Seguidament es presentaran i discutiran els casos en què s’han obtingut resultats que no condueixen a una conclusió directa:

Família DI

En zebrafish aquesta família està formada per 3 proteïnes, DI1, DI2, DI3, una de la qual està duplicada, DI3a i DI3b. Analitzant els resultats del blast d'aquesta família, només s’obtenen dos hits, un per DI2 i un altre per DI3.

A partir d’aquests resultats s’observa la pèrdua del gen DI1 i la pèrdua o falta de dubplicació de D3.

Família Gpx

De la família GPx s’ha pogut identificat correctament GPx1a, GPx1b, GPx2, Gpx3a Gpx3b, Gpx7 i Gpx8. La similitud entre les dues primeres és molt alta degut al seu origen comú. Pel mateix motiu Gpx7 i Gpx8 tenen una alta similitud.

A continuació es discuteixen els resultats obtinguts de les proteïnes GPx4a i GPx4b de la família que presenten resultats diferents:

GPx4a i Gpx4b:

El blast de les proteïnes GPx4a i GPx4b mostra per a les dues els mateixos dos scaffolds predominants. Les posicions, però, no són del tot igual. Pel que fa a la proteïna GPx4a, aquesta té una regió més petita i un exó menys que la proteïna GPx4b.

D’aquests resultats s’hipotetitza que l’espècie Scleropages formosus t&ecute; totes dues proteïnes però els resultats d’homologia del blast dificulten l’assignació de cada proteïna a un scaffold.

Tot i així, es proposa que l’assignació del scaffold JARO01010167.1 a la proteïna GPx4b i elscaffold JARO01002300.1 a la proteïna GPx4a.

Família Sel:

D’aquesta família de les selenoproteïnes s’ha pogut identificar correctament les proteïnes: Sel 15, Sel H, Sel I, SelJ, SelK, SelL, SelM, SelN, SelPA, SelPB, SelR2, SelR3, SelS, SelT2, SelU2, SelU3, SelW1, SelW2a, SelWb.

Per una altra banda, s’ha observat limitacions en la identificació de les següents proteïnes:

SelO i SelO2:

Els resultats del blast donen per les dues proteïnes els dos mateixos scaffolds amb identitats similars. El scaffold JARO01001646.1, que es troba a la cadena revers i JARO01001490.1 que es troba a la cadena forward. D’aquest fet es pot extreure que hi ha dues proteïnes a Scleropages formosus, SelO i SelO2 amb una alta homologia entre elles degut al seu origen comú.

SelR1a i SelR1b:

Els resultats d’homologia al blastejar la seqüència de Scleropages formosus contra les selenoproteïnes conegudes de zebrafish, SelR1a i SelR1b, donen com a resultats els tres mateixos scaffolds, amb els mateixos valors d’identitat entre ells en cada una de les proteïnes.

Els resultats dels t-coffee mostren que la seqüència amb només un exó ocupa molt poc de la llargada de la seqüència de la proteïna referència del zebrafish, mentres que els altres dos tenen un bon aliniament amb gran part de la seqüència de referència. Això es deu a que aquest scaffold més curt, que és el JARO01015170.1, té un exó de menys.

Els altres dos scaffolds tenen una llargada molt semblant i presenten una gran similitut de seqüències. A més, també comparteixen similitut amb l’únic exó del scaffold més curt.

Per aquest fet s'ha descartat el scaffold JARO01015170.1, i s'ha prosseguit l’anàlisi tenint només els altres dos en compte.

Degut a la gran semblança entre els dos scaffolds en el t-coffee, i el fet de que presentin la mateixa identitat en el blast, es conclou que la proteïna SelR1 es troba duplicada en SelR1a i SelR1b.

SelT1:

A l’organisme de referència, la proteïna SelT es troba representada per dues proteïnes, SelT1a i SelT1b.

Els resultats del blast de l‘organisme de referència donen només una proteïna, localitzada a la cadena reverse del scaffold JARO01003865.1 i que està formada per 5 exons. Això doncs, concluem que Scleropages formosus té només una SelT.

SelU1:

La seqüència del zebrafish estava mal anotada així que es van prendre com a referència les quatre proteïnes humanes corresponents.

Els resultats del blast donen en els quatre casos, dos scaffolds am alta indentitat. Aquest fet mostra la gran conservació que hi ha hagut en algunes regions de la seqüència d’aquesta família de selenoproteïnes.

La presència de tan sols dos scaffolds, i que presentin la mateixa identitat amb totes les proteïnes, fa descartar la possibilitat que el nostre organisme tingui 4 SelU1.

Així doncs podem concloure que l’organisme Scleropages formosus només té dues SelU1, cadascuna per un scaffold.

SelU3:

La proteïna SelU3 es trobava mal anotada en el Selenodb per l'organisme Zebra Fish, de manera que es va extreure de l'humà. Aquest té dues proteïnes U3. Al blastejar aquestes dues proteïnes contra la seqüència de Slceropages formosus s'ha obtingut el mateix scaffold per les dues proteïnes. Així doncs, podem concloure que Scleropages formosus té només una proteïna SelU3.

Família TR:

En l'organisme de referència, el zebrafish, només trobem les proteïnes TR2 i TR3. Havent-hi la possibilitat que Scleropages formosus tingués també TR1, s'ha pres la proteïna TR1 de l’humà com a referència.

S'ha trobat que Scleropages formosus té TR1, TR2 i TR3. TR3 es troba duplicada en dos scaffolds, el JARO01000985.1, al que assignem el nom de TR3a i el JARO01000300.1, al que assignem el nom de TR3b. Ambdues són proteïnes de 16 exons.

Altres selenoproteïnes sense família:

MsrA:

L'organisme de referència, el Zebra Fish, té dues proteïnes MsrA. La seqüència d'una s'ha pogut obtenir del selenodb, l'altre l'hem hagut d'extreure de l'uniprot, ja que estava mal anotada. Al blastejar aquestes dues seqüències de proteïnes contra la seqüència del Scleropages formosus hem obtingut 3 scaffolds, els tres amb identitats semblants per a les dues proteïnes de referència.

A partir d'aquests resultats s'ha pogut extreure que Scleropages formosus té aquesta proteïna triplicada, en comptes de duplicada com passa en el Zebra Fish. La proteïna MsrA1 correspon al scaffold JARO01011081.1 , la proteïna MsrA2 al scaffold JARO01016003.1 i la proteïna MsrA3 al JARO01015498.1.

Proteïnes de maquinària

La major part de les proteïnes de maquinària han estat identificades amb els resultats obtinguts. A continuació discutim aquelles proteïnes que tenien resultats que no conduïen a una conclusió directa.

SPS1:

En analitzar els resultats obtinguts de fer el blast de la proteïna de referència contra la seqüència de Scleropages formosus, s'ha obtingut dos scaffolds d'una elevada identitat.

Degut a la alta identitat que tenen aquest dos scaffolds i que no s'han trobat blastejant altres proteïnes, es pot arribat a la conclusió que es tracta d'una duplicació de la proteïna en dues posicions diferents, una en la cadena forward i l'altre en la revers, les dues amb 8 exons. Així doncs, tindrem una proteïna com a SPS1a, i l'altre com a SPS1b.

SPS2scaffold:

La referència en aquest cas és l’humà, ja que les proteïnes de zebrafish estaven mal anotades. En el cas de l’humà hi ha dues SBP2, que són la A i la B. Quan s'analitzen els resultats del blast es pot observar que els valors obtinguts per a les dues proteïnes de referència són els mateixos. Per aquest fet, agafem només els resultats d’una de les proteïnes de referència i prosseguim amb l’anàlisi.

S’obtenen quatre scaffolds resultants, aquests scaffodls presenten molta semblança entre ells i respecte a la proteïna de referència. Per aquest fet es pot extreure la conclusió que Scleropages formosus té quatre proteïnes SBP2, que s'anomenaran SBP2-a, SBP2-b, SBP2-c i SBP2-d.


Obra de K. Haring