Discussió

SelN

La realització d'un BLAST ens va donar lloc a dos hits diferents, un dels quals només donava llocs a alineaments de fragments petits de la proteïna, o bé alineaments amb puntuacions molt baixes. Per tant, hem acabat assignant un sol hit a aquesta proteïna.

A la taula es pot observar a quin scaffold es troba la proteïna, en quin sentit respecte l'anotació es transcriu, les coordenades de la proteïna predites per l'exonerate i el genewise i, finalment, les coordenades i l'energia lliure dels elements secis.

En aquest cas, la proteïna SelN es troba a l'scaffold GL849746.1 i està codificada en el mateix sentit que l'anotació (forward).

Hem obtingut la predicció d'una proteïna tan amb exonerate com amb genewise:

  • La predicció d'exonerate té 17171 nucleòtids, que inclouen deu exons i nou introns, i una raw score de 1916.
  • La predicció de genewise té 20140 nucleòtids, que inclouen onze exons i deu introns, i té una puntuació de 779.92 bits.

Les dues prediccions acaben al mateix nucleòtid, però comencen en llocs diferents. La predicció del genewise inclou un exó i un intró més, situats a l'inici de la proteïna. Tot i així, encara falta una regió inicial de la proteïna i una regió entre aquest exó de més i l'inici de la predicció feta per l'exonerate. Hem mirat manualment quin pot ser el problema i hem observat que aquest exó de més es troba en una regió amb moltes N, tan abans com després (tal com es pot veure a la imatge següent), cosa que dificulta la correcta predicció de la proteïna.

   

La proteïna d' Homo sapiens té dues selenocisteïnes i hem observat que la segona d'aquestes es troba conservada en el setè exó de la proteïna predita per exonerate i en el vuitè predit pel genewise. Pel que fa a la primera selenocisteïna, es troba en la regió inicial no predita per l'exonerate i en el buit de predicció entre el primer i el segon exó del genewise, ja comentat abans.

El programa secisSearch ha trobat tres possibles elements secis a l'extrem 3' del gen, a diferents distàncies del final del gen, però no tenim el coneixement per discriminar quin dels tres és el real. Tot i això, la presència d'aquests elements secis dóna suport a la predicció que es tracta una selenoproteïna conservada.

Considerant tota la informació anterior, es podria predir una estructura de la proteïna SelN:

*Cal considerar que hem tingut alguns problemes a l'hora d'analitzar aquesta proteïna, ja que quan realitzàvem l'exonerate ens donava una serie de prediccions que incloïen diferents regions de la proteïna, algunes de les quals repetides, però en llocs diferents de l'scaffold (link fitxers). Quan extrèiem la predicció de la proteïna amb el programa fastaseqfromGFF.pl, obteníem una predicció molt llarga, amb fragments repetits i desordenats, que en realitzar l'alineament amb el t_coffee ens sortia un resultat molt dolent (link alineament inicial). Per tant, hem hagut de realitzar l'anàlisi del resultat de l'exonerate manualment, tot seleccionant de cada regió un sol hit, segons la seva puntuació i vigilant no se sobreposessin. Els resultats manuals són els que s'han adjuntat en totes les taules i els citats a l'anàlisi i discussió dels resultats.


Selenoprofiles

Degut al problema comentat al paràgraf anterior, el Selenoprofiles dona quatre hits per aquesta proteïna que cauen tots en el mateix scaffold. Aquests hits però, tenen categories diferents: un conté una fenilalanina (SelN.5), un altre no té la selenocïsteina alineada (SelN.8), i els altres dos contenen selenocïsteina (SelN.10, SelN.11).

Un fet curiós, és el que passa amb la identificació dels elements secis. Tot i que els quatre hits estan predits pel Selenoprofiles en el mateix scaffold, no prediu un mateix element secis, sinó que en prediu tres de diferents i els col·loca un per cada hit; mentre que al hit SelN.8 no n'hi prediu cap.

També és curiós que dos d'aquests tres elements secis identificats per Selenoprofiles, nosaltres també els havíem identificat (a les posicions 29987 i 148376 de l'scaffold); però el tercer element secis identificat per Selenoprofiles no es correspon amb el tercer secis identificat per nosaltres: l'element secis identificat per nosaltres comença a la posició 217047 de l'scaffold, mentre que l'element identificat per Selenoprofiles correspon a la posició 107116 de l'scaffold.