Abstract Introducció Materials i Mètodes Resultats Discussió Bibliografia

Ufd2 D4Cole1e

1. Caracterització de l'estructura genòmica del gen:


A partir de la proteïna donada, el primer pas en el nostre treball va consistir en la realització d'un BLAST tBLASTn per tal de buscar homologies de la nostra proteïna en els diferents genomes de la base de dades de NCBI. A partir del resultat obtingut, vam veure que es tractava d'una proteïna quimèrica en l'espècie Mus Musculus formada per les proteïnes D4Cole1e (Nmnat1) i Ube4b (també anomenada Ufd2, degut a la seva homologia amb S. Cerevisiae). Les dues proteïnes que constitueixen la nostra proteïna d'estudi es localitzen ambdues en el cromosoma 4 en posicions properes. De forma més exacte, segons la base de dades Ensembl, D4Cole1e es troba a l posició 148.312.409-148329.096 i Ube4b es localitza a la posició 148.172.216 - 148.270.549. (Figura 1)

Figura 1. Localització cromosòmica




En el model de ratolí mutat Slow Wallerian Degeneration (Wlds) es forma la proteïna quimèrica que tractarem. La mutació que dóna lloc a aquesta proteïna ve donada per una triplicació en tàndem d'una regió de 85Kb que contindrà fragments dels dos gens en els seus extrems resultant en una fusió d'ambdós gens. (Figura2)


Figura 2. Esquema de la mutació


C57BL/6J es correspon al gen wild type

C57BL/Wld(S) es correspon al gen mutat que presenta la triplicació


La proteïna quimèrica resultant està formada a l'extrem N-terminal per 70 aminoàcids provinents de Ufd2 (Ubiquitin fusion degradation protein 2) i la seqüència completa de Nmnat1 (nicotinamide mononucleotide adenylyltransferase1). El punt d'unió entre ambdós gens és un àcid aspàrtic. Els ratolins que continguin aquesta mutació, presentaran una sobreexpressió de la proteïna quimèrica ja que tindrà dues copies que codificaran per ella (Figura 1).


Per tal d'analitzar la nostra proteïna quimèrica (que anomenarem Ufd2/D4Cole1e) estudiarem les dues proteïnes per separat.

El gen Ufd2 està constituït per 30 exons que donaran lloc a dos transcrits diferents. Per començar, ens fixarem en el transcrit ENSMUST00000084123 format per 28 exons. D'aquests 28 exons tots són codificants excepte el número 28 que és en part codificant i en part no codificant. El que ens ha cridat més l'atenció d'aquest transcrit, és que el seu primer aminoàcid segons la base de dades Ensembl és una Valina. Sabem que no és possible que això ocorri, ja que el codó d'inici de transcripció sempre codifica per una metionina. Així doncs, suposem que el que ha succeït és que s'ha produït un error en la predicció o bé en la posterior anotació a la base de dades. Pel que fa referència al segon transcrit ENSMUST00000103212, podem dir que conté 27 exons dels quals tots són codificants excepte el primer i l'últim que són en part codificants i en part no.(Figura 3)


Figura 3. Transcrits de Ufd2



Els transcrits associats al nostre gen, presenten la majoria d'exons comuns però alguns d'ells, pateixen un procés de splicing alternatiu. El final de l'exó número 25 del transcrit ENSMUST00000084123 presenta quatre nucleòtids addicionals respecte el mateix exó en l'altre transcrit. Això és degut a que trobem dues seqüències acceptores de splicing al final d'aquest exó, fent que segons el transcrit, la maquinària de splicing en reconegui un o l'altre. A més a més, en el transcrit ENSMUST00000084123 trobem un exó que tan sols està format per dos nucleò tids (CA) els quals estan flanquejats per seqü ències donadores i acceptores de splicing. Així doncs, suposem que degut a que la llargada d'aquest exó és molt curta, a vegades serà transcrit i altres no. Com que en aquest transcrit s'addicionen sis nucleòtids (quatre del exó 25 i dos del 26), això fa que a l'hora de transcriure, la pauta de lectura no canviï. Per altra banda, vam cercar a la base de dades Swissprot per tal de mirar si existien isoformes per aquesta proteïna però al no trobar-ne cap ó suposem que cada un dels transcrits, en el nostre cas dos, dónen lloc a una isoforma.


Pel que fa al gen D4Cole1e, dir que està format per 5 exons, els quals sols constituiran un únic transcrit. Pel que fa als exons, el tercer i el quart són codificants; el primer no és codificant i els dos restants, ho són en part. (Figura 4)


Figura 4. Transcrits de D4Cole1e


Finalment, podem concloure que Ufd2/D4Cole1e ve codificada a l'extrem N-terminal per els dos primers exons de la proteïna Ufd2 donant lloc als setanta primers aminoàcids, i tota la seqüència de D4Cole1e és la que codifica per l'extrem C-terminal.