Equus Przewalskii


RESUM


Les selenoproteïnes consisteixen en pèptids que incorporen la selenocisteïna en la seva estructura, aquest aminoàcid, que consisteix en una cisteïna on el grup tiol s'ha substituit per seleni, és considerat l'aminoàcid nombre 21 al codi genètic. El seu ús ha estat descrit en eucariotes, arquees i eubacteris. Les selenocisteïnes estan codificades pel triplet UGA, que també codifica per un stop, el que ocasiona una anotació dolenta d'aquestes. Així mateix, és necessària una seqüència SECIS (seqüència d'inserció de la selenocisteïna) a la regió 3' UTR per a poder incorporar-la a la selenoproteïna sintetitzada.

L'objectiu del nostre projecte és la identificació del selenoproteoma de Equus przewalskii també conegut com a cavall salvatge mongol. Per aconseguir-ho s'han comparat per homologia el selenoproteoma d'Equus przewalskii amb el d'Equus caballus i en alguns casos necessaris amb el d'Homo sapiens.

Per dur a terme aquest estudi s'han utilitzat diferents eines bioinformàtiques i bases de dades per obtenir el genoma de l'espècie a estudiar, així com els altres dos selenoproteomes utilitzats com a referència. S'ha dissenyat un programa que permet automatitzar l'anàlisi de cada possible selenoproteïna ja que executa tots els passos necessaris per la seva identificació: el tBLASTn, l'Exonerate, el Genewise i el T-coffee. A més, també s'ha analitzat la presència d'elements SECIS gràcies al programa SeciSearch 3.0/Seblastian i en els casos en que les famílies de proteïnes eren complexes d'analitzar, s'ha utilitzat el recurs online Phylogeny per a obtenir la filogènia en les espècies analitzades.

Finalment, en el genoma d'Equus przewalskii s'ha determinat la conservació de 19 selenoproteïnes, 12 homòlegs amb cisteïna i 8 proteïnes que formen part de la maquinària de síntesi de selenoproteïnes.

És important remarcar que aquest estudi només permet la identificació de selenoprteïnes homòlogues a les identificades en una altra espècie prèviament estudiada. Així doncs, per tal de trobar noves selenoproteïnes en Equus przewalskii, seria necessari dur a terme altres estudis.









ABSTRACT


Selenoproteins are proteins that contain in their sequence a specific aminoacid called selenocysteine (Sec) which is considered the 21st aminoacid of the genetic code. This aminoacid consist in a cysteine where the tiol group has been substituted by selenium. It has been proved to be used by eukaryote, archaea and bacteria. Selenocysteine is coded by the UGA codon, which also acts as a STOP codon. Therefore, the annotation of selenoproteins is challenging. Moreover, a SECIS sequence (selenocysteine insertion sequence) at 3'UTR region is needed to incorporate the selenocysteine to the selenoprotein in synthesis.

The aim of this project is the identification of the selenoproteome in Equus przewalskii, also known as Dzungarian horse in English. In order to achieve it, the selenoproteomes of Equus przewalskii and Equus caballus have been compared by homology, and in some case it was necessary comparing it to the Homo sapiens.

In this study different bioinformatic tools and databases were used to get Equus przewalskii's genome, as well as the already known selenoproteomes of Homo sapiens and Equus caballus organisms. A program was designed to automate the analysis of every possible selenoprotein. This program executes all the necessary steps to identify the selenoproteins: tBLASTn, Exonerate, Genewise and T-coffee. Moreover, the presence of SECIS elements was also analyzed using the SeciSearch 3.0/Seblastian program and in cases of complex families of selenoproteins, Phylogeny program was employed, to know the phylogeny for each analised specie.

Finally, the conservation of 19 selenoproteins, 12 cysteine homologues and 8 machinery proteins were defined in the genome of Equus przewalskii.

It should be emphasised that this study only allows the identification of those selenoproteins which are homologues to the ones previously identified in another species. Consequently, in order to obtain and discover new selenoproteins in Equus przewalskii, other studies would be required.