Abstract

Selenoproteins are a type of protein which contain in their sequence the selenocystein aminoacid, known as the twenty-first aminoacid. Selenocystein is encoded by UGA codon, which is almost always interpreted as a STOP codon, which present difficulties for anotation by bioinformatics tools. Organisms which have selenoproteins have to recode the UGA codon to introduce a selenocystein. The recodification of the UGA codon is carried out by a tridimensional structure called SECIS, which is placed in the 3'UTR region of the selenoproteins genes.

In this research work, analysis has been carried out on 14 recently sequenced protist genomes to check the presence or absence of the TR and Lmsel1 selenoprotein family. To do this analysis, bioinformatic tools such as tBLASTn, Exonerate, GeneWise, T_coffee, SECISearch and tRNAscan-SE have been used. In addition, our analysis has been extended to include the search for the machinery involved in the synthesis of selenoproteins, which is also found in the genomes.

The results obtained reveal the presence of TR selenoproteins in the genomes of F.cylindrus and P.capsici and also the presence of homologous proteins with glycine in the genomes of G.niphandrodes and S.arctica . On the other hand, the presence of Lmsel1 selenoprotein has only been found in the genome of L.donovani

.

Resum

Les selenoproteïnes són proteïnes que contenen en la seva seqüència l'aminoàcid selenocisteïna, considerat l'aminoàicd vint-i-u. La selenocisteïna és codificada pel codó UGA, que gairebé sempre és interpretat com un codó d'STOP, fet que en dificulta l'anotació per part de les eines bioinformàtiques. Els organismes que tenen selenoproteïnes han de recodificar el codó UGA com a codó per a selenocisteïna. La recodificació del codó UGA la duu a terme una estructura tridimensional anomenada SECIS, situada en la regió 3'UTR del gen de les selenoproteïnes.

En aquest projecte s'ha procedit a l'anàlisi de 14 genomes de protists seqüenciats recentment per tal de comprovar l'existència o no de les famílies de selenoproteïnes TR i Lmsel1 en aquests organismes. Per dur a terme aquest anàlisi s'han utilitzat les eines bioinformàtiques tBLASTn, Exonerate, GeneWise, T_coffee, SECISearch i tRNAscan-SE. A més a més, s'ha ampliat l'anàlisi per cercar en aquests genomes la maquinària necessària per a sintetizar les selenoproteïnes.

Els resultats obtinguts revelen l'existència de selenoproteïnes de la família TR en els genomes de F.cylindrus i P.capsici i de proteïnes homòlogues en glicina en els genomes de G.niphandrodes i S.arctica . Per altra banda, en el cas de la família Lmsel1 només s'ha identificat l'existència en L.donovani

.