Anotació de selenoproteïnes en Condylura cristata

Ávila MA, Berruezo M, Bosch N, Castell L.

Bioinformàtica. Universitat Pompeu Fabra. Barcelona 2014.

Abstract

Selenium is an essential element in the organism that plays a key role in a wide range of functions. This element is incorporated into the polypeptide chain as part of selenocysteine residue, known as amino acid 21, which is encoded by the TGA codon. The bivalence of this codon, that in the most proteins encodes a stop codon, makes the annotation of the selenoproteins very complex.

The aim of the project is the prediction and annotation of the genes encoded by selenoproteins, cysteine homologous and synthesis machinery in the star-nosed mole genome, Condylura cristata. The research has been done by developing a script which automates the informatic programs for the prediction of existing selenoproteins, besides the online version of the SECIs element prediction program.

Interpretation of these results has allowed to predict the existence of all protein machinery analyzed (eEFSec, MSrA, Pstk, SBP2, SECp43, SPS and SecS), 16 conserved selenoproteins and 7 selenoproteins that had lost the selenocysteine, as they have been substituted by a cysteine. Moreover, 5 selenoproteins have been exclusive predicted in Homo sapiens, as cysteine homologous too.

Resum

El seleni és un element essencial per a l'organisme que juga un paper clau en un gran ventall de funcions. Aquest element s'incorpora a la cadena polipeptídica formant part del residu selenocisteïna, conegut com l'aminoàcid 21, el qual està codificat pel codó TGA. La bivalència d'aquest codó, que en la majoria de proteïnes codifica per un stop, fa molt complexa l'anotació de les selenoproteïnes.

L'objectiu d'aquest projecte és la predicció i anotació dels gens codificants per selenoproteïnes, homòlegs en cisteïna i maquinària de síntesi en el genoma del talp de musell estrellat, Condylura cristata. La recerca s'ha dut a terme mitjançant el desenvolupament d'un script que automatitza els programes informàtics per a la predicció de selenoproteïnes existents, a més de la versió online de programes de predicció d'elements SECIs.

La interpretació dels resultats ha permès predir l'existència de totes les proteïnes de maquinària analitzades (eEFSec, MSrA, Pstk, SBP2, SECp43, SPS i SecS), de 16 selenoproteïnes conservades i de 7 selenoproteïnes que han perdut la selenocisteïna substituint-la per una cisteïna, a part de 5 selenoproteïnes provinents exclusivament d'Homo sapiens, també en forma de proteïnes homòlogues amb cisteïna.