Família SelW

Les SelW formen part d'una família de proteïnes que es coneixen per participar en processos d’oxidació-reducció. La família està formada per dues proteïnes: SelW1, que s’expressa principalment a la musculatura esquelètica i al cor, i SelW2.

Al genoma de Condylura cristata tan sols s'ha pogut localitzar SelW1. Per fer-ho, l'anàlisi s'ha basat en dues querys, provinents de Mus musculus i d'Homo sapiens.

Amb la query de Mus musculus el blast realitza alineaments amb dues regions genòmiques, encara que un d'ells amb un e-value molt elevat, mentre que amb la d'Homo sapiens l'alineament resulta en tan sols una regió. Per aquest motiu s'ha escollit l'scaffold coincident en les dues espècies de les quals s'han extret les querys, el gi|385726810|gb|JH655918.1|, amb un e-value de 2e-15 en el cas de Mus musculus, i de 4e-08 en el cas d'Homo sapiens. Per altra cantó, el programa t-coffee realitza alineaments amb un score de 98 i 99, respectivament. Així la proteïna, segons els resultats obtinguts, es troba codificada en el genoma de Condylura cristata a la regió predita pel blast, a la cadena sense (+), entre els nucleòtids 48339 i 50266.

Al seu torn, l'exonerate dóna com a resultat una proteïna amb quatre introns i cinc exons, en els anàlisis realitzats amb ambdues querys. A part, aquesta presenta un codó de stop (TGA) en la mateixa posició en que a les querys trobem una selenocisteïna (aminoàcid 13). D'aquesta manera es dedueix que la selenoproteïna es troba conservada tant en Mus musculus com en Homo sapiens, i al genoma de l'espècie que analitzem, Condylura cristata.

La predicció d'elements SECIs dóna lloc a tres resultats, un dels quals no vàlid per trobar-se en posicions 5' de la seqüència. Dels altres dos, el de grau A ha estat el seleccionat a l'hora de realitzar un esquema de la proteïna, pel fet de trobar-se més a prop de l'extrem 3' de la seqüència proteica, a 1869 bp. L'últim SECI predit (de grau B) però, no pot ser descartat com a participant en la producció de la selenoproteïna, ja que també es troba a l'extrem 3' de la seqüència, a 81960 bp.

Així l'esquema de la proteïna predita seria: