Família SelK

Sel K és una petita selenoproteïna (16KDa) que s'ha trobat localitzada a la membrana reticle endoplasmàtic i a la membrana cel·lular i, tot i que és expressada en tots els teixits, s'ha trobat en nivells especialment elevats al cor, melsa i testicles humans. La seva funció no està del tot elucidada, però s'ha observat que la seva sobreexpressió en cardiomiòcits redueix els nivells de ROS, tot i que els mecanismes a partir dels quals això s'aconsegueix no estan clars.

A l'hora de localitzar aquesta família de proteïnes al genoma de Condylura cristata, s'han utilitzat les querys provinents de Mus musculus i Homo sapiens. Aquesta última espècie tan sols presenta un membre en aquesta família, anotada com a SelK, i a la que ens referirem com a SelK1. Per altra banda, la base de dades SelenoDB diferencia entre dotze isoformes en Mus musculus.

A partir d'això, amb l'anàlisi de les dades s'ha observat que tan sols una de les isoformes de Mus musculus presentava uns alineaments prou bons com per ser considerada present en l'espècie Condylura cristata. És amb els resultats obtinguts d'aquesta query i la d'Homo sapiens a partir dels quals s'ha realitzat l'anàlisi.

Primer de tot, el blast alinea la query d'Homo sapiens amb sis regions genòmiques, mentre que la de Mus musculus queda alineada tan sols amb cinc. La regió no coincident ha sigut descartada, i a partir d'aquí s'ha escollit tres scaffolds amb possibilitats de contenir la seqüència proteica codificant.

S'ha considerat que el scaffold gi|385726839|gb|JH655889.1| conté la seqüència proteica, però molt degenerada, motiu pel qual s'ha cregut convenient classificar-lo com a duplicació o pseudogen. El scaffold gi|385726838|gb|JH655890.1| també conté la seqüència proteica, però amb un e-value elevat en ambdues querys en comparació amb altres regions. Això fa pensar que aquest contingui una duplicació del gen de SelK funcional, i que sigui el scaffold gi|385726847|gb|JH655881.1|, amb un e-value més reduït (en Homo sapiens de 1e-12 i en Mus musculus de 9e-11) i no coincident amb altres proteïnes, el que conté la seqüència de SelK expressada.

Per tant, a mode de conclusió es pot dir que el genoma de Condylura cristata conté tres seqüències coincidents amb la proteïna SelK, una d'elles pseudogen o duplicació, l'altra duplicació, i finalment, al scaffold gi|385726847|gb|JH655881.1| conté la seqüència codificant, a la cadena sense (+), entre les posicions 46071 i 52959.

    Aquí es pot veure l'exonerate i el t-coffee del que s'ha considerat com a duplicació o pseudogen corresponent a l'scaffold gi|385726839|gb|JH655889.1|.
    Aquí es pot veure l'exonerate i el t-coffee del que s'ha considerat duplicació o pseudogen corresponent a l'scaffold gi|385726838|gb|JH655890.1|.

Així doncs, l'exonerate prediu una proteïna en aquest scaffold de tres introns i quatre exons amb ambdues querys. Tot i això, tant sols l'exonerate realitzat amb la query d'Homo sapiens alinea la selenocisteïna de la query amb un codó stop al genoma de Condylura cristata, mentre que l'exonerate de Mus musculus no alinea cap selenocisteïna de la query, tot i que aquesta si que en té. El t-coffee per la seva banda, sí que alinea les selenocisteïnes de les dues querys amb GAPs, motiu pel qual s'ha considerat com a no vàlid l'exonerate obtingut a partir de la query de Mus musculus. D'aquesta manera es dedueix que la selenoproteïna es troba conservada tant en Mus musculus com en Homo sapiens, i al genoma de l'espècie analitzada, Condylura cristata.

Per últim, la recerca d'elements SECIs dóna lloc a quatre resultats, un d'ells no vàlid, pel fet de trobar-se en posicions intermèdies a la seqüència proteica. Dels altres tres, el representat a l'esquema, de grau B, es troba a 13892 bp de l'extrem 3' de la proteïna. Els altres, també de grau B, es troben un a 18363 bp, i l'altre a 75588 bp, i tot i la distància no poden ser descartats.

Així l'esquema de la proteïna predita seria: