Proteïnes analitzades

A continuació es mostra una taula on figuren totes les proteïnes estudiades i el nivell d'homologia trobat. Les proteïnes s'han classificat en dos grups en funció de si són selenoproteïnes o maquinària.

Per tal de veure els resultats obtinguts en cada proteïna i la discussió d'aquests, selecciona el nom de la proteïna:

Selenoproteïnes

Família Proteïnes Homologia
GPx GPx1 Sí (U)
GPx2
GPx3
GPx4
GPx5
GPx6
GPx7
GPx8
MsrA MsrA Sí (C)
DI DI1 No
DI2 No
DI3 No
15-kDa 15-kDa No
SelH SelH Sí (U)
SelI SelI Sí (U)
SelK SelK No
SelM SelM No
SelN SelN No
SelO SelO No
SelP SelP No
SelR SelR1 No
SelR2 Sí (C)
SelR3 Sí (C)
SelS SelS No
SelT SelT No
SelU SelU1 No
SelU2
SelU3
SelV SelV No
SelW SelW1 No
SelW2 No
TR TR1 Sí (U)
TR2
TR3
SPS SPS1 No
SPS2 Sí (U)
Lmsel1 Lmsel1 No
LinfSel1 LinfSel1 No
EhSEP EhSEP Sí (C)
SelQ SelQ No
Plasmodium_Sel Plasmodium_Sel1 No
Plasmodium_Sel2 No
Plasmodium_Sel3 No
Plasmodium_Sel4 No
SelTryp SelTryp No



Maquinària

Família Proteïnes Homologia
SBP2 SBP2 No
PSTK PSTK No
Secp43 Secp43 No
SLA/LP SLA/LP
eEFsec eEFsec
tRNAsec tRNAsec
SPS SPS2 Sí (U)

Cerca de noves selenoproteïnes

En la cerca de noves selenoproteïnes primerament s'intenta trobar la possible presència d'elements SECIS mitjançant un programa que prediu la possible formació d'una estructura secundària semblant a la d'un element SECIS en el genoma de P.marinus. S'obtenen 1434 possibles elements SECIS classificats segons l'energia lliure que produeix adquirir la conformació d'element SECIS.

La presència de tots aquest elements en P.marinus és impossible, per això es decideix fer un cribatge segons l'energia lliure.

Primer es seleccionen aquelles conformacions amb una energia lliure menor de -30 J, obtenint només set possibles elements SECIS Per veure el fitxer clica aquí

El problema és que alguns dels elements SECIS trobats en P.marinus de selenoproteïnes conegudes no apareixen, per això es decideix fer un cribatge a partir de l'energia lliure dels elements SECIS obtinguts en la cerca de selenoproteïnes conegudes. D'aquesta manera s'obtenen tots el possibles elements SECIS amb una energia lliure de conformació menor a -20 J. Per veure el fitxer clica aquí

S'obtenen quasi 400 possibles elements SECIS, per això es decideix utilitzar un programa en Perl per analitzar-los i acabar extraient la seqüència corresponent a la regió upstream del possible element SECIS dels contigs, per obtindre la regió peptídica. Per veure el fitxer clica aquí

El resultat de fer un Blastcl3 nr mitjançant la terminal, per comparar les regions peptídiques extretes amb la base de dades proteiques del NCBI per saber si hi ha proteïnes conegudes, són 1721 alineaments.

Aquests són analitzats amb un programa en Perl que extreu aquells resultats en els que s'ha alineat una selenocisteïna del genoma de P. marinus amb un codó stop o una cisteïna de les seqüències de la base de dades del NCBI.

Tots el alineaments realitzats, 1721, es troben disposats en només 58 dels querys del genoma de P.marinus. Per veure arxiu amb els querys clica aquí


Discussió

La cerca de noves selenoproteïnes ha donat forces problemes ja que en un inici, en la predicció de possibles SECIS, es va obtindre un gran nombre de prediccions. Mitjançant diferents programes s'ha anat reduint el nombre de possibles selenoproteïnes noves, fins a trobar-nos que poden estar ubicades en les seqüències de 58 querys diferents del genoma P.marinus.

 

Universitat Pompeu Fabra