Detecció de proteïnes ortòlogues en Plasmodium berghei

Per tal de detectar si el genoma de P. berghei contenia selenoproteïnes ja descrites en altres espècies i anotar-les en el nostre genoma vam establir un protocol comú:

Cerca de les seqüencies de les proteïnes ortòlogues

Les seqüències de selenoproteïnes descrites en altres organismes es van extreure de la base de dades SelenoDB. En primer lloc, es van prendre les seqüències pertanyents a humans. Tot hi això, en el cas de no obtenir bons resultats amb aquestes, es va procedir a buscar les seqüències de les selenoproteïnes en espècies de Plasmodium properes a la nostra. Aquesta cerca es va realitzar en la base de dades del ncbi. Finalment, les selenoproteïnes de protistes ens van ser facilitades pels tutors del projecte.

Cerca de selenoproteïnes en el nostre genoma

Un cop aconseguides les seqüències en altres organismes, aquestes es van utilitzar per a realitzar un tBLASTn contra el nostre genoma. En el cas d'haver obtingut valors d'E-value inferiors a 10-4 es van seleccionar els contigs que contenien la seqüència d'interés. En el nostre cas, en aquest punt, ja podiem observar si ens trobàvem enfront d'una proteïna que contenia cisteïna o amb una selenoproteïna.

A continuació, es va procedir a utilitzar el programa Exonerate per tal d'anotar les proteïnes detectades en el nostre genoma. En alguns casos, els resultats amb aquest programa no van ser prou concloents i es va realitar el mateix procès amb el programa Genewise.

Per últim, en els casos en els que els programes d'anotació de genomes no ens donaven un alineament complert de la nostra proteïna, es va procedir a trobar els aminoàcids restants traduïnt directament la seqüència que els contenia amb el programa ExPASy.

Per finalitzar amb la descripció de les selenoproteïnes presents al nostre genoma, es va procedir a la cerca dels seus elements SECIS amb el programa SECISearch.