Distribució dels SNPs en els gens

ANÀLISI DE DADES


L'objectiu principal d'aquest treball és l'estudi de la distribució dels SNPs en el genoma, tant de ratolí com d'humà i poder comprovar la conservació que presenten les diferents regions del genomai els cromosomes.
Per tal de fer un bon anàlisi dels resultats obtinguts separarem l'apartat en dos grans blocs, un amb l'anàlisi de la distribució dels SNPs en el genoma, i un altre amb la distribució dels SNPs en els gens.

En cada apartat es durà a terme l'anàlisi dels resultats obtinguts tant per a humà com per ratolí ja que d'aquesta manera ens serà molt més fàcil poder extreure'n unes bones conclusions.


DISTRIBUCIÓ DELS SNPs EN EL GENOMA

Per tal de saber la proporció dels SNPs en els cromosomes hem utilitzat els resultats obtinguts a través del programa SNPencromosoma.pl.
A continuació es mostra una taula amb el nombre de SNPs per cromosoma de les dues espècies analitzades.







Com es pot observar, la suma de SNPs totals humans no es correspon amb el nombre total d'SNPs que conté l'arxiu snp.txt, que com ja hem comentat en l'apartat Materials i Mètodes presenta 9.156.175 anotacions d'SNPs. Aquesta difere´ncia de 52.425 SNPs són una s´rie de SNPs que no s'han identificat encara en cap cromosoma i en la columna de les anotacions corresponent al número de cromosoma observem la paraula "UNKNOWN", indicant que es tracta d'una anotació d'un SNP que encara no es coneix a quin cromosoma pertany. Per contra en el cas del ratolí no observem cap problema ja que la suma total de SNPs es correspon amb el nombre de SNPs anotats en l'arxiu snpMap.txt.


En el següent gràfic s'observa la distribució dels SNPs en els diferents cromosomes. (Per a una millor comparació entre ambdues espècies es presenten amb el mateix color cada número de cromosoma).

Com que no tots els cromosomes presenten el mateix tamany, hem mirat quin era el tamany de cada cromosoma, tant per humà com per ratolí a través de la base de dades NCBI. En la següent taula s'indica el tamany de cada cromosoma.




En el següents gràfics podem veure el tamany de cada cromosoma




Amb totes aquestes dades hem calculat la proporció d'SNPs per cada Mb de DNA dels cromosomes, amb el què així tenim uns valors per a cada cromosoma que ja poden ser comparables entre ells i dels quals ja en podem treure conclusions.


En el següents gràfics es mostren aquestes proporcions tant per als cromosomes humans com per als del ratolí.






DISTRIBUCIÓ DELS SNPs EN LES DIFERENTS REGIONS DEL GENOMA

Per tal de saber quina era la distribució dels SNPs en les diferents regions dels genoma hem utilitzat els resultats obtinguts amb el programa SNPenregio.pl
Com a mode d'introducció mostrem una taula on observem els SNPs presents a cada regió i a continuació realitzem un gràfic amb la proporció d'SNPs per cada regió; calculem el % d'SNPs de cada regió a partir del nombre total d'SNPs que hi ha descrits en el genoma: 9.156.175 SNPs per al genoma humà i 408.131 per al genoma de ratolí.







Així a primer cop d'ull Observem que la regió que conté més SNPs és la intergènica, tant en el genoma humà com en el de ratolí
A continuació anirem desglossant la informació que obtenim a partir del gràfic i anirem analitzat cada regió per separat.

ANÀLISI DE LES REGIONS GÈNIQUES

A partir dels resultats que es mostren a la taula, hem realitzat un gràfic on es mostra la proporció de cada regió gènica.






ANÀLISI DE LES REGIONS UTR (UNTRANSLATED REGIONS)

En els gràfics següents es mostra la distribució dels SNPs en les regions UTR.



Com es pot observar,per ambdos casos obtenim una distribució equilibrada entre la regió UTR 5' i UTR 3'.



ANÀLISI DELS SPLICE SITES (DONOR/ACCEPTOR)

Ja per acabar l'anàlisi mostrem un gràfic que on s'observa la distribució dels SNPs dins les regions d'splicing.



A primera vista ja veiem que hi ha un % molt elevat d'SNPs que cauen en regions donor mentre que un nombre molt més baix cau en regions acceptor.


Introducció Materials i mètodes Anàlisi de dades Conclusions