InicioIntroducciónMaterial y métodosResultadosConclusionesAgradecimientos
Resultados

Resultados




Índice:

Análisis de las secuencias. Motivos de longitud 6

Al ejecutar el programa se obtienen dos ficheros: uno en el que quedan guardados los motivos comunes y las diferencias de las frecuencias relativas (frecuencias relativas de exones constitutivos menos exones alternativos), y otro en el que quedan guardados los motivos no comunes. En este caso todos los motivos aparecen en ambos tipos de exones. El número total de motivos distintos es 4096, que coincide con el número máximo de posibles combinaciones de motivos de 6 posiciones y 4 elementos distintos por cada posición (46 = 4096).

A partir del fichero de motivos comunes y con el programa R, se obtiene un histograma que representa la distribución de los datos: distribución de la distancia de las frecuencias relativas de cada uno de los motivos comunes.

Para poder determinar aquellos motivos cuya presencia significativa dentro de los exones alternativos o alternativos se tiene que hacer un analisis teniendo en cuenta los valores de Z-score de cada motivo, y compararlos con un Z-score de referencia.

El valor Z-score de referencia se obtiene buscando el valor de la probabilidad asociada al azar (1/4^k, donde k es la longitud de la ventana) en tablas de estadística de valores de Z-score.

Para cada motivo y usando el programa R se ha calculado el valor de Z-score para cada uno de ellos, obteniendo los resultados siguientes: Z-score.En este link se encuentran los motivos comunes asociados a la diferencia de las frecuencias relativas y el valor de Z-score. Estos últimos valores se han representado en un histograma.

De esta distribución nos interesan aquellos motivos que tienen un Z-score menor al de referencia, en este caso -3.6, que corresponderán a aquellos motivos que se encuentran de forma significativa en los exones alternativos.

Finalmente, con la orden gawk, se pudo extraer aquellos motivos que tenían un Z-score menor que -3.6 .Los resultados mostrados a continuación indican aquellos motivos comunes que se encuentran con frecuencia significativa en los exones alternativos:

Motivos Z-score
TGGCTG -4.273
CAGTGG -3.645
TGATGA -4.140
CAGAAG -3.6626
GAAGAA -3.619
GGAGAA -4.209
TGGAGA -5.261
AGAAGA -5.167
AAGAAG -4.8064
AGGAAG -4.137
GAGGAG -3.841

A continuación también se muestran aquellos motivos que se encuentran con una frecuencia significativa en los exones constitutivos (aquellos que tienen un valor de Z-score mayor a 3.6).

>
Motivos Z-score
TTGTTT 4.726
AAAAAA 6.413
AATAAA 5.606
CGGCGG 4.1215
AAATAA 3.9986
TTTGTT 3.728
GGCGGC 4.614
TGTTTT 3.923
TGTGTG 4.112
TTTTGT 3.983
TATTTT 5.392
ATTTTT 3.90
TTTAAA 5.394
TTAAAA 3.722
TTTTTT 13.654
TTTTAA 5.162
GTTTTT 3.8195
GCGGCG 4.4344
TTTTTA 6.0657
TTTCTT 4.784
GTGTGT 3.6454
TTATTT 4.8347


Análisis de las secuencias. Motivos de longitud 7

Ahora se vuelve a hacer el mismo procedimiento pero cambiando la longitud de la ventana y cogiendo 7 nucleótidos. De esta manera se obtienen dos ficheros: uno en el que quedan guardados los motivos comunes y las diferencias de las frecuencias relativas (frecuencias relativas de exones constitutivos menos exones alternativos), y otro en el que quedan guardados los motivos no comunes. Dentro de este fichero estan tanto los motivos que se encuentran exclusivamente en los exones constitutivos como en los alternativos.

Con los resultados de los comunes se ha obtenido el siguiente histograma:

Para conseguir el z-score de refencia en este caso, hemos recurrido a la web fourmilab. En esta web introducimos el valor de la probabilidad asociada al azar y nos dio un resultado de 3.84. Este valor fue el utilizado para discriminar aquellos motivos que eran significativos de los exones alternativos (aquellos con un Z-score menor a -3.84), que se encuentran en motivos significativos. Por otra parte, también se obtuvieron los motivos que se encontraban de forma significativa en los exones constitutivos (que corresponden a los motivos con un z-score mayor que 3.84) que se encuentran en motivos significativos de exones constitutivos.



Análisis de las secuencias. Motivos de longitud 8

Ahora se vuelve a hacer el mismo procedimiento pero cambiando la longitud de la ventana y cogiendo 8 nucleótidos.De esta manera se obtienen dos ficheros: uno en el que quedan guardados los motivos comunes y las diferencias de las frecuencias relativas (frecuencias relativas de exones constitutivos menos exones alternativos), y otro en el que quedan guardados los motivos no comunes.Dentro de este fichero estan tanto los motivos que se encuentran exclusivamente en los exones constitutivos como en los alternativos.

Con los resultados de los comunes se ha obtenido el siguiente histograma:

En este caso también se ha recurrido a fourmilab, y el valor z-score de referencia para los motivos de 8 nucleótidos es de 4.17. A partir de aquí se obtuvieron los siguientes motivos significativos en los exones alternativos. Además se buscaron los motivos que aparecín de forma significativa en exones constitutivos.

Volver al índice