Els tres documents bàsics que ens van permetre analitzar de forma automàtica els resultats del blast són els següents:

blast.ordenat: fitxer de text que conté la informació necessària del blast resultant de la comparació entre el genoma humà i el genoma de Nomascus leucogenys. Consta de tantes línies com scaffolds d’interès. Cadascuna conté el nom de la query (selenoproteïna humana), el scaffold (regió del genoma de Nomascus leucogenys amb homologia amb la query), posició d’inici del scaffold i posició final del scaffold.

autoanalysis.sh és un petit programa que llegeix el fitxer de dades (blast.ordenat) on hi ha la informació del tBLASTn necessària per procedir amb el programa commands.sh, de manera que extreu automàticament aquesta informació i permet el processament d’aquestes dades pel programa commands.sh. Quan s’acaba d’analitzar un scaffold concret (una línia) fa que s’executi un altre cop el programa amb la línia posterior. Això succeeix de forma automàtica fins que arriba a l’última línia del fitxer de dades.

commands.sh programa que realitza automàticament el protocol descrit a materials i mètodes. Fa el Fastafetch, Fastasubseq, Exonerate, Genewise, FastaseqfromGFF, Fastatranslate, T-coffee de les dues prediccions i cerca d’elements SECIs. Els resultats de cada programa són emmagatzemats en diferents arxius que es creen de forma automàtica i que podem identificar fàcilment. A més, tots aquests documents es guarden automàticament en una carpeta que conté el nom de la query i del scaffold.