COMANDES

egrep ENSDARP parelles.txt| sort | uniq -w21 > senserepeticions.txt

La comanda egrep ens permet escollir només aquelles proteïnes de Fugu que tenen el seu homòleg en Zebrafish. Necessitem aplicar la comanda sort prèviament abans d'aplicar uniq. Amb el -w21 aconseguim eliminar les repeticions en les que un mateixa seqüència de Fugu (identificador de 21 caràcters) s'ha alineat amb més d'una de Zebrafish.