AGRUPAMIENTO (CLUSTERING) DE SECUENCIAS, CON BLAST Y SCRIPTS DE PERL


Manuel J. Gómez,  Protein Design Group, Centro Nacional de Biotecnología, CSIC, Cantoblanco
Ramón Alonso-Allende, Protein Design Group, Centro Nacional de Biotecnología, CSIC, Cantoblanco

Software que debiera estar instalado:

Objetivos de la práctica


Parte 1:

Conseguir un conjunto de secuencias y crear de una base de datos, en formato apropiado para

BLAST.


Parte 2:

Identificacion de clusteres con blastclust.

blastclust -i Mycoplasma_Pep.faa -S 60 -L 0.0 -b T > Myco_blastclust_60.txt
Debieras obtener MAS clusteres de temaño MAS pequeño, formados por secuencias que, tras alinearlas con ClustalW, se vería que son MAS parecidas.

Parte 3:

BLAST por linea de comandos.

blastall -p blastp -d BLASTDATA/Mycoplasma_Pep.faa -i BLASTDATA/Seq2.faa -m 0
blastall -p blastp -d BLASTDATA/Mycoplasma_Pep.faa -i BLASTDATA/Seq2.faa -m 8
blastall
para conseguir información sobre todas las opciones.

Parte 4:

Identificación de clusteres a partir de la salida de BLAST.

blast2adjLists_ed1.pl
blast2adjLists-ed1.pl blast_table e-value

Parte 5:

Ultimas consideraciones.