Prácticas de Análisis de Secuencias

Luis Sánchez Pulido, Manuel J. Gómez, Federico Abascal



 
Guía para realizar estas prácticas: 

1a) Terminar las prácticas de Bases de Datos y Alineamiento de secuencias.

1b) Terminar las prácticas de Motivos y Dominios, y Familias de proteínas.

-Objetivos: todos los alumnos deben ser capaces de acceder a información en las bases de datos del NCBI y SRS, y usar y entender las aplicaciones y / o servidores de BLAST, Clustal, Belvu, PsiBLAST, Prosite, Pfam y COGs.
2) Realización del estudio de una proteína por equipos.
-Objetivos: tratar de averiguar lo máximo posible acerca de una proteína de modo que se pueda proponer una hipótesis acerca de su función, utilizando las herramientas de análisis de secuencias mencionadas arriba.

-Cada alumno (de forma individual) tendrá que redactar una memoria razonada acerca del análisis realizado: qué pasos se han seguido, por qué,... (de 1 o 2 páginas -¡no más!-), que contará de cara a la calificación final del curso. Se podrá entregar impresa o por correo electrónico.

Fecha de entrega: 22 de Julio (Viernes).

-El esfuerzo de confeccionar la memoria debiera de servir para organizar los conocimientos que estais adquiriendo en el contexto general de los métodos de análisis de secuencias.

Secuencia procariota

Hemos clonado y secuenciado un trozo del genoma de Escherichia coli que creemos
que puede tener algún gen interesante. La secuencia es:

 ataatagccatcacgcgtctccgttttgctgtttagcaggcctcatcagagagtcgctgc
 gacctcatcagagatttcaccgttatggtaaacttcctgcacgtcgtcgcaatcttccag
 catatcgatcagacgcatcagtttcggtgcggtttctgcatccatatcagctttggtaga
 cgggatcatggaaacttccgcgctgtctgctttcagacctgccgcttccagagcgtcgcg
 cactttacccatttcttcccatgcagtgtagacatcaatcgcgccgtcatcataggtcac
 aacgtcttcagcacctgcttccagtgctgcttccatgatggtgtcttcatcgcctttctc
 gaaggagatcacgccttttttgctgaacagataggcaacggaaccatcagtaccgaggtt
 accgccacatttgctaaatgcatgacgcacttcagcaacggtacggttgcggttgtcaga
 cagacattcaatcatgattgccgtgccgccaggaccgtaaccttcgtagatgatggtttc
 catgtttgcatcatcatcaccgcccacaccacgtgcaattgcgcggttcagtgtgtcacg
 ggtcatgttgttagacagtgctttatccaccgccgcacgcagacgcgggttagcgtccgg
 atcgccaccgcccagcttagccgcggttaccagctcacgaatgattttagtgaagatttt
 accgcgcttagcatcctgcgcagctttacgatgtctggtgttggcccatttactatgacc
 tgccataaaaatatctccagatagccctgcctgttcaggcagcgttaattacaaactgtt
 caatcgcctgccggttgctccaggacttagtgagcgccgccgcagcaggcg
 

¿Contiene algún gen? (BLAST, orfind, ...) Si es así, determinad la secuencia de aminoácidos
correspondiente e intentad predecir la función de la proteína usando las
herramientas que ya conocemos.
 

Algunos consejos generales:
- Buscad homólogos de función conocida,
- Averiguad si se conoce la estructura 3D de la proteína,
- Estudiad la distribución filogenética del gen,
- Analizad la organización de dominios,
- Leed bibliografía...
- En último término (si los homólogos no os dan información)
podéis utilizar servidores como el de COGs y STRING.
¿Por qué pueden resultar útiles?