Luis Sánchez Pulido, Manuel J. Gómez, Federico Abascal
| Guía para realizar estas prácticas:
1a) Terminar las prácticas de Bases de Datos y Alineamiento de secuencias. 1b) Terminar las prácticas de Motivos y Dominios, y Familias de proteínas. -Objetivos: todos los alumnos deben ser capaces de acceder a información en las bases de datos del NCBI y SRS, y usar y entender las aplicaciones y / o servidores de BLAST, Clustal, Belvu, PsiBLAST, Prosite, Pfam y COGs.2) Realización del estudio de una proteína (caso 1 o caso 2) por equipos. -Objetivos: tratar de averiguar lo máximo posible acerca de una proteína de modo que se pueda proponer una hipótesis acerca de su función, utilizando las herramientas de análisis de secuencias mencionadas arriba. |
Hemos clonado y secuenciado un trozo del genoma de Escherichia coli
que creemos
que puede tener algún gen interesante. La secuencia es:
ataatagccatcacgcgtctccgttttgctgtttagcaggcctcatcagagagtcgctgc
gacctcatcagagatttcaccgttatggtaaacttcctgcacgtcgtcgcaatcttccag
catatcgatcagacgcatcagtttcggtgcggtttctgcatccatatcagctttggtaga
cgggatcatggaaacttccgcgctgtctgctttcagacctgccgcttccagagcgtcgcg
cactttacccatttcttcccatgcagtgtagacatcaatcgcgccgtcatcataggtcac
aacgtcttcagcacctgcttccagtgctgcttccatgatggtgtcttcatcgcctttctc
gaaggagatcacgccttttttgctgaacagataggcaacggaaccatcagtaccgaggtt
accgccacatttgctaaatgcatgacgcacttcagcaacggtacggttgcggttgtcaga
cagacattcaatcatgattgccgtgccgccaggaccgtaaccttcgtagatgatggtttc
catgtttgcatcatcatcaccgcccacaccacgtgcaattgcgcggttcagtgtgtcacg
ggtcatgttgttagacagtgctttatccaccgccgcacgcagacgcgggttagcgtccgg
atcgccaccgcccagcttagccgcggttaccagctcacgaatgattttagtgaagatttt
accgcgcttagcatcctgcgcagctttacgatgtctggtgttggcccatttactatgacc
tgccataaaaatatctccagatagccctgcctgttcaggcagcgttaattacaaactgtt
caatcgcctgccggttgctccaggacttagtgagcgccgccgcagcaggcg
¿Contiene algún gen? (BLAST,
orfind,
...) Si es así, determina la secuencia de aminoácidos
correspondiente e intenta predecir la función
de la proteína usando las
herramientas que ya conocemos.
Algunos consejos generales (para los dos casos):
Buscad homólogos de función conocida,
averiguad si se conoce la estructura 3D de la proteína,
estudiad la distribución filogenética del gen,
la organización de dominios,
leed bibliografía...
En último término (si los homólogos no os dan
información) podéis utilizar servidores como el de COGs
y STRING. ¿Por
qué pueden resultar útiles?