Predicción de estructura
Características 1D de la secuencia
Se denominan características en una dimension (1D) de la secuencia a aquellas que se
pueden representar por un valor simple asociado a cada aminoácido (B. Rost). Por ejemplo, la estructura secundaria
(valor asociado: estado en H, B o loop); accesibilidad (valor asociado: expuesto o interior; o tambien
pordentaje de accesibilidad); hidrofobicidad, etc.
Algunas de estas características, como la hidrofobicidad, estan tabuladas; otras, como la estructura
secundaria, se pueden predecir con cierto grado de acierto.
Estas características 1D de la secuencia ayudan luego en la predicción de estructura
tridimensional (3D).
En esta práctica se mapean algunas características extraidas de la secuencia e
información
experimental en extructuras 3D conocidas para ver su relación con la estructura
tridimensional y su posible uso en predicción de estructura.
Programas/Servidores.
- Localizar el fichero PDB con la estructura 3D.
- A partir de la secuencia:BLAST contra PDB.
- Si se conoce el identificador PDB:
Directamente en PDB o a traves de SRS.
- Localizar la entrada en la base de datos de secuencias y extraer información de ella.
- A partir de la secuencia:BLAST.
- A partir de un identificador: SRS
- Caracteristicas de residuos (hidrofobicidad, etc).
ExPASy ProtScale.
- Estructura secundaria. Accesibilidad al solvente. Hélices TM, ...
PredictProtein.
- Conservación. Generación de un alineamiento múltiple de secuencias.
- BLAST contra base de datos de secuencia + ClustalW
- Usar el que muchos servidores generan como paso intermedio (PredictProtein).
- Regiones coiled-coil.
Coils.
- Motivos de secuencia.
Prosite.
Ejemplo ya hecho.
Ras (p21) humano. Código PDB: 5p21
MTEYKLVVVGAGGVGKSALTIQLIQNHFVDEYDPTIEDSYRKQVVIDGETCLLDILDTAG
QEEYSAMRDQYMRTGEGFLCVFAINNTKSFEDIHQYREQIKRVKDSDDVPMVLVGNKCDL
AARTVESRQAQDLARSYGIPYIETSAKTRQGVEDAFYTLVREIRQHKLRKLNPPDESGPG
CMSCKCVLS
Resultados.
Casos para hacer.
Proteina 1.
MSKPQPIAAANWKCNGSQQSLSELIDLFNSTSINHD
VQCVVASTFVHLAMTKERLSHPKFVIAAQNAIAKS
GAFTGEVSLPILKDFGVNWIVLGHSERRAYYGETNE
IVADKVAAAVASGFMVIACIGETLQERESGRTAVV
VLTQIAAIAKKLKKADWAKVVIAYEPVWAIGTGKVA
TPQQAQEAHALIRSWVSSKIGADVAGELRILYGGS
VNGKNARTLYQQRDVNGFLVGGASLKPEFVDIIKATQ