Predicción de Características Estructurales a Partir de Secuencia.
Ejemplo.
En esta página aparece un ejemplo ya hecho de aplicación
de una serie de métodos de predicción de estructura a una
pequeña proteina. Asimismo, contiene links a los ficheros
de resultado de los distintos programas.
POLYRIBONUCLEOTIDE NUCLEOTIDYLTRANSFERASE (s1 motif) (EC 2.7.7.8) (84 aa.)
AEIEVGRVYT GKVTRIVDFG AFVAIGGGKE GLVHISQIAD KRVEKVTDYL
QMGQEVPVKV LEVDRQGRIR LSIKEATEQS QPAA
Se parece a alguna estructura ?.
Una manera rápida de comprobar si hay alguna proteina de estructura
resuelta que se parezca a nuestra secuencia es hacer un BLAST contra
una base de datos de proteinas cristalizadas. Si la hubiese se aplicaría
diseño por homología en vez de threading.
Esto se puede hacer directamente en SCOP.
Nuestra secuencia no se parece a ninguna cristalizada:
[SCOP BLAST output]
Caracteristicas 1D de la secuencia.
Usamos ProtScale para obtener perfiles de hidrofobicidad y polaridad
y guardamos los resultados en unos ficheros para luego poder incorporar
esta información en otros programas como los visualizadores de mutaciones
correlacioneadas y de los alineamientos implicitos de threading.
[Perfil de hidrofobicidad (fichero '1.add')]
[Perfil de polaridad (fichero '2.add')]
Alineamiento.
Usamos GeneQuiz para, automaticamente, buscar homologos en la base de datos
y generar un alineamiento múltiple que sirviera de input para los
metodos de predicción.
[Alineamiento (HSSP)]
[Alineamiento (MSF)]
Esto se puede hacer tambien de manera no automática: 1) Buscar
con BLAST los homólogos en la base de datos; 2) coger las secuencias
de esos homólogos y generar el alineamiento multiple.
Estructura secundaria.
PHD predice una proteina todo beta con 6-5 beta.
[PHD output]
[Representación grafica de la reliability]
Threading. (TOPITS)
Como es de esperar, TOPITS encuentra proteinas todo beta en lo alto de
su lista.
[fichero HSSP_TOPITS]
[fichero STRIP_TOPITS]
La que mas convence, tanto por el alineamiento como por la biología
(une RNA, como PNS) es 1asz (10 en la lista): Aspartil-tRNA sintetasa.
TOPITS alinea la pequeña PNS con un dominio N-terminal todo-beta
de 1azs que es, precisamente, el encargado de unir tRNA.
[Alineamiento de PNS en la estructura de
1asz]
[Representación lineal del
alineamiento]
1asz tiene una topología beta lamada OB-fold. que es
una topología cerrada (tipo barril). Entre las otras proteinas de
la cabecera de la lista de TOPITS había diferentes topologías
todo-beta dificil de distinguir entre ellas.
Tambien la segunda proteina (1csp) puede ser interesante por
ser un factor de transcripción que une ácidos nucleicos (DNA
en este caso).
a inspeccionar los alineamientos de TOPITS. Para
ello debeis de tener grabados los ficheros PHD, HSSP_TOPITS y STRIP_TOPITS
que estan como links en esta pagina y ejecutar
top_front fichero.hssp_topits fichero.phd fichero.strip_topits
Mutaciones Correlacionadas
Ya que tenemos un buen alineamiento podemos correr mutaciones correlacionadas.
[Representación de las mutaciones
correlacioneadas]
Basicamente, se predice que la segunda beta contacta con la tercera
y con la cuarta.
a ver las mutaciones correlacionadas cambiando
los valores de correlación, conservación, etc. Para ello,
teniendo grabados los ficheros de alineamiento (HSSP) y estructura secundaria
(PHD), corred:
plotcorr fichero.hssp fichero.phd
Otras Aproximaciones...
Cada proteina es un mundo y no hay un protocolo fijo aplicable a todas.
Hay muchísimos mas métodos que se pueden aplicar. Dependiendo
de la información que tengamos sobre nuestra proteina: datos experimentales,
etc; y de los resultados de los programas se pueden hacer mas cosas.
Una pequeña lista:
-
Si hay información sobre residuos importantes, como los del centro
activo (por ejemplo en el fichero swissprot 'ACT_SITE') se puede
chequear en cuales de los modelos implicitos de Threading esos residuos
quedan cerca (formando un centro activo).
-
Si no hay información sobre residuos del centro activo se pueden
buscar residuos conservados en el elineamiento múltiple. La conservación
puede ser indicación de importancia funcional.
-
Para ver si los resultados de un programa de threading son estables,
es decir, si todas o muchas de las proteinas que encuentra con altos ZSCORE
se parecen en estructura se pueden ver los ficheros FSSP de estas proteinas.
-
Consultar en la gerarquia de SCOP las proteinas que estarían en
la clase estructural donde debiera estar la nuestra (por predicción
de estructura secundaria) y ver si alguna tiene biología parecida
a la nuestra, etc.