Teoria sobre Uso de Motivos en Analisis de Secuencias
Practica de Análisis de Secuencias
|
Paso 1 Extraccion de la Secuencia de algun Gen DOF de Arabidopsis con SRS
-
Abrir SRS (en EMBL)
y cliquear en START para empezar la sesion.
-
Seleccionar la Base de Datos SPTREMBL y continuar.
-
Escribir dof en una de las cajitas AllText
y en otra cajita seleccionamos Organismo y ponemos Arabidopsis y A Buscar(Do Query).
-
Cliquear en cualquiera de las 11 entradas resultantes (Entrada ejemplo)
-
Grabar esta secuencia como Texto
Si echais un vistazo a las anotaciones presentes en SRS para esas once
secuencias, podemos hacernos una idea de con que proteinas estamos
tratando, Keywords: Zinc Fingers - Transcription Factors
Paso 2 Busquedas Blast con Dof
-
Conectar con la Pagina Web de Busquedas Blast (en EMBL
)
-
Echarle un vistazo a la pagina y a las diferentes ayudas.
-
Introducir la Secuencia proteica de Dof en el campo de texto
-
Seleccionar la base de datos nrdb
-
Cambiar el numero de Descripciones y Alinemientos : Ponerlo a 100
-
Podriais enviar la Busqueda cliqueando al Botoncito Submit Query
, pero para no saturar
el servidor y para ahorrar tiempo, los resutados estan Aqui
-
Analisis de Resultados.
Echadle un vistazo a las secuencias encontradas (estan lincadas a SRS)
y a los diferentes campos de los resultados blast.
En este caso el grafico de rallitas
es muy informativo, que significa?.
La secuencia Query ha sido filtrada (algunas residuos han sido sustituidos por X automaticamente),
por que?
-
Cliquear en Get the selected sequences para cojer las
secuencias homologas a Dof.
Grabar estas secuencias como Texto
(Por si hay algun problema en la conexion, Podeis Tomar las secuencias Aqui
Paso 3 Alineamiento de las Proteinas Dof con ClustalW
-
Abrir el servidor ClustalW (en EBI)
Echarle un vistazo a las diferentes Ayudas y Parametros .
-
Introducir las Secuencias Dof obtenidas del blast anterior.
(Mejor cliquear a Browse)
-
De igual forma que antes, podriamos Cliquear en RUN CLUSTALW, pero para no
saturar el servidor del ClustalW, podemos ver los resultados Aqui
-
Analisis del Alineamiento
Que podemos decir de las Proteinas Dof?
Se podia prever este resultado a partir de los Resultados Blast?
(la pista es el campo de rallitas).
-
Visualizar los alineamientos con buenos programas, nos facilitara
el analisis. Un par de ejemplos de Visores de Alineamientos son:
Con lo visto hasta ahora, hemos encontrado todos los homologos claros
a la proteina Dof con la que empezamos la busqueda.
Tambien hemos definido una region conservada dentro de la familia.
Pero nos queda por Responder la Pregunta de:
Existen otras familias de proteinas lejanamente relacionadas con Dof?
Paso 4 Analisis de la Secuencia Dof con Prosite
-
Abrir el servidor Prosite (en ISREC)
-
Seleccionad Prosite profiles (NScore) y Prosite patterns (no score)
-
Introducir una de las Secuencias Dof en el campo de texto
-
Cliquear en Run ProfileScan
-
Analisis de Resultados
Veis algo en claro?
Paso 5 Analisis Pfam de la Secuencia Dof (hidden Markov models)
-
Abrir el servidor de Pfam (en Sanger Center)
Echadle un vistazo a las Diferentes formas de buscar en esta base de datos de Alineamientos.
-
Cliquear en PROTEIN SEARCH.
-
Introducir la Secuencia Dof correspondiente a la zona conservada en la familia, en el campo de texto mayor.
Por ejemplo:
LKCPRCDSPNTKFCYYNNYNLSQPRHFCKSCRRY
WTKGGALRNVPVGGG
SRKNATKRSTSSSSSAS
-
Cambiar E-value cutoff level: a un valor de 100
Esto hara que la busqueda sea mas permisiva.
-
Al igual que antes, podriamos Cliquear en Search Pfam, pero para no
saturar el servidor y ahorrar tiempo, podemos ver los resultados Aqui
-
Analisis de los Resultados Pfam
Que podemos decir de las Familias que aparecen en la busqueda Pfam?
Cliquear en los Dominios mas Interesantes(Son Factores de Transcripcion):
-
Campos Pfam
- Enlaces a PROSITE (el SRS-UK suele ser mas rapido)
- Alineamientos (Mejor seleccionar el completo - Full)
- Organizacion de Dominios (Mejor seleccionar el semilla - seed)
Que podemos decir de la organizacion de Dominios de la familia GATA?
- Echadle tambien un vistazo a la distribucion en Especies - Species Distribution
Tan solo con los resultados obtenidos de Pfam, nos resultaria
imposible discernir a cual de los dos factores de transcripcion
se parece nuestra familia Dof (GATA o TFIIS).
Pero si la Prediccion de Estructura Secundaria (PHD) de Dof nos
diese el siguiente Resultado:
AA LKCPRCDSPNTKFCYYNNYNLSQPRHFCKSCRRYWTKGGALRNVPVGGGSRKN..ATKRSTSS
PHD_sec EEEE HHHHHHHHHEE EEEE
Rel_sec 999999999995476449999997134423443114799465637999997699999998999
SUB_sec LLLLLLLLLLLL.EE..LLLLLLL............LLL.EEE.LLLLLLLLLLLLLLLLLLL
Con cual de las dos familias relacionariais a Dof???
(Las estructuras secundarias de GATA y TFIIS las podeis ver en
los alineamientos completos suministrados por Pfam)
Espero que llegueis a conclusiones parecidas a las que llego esta gente:
Shimofurutani N, Kisu Y, Suzuki M and Esaka M
Y para terminar, un vistazo a la estructura de GATA.
Fijaos en como las diferentes Cys coordinan el Zinc.
Otras Figuras son:
Clustalw & Phylodendron
Podeis probar con este alineamiento
[CNB]
[Protein Design Group]
[- Curso -]