PRACTICA DE ANALISIS Y COMPARACION DE GENOMAS

J. Tamames, Ramón A.-Allende y M. Gómez


 

1   CONSULTAS EN GENEQUIZ

 
GeneQuiz: es un sistema automático que mantiene bases de datos de genomas anotados. Tambien permite a usuarios externos el enviar secuencias para su análisis, desde una interfaz web (como ésta).

Los resultados que obtenemos en GeneQuiz al analizar una secuencia pueden verse en los dos siguientes ejemplos:

Ejemplo1                                    Ejemplo2
También podemos examinar los resultados de los análisis de genomas realizados con GeneQuiz.

2   CONSULTAS EN SUBTILIST. BÚSQUEDA DE MOTIVOS

Nos conectamos a SubtiList, la base de datos del Instituto Pasteur sobre Bacillus subtilis.
 

  • BÚSQUEDA DE MOTIVOS: genes regulados por SigB.
  • SigB es el gen que codifica para el factor Sigma B, subunidad de la RNA polimerasa que controla la expresión de un cierto número de genes, en respuesta a condiciones de estres. Sigma B  determina el reconocimiento de promotores con la secuencia consenso: -35 (AGGTTT) y -10 (GGGTAT).

    Para intentar identificar genes, en B. subtilis, controlados por Sigma B vamos a utilizar la opción "Search Pattern", en el panel de la izquierda.

    Completamos algunos de los campos que aparecen en el panel superior derecho:

  • 1st Part: AGGTTT.
  • Number of mismatch: 1.
  • Number of letters; min: 15 - max: 17 (puede ser una buena distancia entre las cajas -35 y -10).
  • 2nd Part: GGGTAT.
  • Number of mismatch: 0 (normalmente está mejor conservada la caja -10).
  • Especificamos entonces que queremos ocurrencias en regiones intergénicas, de todo el genoma, y presionamos en "Submit".
  • ¿Cuantos genes aparecen?
    Sería interesante probar con numeros diferentes de mismatches y de distancias entre las cajas -10 y -35.
  • CONSULTA
  • Para hacernos ahora una idea del número de genes anotados como dependientes de Sigma B, volvemos al panel de la izquierda, y en el campo "Free text", escribimos "sigma-B". Presionamos después "Search".

    En el panel superior derecho apareceá una lista de genes, cuyas entradas contienen la palabra "sigma-B". Haciendo click en los nombres de los genes aparece su anotación en el panel inferior.

    ¿Son TODOS los genes dependientes de Sigma B?

    Además de la anotación, el panel inferior ofrece la posibilidad de producir un mapa de la región, o producir una lista, que contiene el gen. Tambien se puede obtener la secuencia del gen o de la proteína seleccionada.

    Prueba estas opciones.

    Intenta buscar otros motivos u otros genes.

    Las mismas opciopnes están disponibles en las otras bases de datos del Instituto Pasteur.
     


    3   ENSEMBL: BUSQUEDA MEDIANTE BLAST Y CONSULTAS

    Usando ENSMBL, vamos a intentar confirmar el modelo para un gen humano que hemos producido anteriormente, en la práctica de Detección y Modelado de Genes.

  • Nos conectamos a ENSMBL, la base de datos de genomas eucariotas del EBI. Seleccionamos "Human" y, en la siguiente página, "Blast".
  • Abrimos otra ventana con la página de la práctica de Detección y Modelado de Genes (esta), y copiamos la secuencia de DNA.
  • La pegamos en la ventana para hacer búsquedas de Blast con ENSMBL, y presionamos "Search".
  • Aparece una ventana que permite recuperar los resultados. Pueden tardar un poco.
  • En el resultado, aparece una lista de las secuencias parecidas encontradas, debajo del esquema del complemento cromosomal humano. Las secuencias más parecidas debieran estar mapeadas sobre un cromosoma, con una caja roja.
  • Poniendo el ratón sobre la caja roja, podemos obtener:
  • El la ContigView aparecen tres paneles:
  • En el panel de Vista Detallada, una linea representa la posición de los Blast Hits. Haz zoom en esa ventana, manteniendolos centrados.

  •  
  • Podrás entonces identificar el nombre del gen.

  •  
  • Pasando el cursor sobre el icono del gen podrás entonces, entre otras cosas:
  • Si en la parte superior de la Vista Detallada presionas "Export - Gene List", tendras la opción de obtener una lista con información sobre la región, en cuanto a


  •  

    4   HERRAMIENTAS PARA LA COMPARACION DE GENOMAS

    En esta parte visitaremos alguno de los servidores que nos permiten realizar comparaciones entre varios genomas.

    Entre los mas interesantes se encuentran:
     

  • MGDB, Microbial genome database. Este servidor nos permite encontrar los genes/proteinas homológos al nuestro en otros genomas, y comparar facilmente su posicion y características.

  •  
  • Realizaremos el siguiente ejercicio:
  • KEGG. Este servidor posee realmente mucha información, y ademas muy util (las dos cosas no siempre van unidas). Es un servidor de datos de metabolismo, genomas completos, genes homólogos entre genomas, genes relacionados con enfermedades, etc.
  • Ejercicios:
  • NCBI:  El último servidor a visitar sera el del NCBI, otro repositorio de información muy completo, que incluye todo tipo de informacion genómica, software, etc.
  •  
  • Ejercicio:



  •  

    Con este ejercicio acabamos la práctica. Si nos sobra tiempo, podemos visitar de modo libre los sitios que hemos conocido hoy.