Práctica Procariotas 1
Esta va a ser una práctica muy sencilla donde vamos a usar herramientas para identificar secuencias codificantes en un fragmento de ADN extraido de una nueva especie bacteriana relacionada con el género Streptomyces. Al igual que en las aplicaciones destinadas a predecir la estructura de un gen eucariota, las herramientas para identificar genes en bacterias pueden combinar varias estrategias. En este ejemplo usaremos un servidor que analiza el contenido en G+C de la 3 base y combina esa medida con la predicción de fases abiertas de lectura y la búsqueda de secuencias similares con BLAST.
Secuencia
>Str
GAATTCCACGGACTGCTGTATATTCAGCTCGCCGGCAACCGCATGCTGGAGCACCTCTAA
GGCATCGTCTCCGCCGCCCTCCAGACATCCAGCGGCCCGGCCACCGGCTGCGACCGGCCC
AACGAGACCTCTCTCGCACACCACCAACGCCCAATCGACACCCTCGCCGAGGGCGACGGC
GCCGCCACAGAGCACGCCATGAAGCAGCTCCTGACCGCCAGACCCGAGGTGGAGCGGGTC
GTCCCCGGACCGCGCGAGCAGCACGAACCCTCGCGGCCCACGGCGCGCCCTCCGCCGCCT
TCCGGTCCGCCGTAACTGCTGCCCCCCGTCCTGCCGGCCACCCCGCGGATCCCGCGAGCG
GGGAGGCCGGCGATTGCCGCGGCCCGGCCACCCGCCCCGGACGCCCCCGCACCGGGAGCC
GACCCGGGGAAACGTTCCCTCCCGCCCGCCCGGGCGACACGAAACCCCCTGTCGGCCCGA
GCAAGCCCGCCGCTAGGGGCCGCCATGTTTGCCGCCCGGGCGCGTATGCGCCGTAGCGCG
TAAGAGGAACGTGGGCGCGTAAGGGGAAGGTCAAGGAAGGTATGCGTCGCACCGGACGGA
GCCGGAGTACGGTCGGACACCCCGGTGGCTCCTTGCCGCAGCGGGCCGTACCGCGCACCG
TGCTCGGGGCTCCCCGTGACCGGAGTCCGGGCCTCCGGAGCTTCACGGCATCTTTATGTC
GCCCTCTGTAGACGCGGGTCGGAGAATTTTGACCGATATAGGGGTGTGACTCGGGCCACG
CACATTGGGCGTAACGCTCGACCGGGCAGCGCGATGACCTAAGAGGTGCCCATAGAAGAG
GGAATGCGGTCGTCGTTCGTGGCGCTGTACCCCCTCAATGCCGGTCCCGCAACGTCCCCG
GTCCAATCCCAGCCGTGGGTCGTCGGCTCCCGTCCTTCACCCAGGACAGGGGCCGGAAGC
CGTTATTCAACGTTCCGAGAGGTTGTTCGTGTCGGCCAGCACATCCCGTACGCTCCCGCC
GGAGATCGCCGAGTCCCAGTCTGTGATGGCGCTGATTCCGCGGGGAAAGGCTGATGGGAT
GATCGCCGGCGACGACGTGCGAAGGGCCTTCGAAGCTGACCAGATATACCCGGCGCATCA
GTGTCTGAAGAACGTTCTGCGCAGCCTCAATCAGATCCTCGAGGAAGAGGGTGTGACGCT
GATGGTCAGGTGGGCGGAGCCCAAGCGCACCCGAAAGAGCGTCGCAGCAATGAGCCCGGC
GAAGCGTCTCGCCACCACCAGGACCATGGTGGCCGCCAAGGCGGCCCCGGTGAAGAAGAG
CGCCCCCGCGGCCGCGCCCACGGACGAGGAGTCCGAACAGCCCGTGAAGAAGGCCGCGGC
CAAGAACGTCACCGCCAAGAAGACGGCGAAGAAGGCGACGGCGAAGAAGACCGCCGCCAA
GAAGACCGCGGCCAAGAACGTCGTCGACGAGCTGCTCGACGACGAGGCCGAGGAGAAGCC
CATCACCGGCAAGCCGGGCGAGGAAGGCGCGCCCGAGGGAACCGGCGGCGAGAGCCAGGG
CTTCGTTAGGTCCGACGACGACGAGGACCTCGCGCCCGCCCATTCGGTCGCGGCCGCCGG
TGCCACCGCCGACCCGGTCAAGGACTACCTCAAGCAGATCGGCAAGGTCCCCCTCCTCAA
CGCCGAGCAGGAGGTCGAACTCGCCAAGCGCATTTCGGCCGGCCTCTTCGCCGAGGACAA
GCTCGCCAACGCCGACAAGATCGCCCCCAAGCTCAAGTGCGAGCTAGAGATCATCGCCGA
GGACGGCCGCCGCGCCAAGAACCACCTATTGGAGGCCAACCTCCGCCTCGTGGTCTCGCT
GGCCAAGCGCTACACCGGCCGCGGGTTCATGCTCTTCCTGGACCTGATCCAGGAGGGCAA
CCTCGGTCTGATCCGCGCGGTCGAGAAGTTCGACTACACCAAGGGCCGCAAGTTCTCCAC
GTACCACACCTGGTGGATCCGGCAGGCGATCAACACCCGCGCCATGGCCGACCAGGCCCG
CACCATCCGTATCCCGGTGCACATGGTCGACTCGGTCATCAACAAAAGGGCCCGCGTGAC
GCGTCAGATGCTCCAGGACCTGGGCCGCGAGCCCACCCCGGAGGAGCTGGCCAAGGAACT
CGACATGACCCCCGAGAAGGTCATCGAGAGGGCGAAGTACGGCCGCGAGCCCATCTCCCT
GCACACCCCGCGCGGCGAGGAGGCCGGGGCCGACAGCGAGTTACGTGACCTCATCGAGGA
CTCCGAGGCGGTCGTCCCCCCCGACGCGGTCTCCTTCACGCTCCTCCAGGAGCAGCTGCA
CTCCGTCCTCGACACGCTCTCCGAGCGTGAGGCGGGCGTGGTCTCGATGCGGTTCGGTCT
CACCGACGGTCAGCCGAAGACCCTCGACGAGATCGGCAAGGTGTCCGGGGTGACGCGTGA
GCGCATCCGCCAGATCGAGTCGAAGACCATGTCGAAGTTGCGCCACCCGTCCCGCTCGCA
GGTCCTGACCGACTACCTCGACTAGGACCCGCTCCGCTCCGGGGAACTCCGGGAAAGGGG
CCTTCGCAGTCCACTCGCACGGGTGGAGGCTTAAGGCCCCTTGAATCGCCGTCCGGGGGC
CCGCGCCTCGCACGGACGGCGGCCGGGCGCACCTCCGTGCGGTTTCGGGCACTCCGTGTT
GGGCCAGTCGTGGCGCCGAACGTGGTACTCGGGGCCCCGCCGTGGATCACTCTGGGTGCG
TAACAGAACGCCGGGAGTGAGCAGAGAAGATGCCAAGTCGATGGAACCGAAGCGGCCGGG
CCGGGCTGGTCGCGGCCGTGGCCGTCCTGGCGGCCCCTCTGTCGGGTCCCGCCCCGGCGG
CGGCCGACAGCGTCGTGGTCGGCGGCAGCCTCGCCAGCGTCGACGACCACCCGTGGGTCG
TCGCCCTCGGCAGCCGCGACCGGTTCGGCATCAGCGAGCGCTCCGGCCAGTTCTGCGATG
GGGTGGTCGTCGGCGAGCGGACGGTGCTGACATCCGCGCACTGCGTGGACGAGGAGGTGC
TCGGGGTCGCCCTCTCCCCAATCCCCGCAATGCGGGTGATCTCCGGCCGCGACGACCTGC
GCTCCTCGGGGAAGGCTGGGGAGACCGCCGTCAGCGGTGTCCGGGACAACCCGGGGTACG
ACCCGGCCACCAACGCGGGTGACCTCGCCACGCTGACCCTCGCCGAGTCGCTGCCCGGGC
CGGCGGTGCTGCCCGTGGCCCGTCCGGGCAGTGCCGAGGAGAAGCCGGGCAGCAAGGATC
CCGTCATCGGCTGGGGCGACACGACCGGTAACGGAACGTACTGGCCCAGGCGGAGGTCCG
TCGGGGTGACGGTGCTGGAGGACGCCACCTGCCGCCGCGCCTACCCGGGCAGCTCGGTCG
GCCGGTGCTAGGCGGAGACCATGCTCTTCTCCGGTGACGCACGCGGCGGCCGGGACGCCT
GCCAGGGGGGCCGCGGCGGCCCGCTGGTGGCCGTAAGGTGCATCCTGATCGGCCTGGTCT
CGTGGGGCAGCGGCTATCGCGGGCGGGCCAGCAGTCCGGGCGTCTACACCCGGGTCTCCG
CGGTCGCTCCGTTTTCACGCGAGAGCGCCTGGAGGGTGTTCGGAAGGCGCCTGAAGCGCT
GAAGGCGCTGGAAGGGCGTCGTGGCCGACAGCATATCCGACTTCGGCCAACCTGGCGGCC
CGCTCGCCCGCTGCCGCGCAGGGGGCTCCAAACGCCCCCGGAAACCGAAACGGGCCTCCT
TCCCGCATTTGGGGCGGGGAGGAGGCCCGTACTCCGGTTAAAGGACCGGTGCCGGCTCGT
CGGGTTGATGGGTGCGAAGCGTCAGCGCTCGTCCTCGGCCGTGGCCGGGGTCGCAATCAG
CCGCTCGGACTCATCCTGTATCTCAGCGGCGATCTTCTTGAGTTCCGGCTCGAACTTGCG
GCCGTGCTAATCGGCGCAGAAGAGCAGTTCACCACCGCTCATGGACACGACGCGCAGGTA
GGCCTGGGCGCCGCAGCGGTCACAGCGGTCAGCGGCCGTCAGGGGGGTCGCGGGGGTGAA
AACAGTAGTCACGTCGCCCCCTCTCTAGCTCGACGAGCTGTCTGACCAGGGTCAACATCC
AACCAGGCCGAAAACGTTTACGCTCGCGGCATTTCCTCGAAAAGATCTTCCGGGGAGGCC
GGGTGCTACCGGTTTGGCGGCGAATGTGCCGTGTGGACTGTTGACGCTGTCACGTCATCG
GGTCCGGTCCCCCTCACCGGCTGGCTTGCCGGGGTGTTGAAGAGGACGTGCCCGGAGCCT
AAATGGTTCATGCCCGGAAGGGAACGTGACATCTGTTTCACCCCATCGAGGGATCGAACG
TCTGTACGGCTCTGGACTACGGTGGGTTTGAGCCGAGGGTGGCGTTACATCGGCTCTACC
TGGCCTCGGTACCCTCTGAGCGGCGACCGTGACCCAGGTCCCCGATCCCGTGGACCACCA
TCAGAATTC
Pasos:
  1. Conectarse al servidor de FramePlot en una ventana nueva.
  2. Insertamos la secuencia que que aparece arriba marcada como Str y hacemos click en Cookin'. Tras unos instantes aparecerá un resultado(como éste), en el que aparecen, en forma gráfica, los codones de iniciación y terminación, las fases abiertas de lectura en las seis fases posibles, el contenido en G+C de la tercera base representado en forma de tres líneas, y la misma información en forma de texto. 

  3. ¿Por qué la representación del contenido G+C se representa sólo en tres líneas?
    ¿Cuales son las ORFs mas probables?
  4. Ahora hacemos click en el gráfico, sobre la linea que corresponde al ORF probable más grande
  5. Tras el proceso anterior se abrira una ventana (como ésta) en la que aparecen las secuencias de DNA y proteinas del ORF seleccionado y la opción de lanzar un BLAST con ellos. Lanzamos el BLAST y nos llegará un resultado como éste.

  6. El resultado de la búsqueda con BLAST apoya la hipótesis de que la ORF seleccionada es real y permite hacer predicciones sobre la función del producto génico.
  7. Los dos pasos anteriores pueden repetirse con otras ORFs probables, para intentar de nuevo encontrar evidencias que apoyen su asignación como ORFs reales.
  8. También podemos repetir el proceso seleccionando un ORF con poco contenido en G+C en su tercera base. Un posible resultado, dependiendo de la ORF que escojais, sería éste.

  9. ¿Hay mucha diferencia entre los resultados de BLAST con esta ORF y los anteriores?

Manuel José Gómez Rodriguez y Ramón A-Allende