Práctica Procariotas
Esta va a ser una práctica muy sencilla donde vamos a usar herramientas para identificar secuencias codificantes en un fragmento de ADN extraido de una nueva especie bacteriana relacionada con el género Streptomyces. Al igual que en las aplicaciones destinadas a predecir la estructura de un gen eucariota, las herramientas para identificar genes en bacterias pueden basarse en diferentes propiedades. En este ejemplo usaremos un servidor que analiza el contenido en G+C de la 3 base y combina esa medida con la predicción de fases abiertas de lectura y la búsqueda de secuencias similares con BLAST
Sequencia
>Str
GAATTCCACGGACTGCTGTATATTCAGCTCGCCGGCAACCGCATGCTGGAGCACCTCTAA
GGCATCGTCTCCGCCGCCCTCCAGACATCCAGCGGCCCGGCCACCGGCTGCGACCGGCCC
AACGAGACCTCTCTCGCACACCACCAACGCCCAATCGACACCCTCGCCGAGGGCGACGGC
GCCGCCACAGAGCACGCCATGAAGCAGCTCCTGACCGCCAGACCCGAGGTGGAGCGGGTC
GTCCCCGGACCGCGCGAGCAGCACGAACCCTCGCGGCCCACGGCGCGCCCTCCGCCGCCT
TCCGGTCCGCCGTAACTGCTGCCCCCCGTCCTGCCGGCCACCCCGCGGATCCCGCGAGCG
GGGAGGCCGGCGATTGCCGCGGCCCGGCCACCCGCCCCGGACGCCCCCGCACCGGGAGCC
GACCCGGGGAAACGTTCCCTCCCGCCCGCCCGGGCGACACGAAACCCCCTGTCGGCCCGA
GCAAGCCCGCCGCTAGGGGCCGCCATGTTTGCCGCCCGGGCGCGTATGCGCCGTAGCGCG
TAAGAGGAACGTGGGCGCGTAAGGGGAAGGTCAAGGAAGGTATGCGTCGCACCGGACGGA
GCCGGAGTACGGTCGGACACCCCGGTGGCTCCTTGCCGCAGCGGGCCGTACCGCGCACCG
TGCTCGGGGCTCCCCGTGACCGGAGTCCGGGCCTCCGGAGCTTCACGGCATCTTTATGTC
GCCCTCTGTAGACGCGGGTCGGAGAATTTTGACCGATATAGGGGTGTGACTCGGGCCACG
CACATTGGGCGTAACGCTCGACCGGGCAGCGCGATGACCTAAGAGGTGCCCATAGAAGAG
GGAATGCGGTCGTCGTTCGTGGCGCTGTACCCCCTCAATGCCGGTCCCGCAACGTCCCCG
GTCCAATCCCAGCCGTGGGTCGTCGGCTCCCGTCCTTCACCCAGGACAGGGGCCGGAAGC
CGTTATTCAACGTTCCGAGAGGTTGTTCGTGTCGGCCAGCACATCCCGTACGCTCCCGCC
GGAGATCGCCGAGTCCCAGTCTGTGATGGCGCTGATTCCGCGGGGAAAGGCTGATGGGAT
GATCGCCGGCGACGACGTGCGAAGGGCCTTCGAAGCTGACCAGATATACCCGGCGCATCA
GTGTCTGAAGAACGTTCTGCGCAGCCTCAATCAGATCCTCGAGGAAGAGGGTGTGACGCT
GATGGTCAGGTGGGCGGAGCCCAAGCGCACCCGAAAGAGCGTCGCAGCAATGAGCCCGGC
GAAGCGTCTCGCCACCACCAGGACCATGGTGGCCGCCAAGGCGGCCCCGGTGAAGAAGAG
CGCCCCCGCGGCCGCGCCCACGGACGAGGAGTCCGAACAGCCCGTGAAGAAGGCCGCGGC
CAAGAACGTCACCGCCAAGAAGACGGCGAAGAAGGCGACGGCGAAGAAGACCGCCGCCAA
GAAGACCGCGGCCAAGAACGTCGTCGACGAGCTGCTCGACGACGAGGCCGAGGAGAAGCC
CATCACCGGCAAGCCGGGCGAGGAAGGCGCGCCCGAGGGAACCGGCGGCGAGAGCCAGGG
CTTCGTTAGGTCCGACGACGACGAGGACCTCGCGCCCGCCCATTCGGTCGCGGCCGCCGG
TGCCACCGCCGACCCGGTCAAGGACTACCTCAAGCAGATCGGCAAGGTCCCCCTCCTCAA
CGCCGAGCAGGAGGTCGAACTCGCCAAGCGCATTTCGGCCGGCCTCTTCGCCGAGGACAA
GCTCGCCAACGCCGACAAGATCGCCCCCAAGCTCAAGTGCGAGCTAGAGATCATCGCCGA
GGACGGCCGCCGCGCCAAGAACCACCTATTGGAGGCCAACCTCCGCCTCGTGGTCTCGCT
GGCCAAGCGCTACACCGGCCGCGGGTTCATGCTCTTCCTGGACCTGATCCAGGAGGGCAA
CCTCGGTCTGATCCGCGCGGTCGAGAAGTTCGACTACACCAAGGGCCGCAAGTTCTCCAC
GTACCACACCTGGTGGATCCGGCAGGCGATCAACACCCGCGCCATGGCCGACCAGGCCCG
CACCATCCGTATCCCGGTGCACATGGTCGACTCGGTCATCAACAAAAGGGCCCGCGTGAC
GCGTCAGATGCTCCAGGACCTGGGCCGCGAGCCCACCCCGGAGGAGCTGGCCAAGGAACT
CGACATGACCCCCGAGAAGGTCATCGAGAGGGCGAAGTACGGCCGCGAGCCCATCTCCCT
GCACACCCCGCGCGGCGAGGAGGCCGGGGCCGACAGCGAGTTACGTGACCTCATCGAGGA
CTCCGAGGCGGTCGTCCCCCCCGACGCGGTCTCCTTCACGCTCCTCCAGGAGCAGCTGCA
CTCCGTCCTCGACACGCTCTCCGAGCGTGAGGCGGGCGTGGTCTCGATGCGGTTCGGTCT
CACCGACGGTCAGCCGAAGACCCTCGACGAGATCGGCAAGGTGTCCGGGGTGACGCGTGA
GCGCATCCGCCAGATCGAGTCGAAGACCATGTCGAAGTTGCGCCACCCGTCCCGCTCGCA
GGTCCTGACCGACTACCTCGACTAGGACCCGCTCCGCTCCGGGGAACTCCGGGAAAGGGG
CCTTCGCAGTCCACTCGCACGGGTGGAGGCTTAAGGCCCCTTGAATCGCCGTCCGGGGGC
CCGCGCCTCGCACGGACGGCGGCCGGGCGCACCTCCGTGCGGTTTCGGGCACTCCGTGTT
GGGCCAGTCGTGGCGCCGAACGTGGTACTCGGGGCCCCGCCGTGGATCACTCTGGGTGCG
TAACAGAACGCCGGGAGTGAGCAGAGAAGATGCCAAGTCGATGGAACCGAAGCGGCCGGG
CCGGGCTGGTCGCGGCCGTGGCCGTCCTGGCGGCCCCTCTGTCGGGTCCCGCCCCGGCGG
CGGCCGACAGCGTCGTGGTCGGCGGCAGCCTCGCCAGCGTCGACGACCACCCGTGGGTCG
TCGCCCTCGGCAGCCGCGACCGGTTCGGCATCAGCGAGCGCTCCGGCCAGTTCTGCGATG
GGGTGGTCGTCGGCGAGCGGACGGTGCTGACATCCGCGCACTGCGTGGACGAGGAGGTGC
TCGGGGTCGCCCTCTCCCCAATCCCCGCAATGCGGGTGATCTCCGGCCGCGACGACCTGC
GCTCCTCGGGGAAGGCTGGGGAGACCGCCGTCAGCGGTGTCCGGGACAACCCGGGGTACG
ACCCGGCCACCAACGCGGGTGACCTCGCCACGCTGACCCTCGCCGAGTCGCTGCCCGGGC
CGGCGGTGCTGCCCGTGGCCCGTCCGGGCAGTGCCGAGGAGAAGCCGGGCAGCAAGGATC
CCGTCATCGGCTGGGGCGACACGACCGGTAACGGAACGTACTGGCCCAGGCGGAGGTCCG
TCGGGGTGACGGTGCTGGAGGACGCCACCTGCCGCCGCGCCTACCCGGGCAGCTCGGTCG
GCCGGTGCTAGGCGGAGACCATGCTCTTCTCCGGTGACGCACGCGGCGGCCGGGACGCCT
GCCAGGGGGGCCGCGGCGGCCCGCTGGTGGCCGTAAGGTGCATCCTGATCGGCCTGGTCT
CGTGGGGCAGCGGCTATCGCGGGCGGGCCAGCAGTCCGGGCGTCTACACCCGGGTCTCCG
CGGTCGCTCCGTTTTCACGCGAGAGCGCCTGGAGGGTGTTCGGAAGGCGCCTGAAGCGCT
GAAGGCGCTGGAAGGGCGTCGTGGCCGACAGCATATCCGACTTCGGCCAACCTGGCGGCC
CGCTCGCCCGCTGCCGCGCAGGGGGCTCCAAACGCCCCCGGAAACCGAAACGGGCCTCCT
TCCCGCATTTGGGGCGGGGAGGAGGCCCGTACTCCGGTTAAAGGACCGGTGCCGGCTCGT
CGGGTTGATGGGTGCGAAGCGTCAGCGCTCGTCCTCGGCCGTGGCCGGGGTCGCAATCAG
CCGCTCGGACTCATCCTGTATCTCAGCGGCGATCTTCTTGAGTTCCGGCTCGAACTTGCG
GCCGTGCTAATCGGCGCAGAAGAGCAGTTCACCACCGCTCATGGACACGACGCGCAGGTA
GGCCTGGGCGCCGCAGCGGTCACAGCGGTCAGCGGCCGTCAGGGGGGTCGCGGGGGTGAA
AACAGTAGTCACGTCGCCCCCTCTCTAGCTCGACGAGCTGTCTGACCAGGGTCAACATCC
AACCAGGCCGAAAACGTTTACGCTCGCGGCATTTCCTCGAAAAGATCTTCCGGGGAGGCC
GGGTGCTACCGGTTTGGCGGCGAATGTGCCGTGTGGACTGTTGACGCTGTCACGTCATCG
GGTCCGGTCCCCCTCACCGGCTGGCTTGCCGGGGTGTTGAAGAGGACGTGCCCGGAGCCT
AAATGGTTCATGCCCGGAAGGGAACGTGACATCTGTTTCACCCCATCGAGGGATCGAACG
TCTGTACGGCTCTGGACTACGGTGGGTTTGAGCCGAGGGTGGCGTTACATCGGCTCTACC
TGGCCTCGGTACCCTCTGAGCGGCGACCGTGACCCAGGTCCCCGATCCCGTGGACCACCA
TCAGAATTC
Pasos:
  1. Vamos a FramePlot
  2. Insertamos la secuencia que que aparece arriba marcada como Str y hacemos click en Cookin'. Tras unos instantes aparecerá el resultado (como este), en el que aparecen, en forma gráfica, los codones de iniciación y terminación, las fases abiertas de lectura en las seis fases posibles, el contenido en G+C de la tercera base representado en forma de tres líneas, y la misma información en forma de texto.

  3. ¿Que se concluye al observar el gráfico?
    ¿Cual es el ORF mas probable ?
    ¿Por qué la representación del contenido G+C se representa sólo en tres líneas?
  4. En el gráfico pinchamos sobre la linea que corresponde al ORF mas probable
  5. Tras el proceso anterior se abrira una ventana en la que aparecen las secuencias de DNA y proteinas del ORF seleccionado y la opción de lanzar un BLAST con ellos. Lanzamos el blast y nos llegará un resultado como este.
  6. Repetimos los dos pasos anteriores esta vez seleccionando un ORF con poco contenido en G+C en su tercera base. Un posible resultado, dependiendo de la ORF que escojais, sería éste.

  7. ¿Hay mucha diferencia entre los dos resultados de BLAST?

Manuel José Gómez Rodriguez y Ramón A-Allende