Práctica
Procariotas 1 |
Esta va a ser una práctica muy sencilla donde vamos a usar herramientas
para identificar secuencias codificantes en un fragmento de ADN extraido
de una nueva especie bacteriana relacionada con el género Streptomyces.
Al igual que en las aplicaciones destinadas a predecir la estructura de
un gen eucariota, las herramientas para identificar genes en bacterias
pueden combinar varias estrategias. En este ejemplo usaremos un servidor
que analiza el contenido en G+C de la 3 base y combina esa medida con la
predicción de fases abiertas de lectura y la búsqueda de
secuencias similares con BLAST. |
Secuencia |
>Str
GAATTCCACGGACTGCTGTATATTCAGCTCGCCGGCAACCGCATGCTGGAGCACCTCTAA
GGCATCGTCTCCGCCGCCCTCCAGACATCCAGCGGCCCGGCCACCGGCTGCGACCGGCCC
AACGAGACCTCTCTCGCACACCACCAACGCCCAATCGACACCCTCGCCGAGGGCGACGGC
GCCGCCACAGAGCACGCCATGAAGCAGCTCCTGACCGCCAGACCCGAGGTGGAGCGGGTC
GTCCCCGGACCGCGCGAGCAGCACGAACCCTCGCGGCCCACGGCGCGCCCTCCGCCGCCT
TCCGGTCCGCCGTAACTGCTGCCCCCCGTCCTGCCGGCCACCCCGCGGATCCCGCGAGCG
GGGAGGCCGGCGATTGCCGCGGCCCGGCCACCCGCCCCGGACGCCCCCGCACCGGGAGCC
GACCCGGGGAAACGTTCCCTCCCGCCCGCCCGGGCGACACGAAACCCCCTGTCGGCCCGA
GCAAGCCCGCCGCTAGGGGCCGCCATGTTTGCCGCCCGGGCGCGTATGCGCCGTAGCGCG
TAAGAGGAACGTGGGCGCGTAAGGGGAAGGTCAAGGAAGGTATGCGTCGCACCGGACGGA
GCCGGAGTACGGTCGGACACCCCGGTGGCTCCTTGCCGCAGCGGGCCGTACCGCGCACCG
TGCTCGGGGCTCCCCGTGACCGGAGTCCGGGCCTCCGGAGCTTCACGGCATCTTTATGTC
GCCCTCTGTAGACGCGGGTCGGAGAATTTTGACCGATATAGGGGTGTGACTCGGGCCACG
CACATTGGGCGTAACGCTCGACCGGGCAGCGCGATGACCTAAGAGGTGCCCATAGAAGAG
GGAATGCGGTCGTCGTTCGTGGCGCTGTACCCCCTCAATGCCGGTCCCGCAACGTCCCCG
GTCCAATCCCAGCCGTGGGTCGTCGGCTCCCGTCCTTCACCCAGGACAGGGGCCGGAAGC
CGTTATTCAACGTTCCGAGAGGTTGTTCGTGTCGGCCAGCACATCCCGTACGCTCCCGCC
GGAGATCGCCGAGTCCCAGTCTGTGATGGCGCTGATTCCGCGGGGAAAGGCTGATGGGAT
GATCGCCGGCGACGACGTGCGAAGGGCCTTCGAAGCTGACCAGATATACCCGGCGCATCA
GTGTCTGAAGAACGTTCTGCGCAGCCTCAATCAGATCCTCGAGGAAGAGGGTGTGACGCT
GATGGTCAGGTGGGCGGAGCCCAAGCGCACCCGAAAGAGCGTCGCAGCAATGAGCCCGGC
GAAGCGTCTCGCCACCACCAGGACCATGGTGGCCGCCAAGGCGGCCCCGGTGAAGAAGAG
CGCCCCCGCGGCCGCGCCCACGGACGAGGAGTCCGAACAGCCCGTGAAGAAGGCCGCGGC
CAAGAACGTCACCGCCAAGAAGACGGCGAAGAAGGCGACGGCGAAGAAGACCGCCGCCAA
GAAGACCGCGGCCAAGAACGTCGTCGACGAGCTGCTCGACGACGAGGCCGAGGAGAAGCC
CATCACCGGCAAGCCGGGCGAGGAAGGCGCGCCCGAGGGAACCGGCGGCGAGAGCCAGGG
CTTCGTTAGGTCCGACGACGACGAGGACCTCGCGCCCGCCCATTCGGTCGCGGCCGCCGG
TGCCACCGCCGACCCGGTCAAGGACTACCTCAAGCAGATCGGCAAGGTCCCCCTCCTCAA
CGCCGAGCAGGAGGTCGAACTCGCCAAGCGCATTTCGGCCGGCCTCTTCGCCGAGGACAA
GCTCGCCAACGCCGACAAGATCGCCCCCAAGCTCAAGTGCGAGCTAGAGATCATCGCCGA
GGACGGCCGCCGCGCCAAGAACCACCTATTGGAGGCCAACCTCCGCCTCGTGGTCTCGCT
GGCCAAGCGCTACACCGGCCGCGGGTTCATGCTCTTCCTGGACCTGATCCAGGAGGGCAA
CCTCGGTCTGATCCGCGCGGTCGAGAAGTTCGACTACACCAAGGGCCGCAAGTTCTCCAC
GTACCACACCTGGTGGATCCGGCAGGCGATCAACACCCGCGCCATGGCCGACCAGGCCCG
CACCATCCGTATCCCGGTGCACATGGTCGACTCGGTCATCAACAAAAGGGCCCGCGTGAC
GCGTCAGATGCTCCAGGACCTGGGCCGCGAGCCCACCCCGGAGGAGCTGGCCAAGGAACT
CGACATGACCCCCGAGAAGGTCATCGAGAGGGCGAAGTACGGCCGCGAGCCCATCTCCCT
GCACACCCCGCGCGGCGAGGAGGCCGGGGCCGACAGCGAGTTACGTGACCTCATCGAGGA
CTCCGAGGCGGTCGTCCCCCCCGACGCGGTCTCCTTCACGCTCCTCCAGGAGCAGCTGCA
CTCCGTCCTCGACACGCTCTCCGAGCGTGAGGCGGGCGTGGTCTCGATGCGGTTCGGTCT
CACCGACGGTCAGCCGAAGACCCTCGACGAGATCGGCAAGGTGTCCGGGGTGACGCGTGA
GCGCATCCGCCAGATCGAGTCGAAGACCATGTCGAAGTTGCGCCACCCGTCCCGCTCGCA
GGTCCTGACCGACTACCTCGACTAGGACCCGCTCCGCTCCGGGGAACTCCGGGAAAGGGG
CCTTCGCAGTCCACTCGCACGGGTGGAGGCTTAAGGCCCCTTGAATCGCCGTCCGGGGGC
CCGCGCCTCGCACGGACGGCGGCCGGGCGCACCTCCGTGCGGTTTCGGGCACTCCGTGTT
GGGCCAGTCGTGGCGCCGAACGTGGTACTCGGGGCCCCGCCGTGGATCACTCTGGGTGCG
TAACAGAACGCCGGGAGTGAGCAGAGAAGATGCCAAGTCGATGGAACCGAAGCGGCCGGG
CCGGGCTGGTCGCGGCCGTGGCCGTCCTGGCGGCCCCTCTGTCGGGTCCCGCCCCGGCGG
CGGCCGACAGCGTCGTGGTCGGCGGCAGCCTCGCCAGCGTCGACGACCACCCGTGGGTCG
TCGCCCTCGGCAGCCGCGACCGGTTCGGCATCAGCGAGCGCTCCGGCCAGTTCTGCGATG
GGGTGGTCGTCGGCGAGCGGACGGTGCTGACATCCGCGCACTGCGTGGACGAGGAGGTGC
TCGGGGTCGCCCTCTCCCCAATCCCCGCAATGCGGGTGATCTCCGGCCGCGACGACCTGC
GCTCCTCGGGGAAGGCTGGGGAGACCGCCGTCAGCGGTGTCCGGGACAACCCGGGGTACG
ACCCGGCCACCAACGCGGGTGACCTCGCCACGCTGACCCTCGCCGAGTCGCTGCCCGGGC
CGGCGGTGCTGCCCGTGGCCCGTCCGGGCAGTGCCGAGGAGAAGCCGGGCAGCAAGGATC
CCGTCATCGGCTGGGGCGACACGACCGGTAACGGAACGTACTGGCCCAGGCGGAGGTCCG
TCGGGGTGACGGTGCTGGAGGACGCCACCTGCCGCCGCGCCTACCCGGGCAGCTCGGTCG
GCCGGTGCTAGGCGGAGACCATGCTCTTCTCCGGTGACGCACGCGGCGGCCGGGACGCCT
GCCAGGGGGGCCGCGGCGGCCCGCTGGTGGCCGTAAGGTGCATCCTGATCGGCCTGGTCT
CGTGGGGCAGCGGCTATCGCGGGCGGGCCAGCAGTCCGGGCGTCTACACCCGGGTCTCCG
CGGTCGCTCCGTTTTCACGCGAGAGCGCCTGGAGGGTGTTCGGAAGGCGCCTGAAGCGCT
GAAGGCGCTGGAAGGGCGTCGTGGCCGACAGCATATCCGACTTCGGCCAACCTGGCGGCC
CGCTCGCCCGCTGCCGCGCAGGGGGCTCCAAACGCCCCCGGAAACCGAAACGGGCCTCCT
TCCCGCATTTGGGGCGGGGAGGAGGCCCGTACTCCGGTTAAAGGACCGGTGCCGGCTCGT
CGGGTTGATGGGTGCGAAGCGTCAGCGCTCGTCCTCGGCCGTGGCCGGGGTCGCAATCAG
CCGCTCGGACTCATCCTGTATCTCAGCGGCGATCTTCTTGAGTTCCGGCTCGAACTTGCG
GCCGTGCTAATCGGCGCAGAAGAGCAGTTCACCACCGCTCATGGACACGACGCGCAGGTA
GGCCTGGGCGCCGCAGCGGTCACAGCGGTCAGCGGCCGTCAGGGGGGTCGCGGGGGTGAA
AACAGTAGTCACGTCGCCCCCTCTCTAGCTCGACGAGCTGTCTGACCAGGGTCAACATCC
AACCAGGCCGAAAACGTTTACGCTCGCGGCATTTCCTCGAAAAGATCTTCCGGGGAGGCC
GGGTGCTACCGGTTTGGCGGCGAATGTGCCGTGTGGACTGTTGACGCTGTCACGTCATCG
GGTCCGGTCCCCCTCACCGGCTGGCTTGCCGGGGTGTTGAAGAGGACGTGCCCGGAGCCT
AAATGGTTCATGCCCGGAAGGGAACGTGACATCTGTTTCACCCCATCGAGGGATCGAACG
TCTGTACGGCTCTGGACTACGGTGGGTTTGAGCCGAGGGTGGCGTTACATCGGCTCTACC
TGGCCTCGGTACCCTCTGAGCGGCGACCGTGACCCAGGTCCCCGATCCCGTGGACCACCA
TCAGAATTC
|
Pasos: |
-
Conectarse al servidor de FramePlot
en una ventana nueva.
-
Insertamos la secuencia que que aparece arriba marcada como Str y hacemos
click en Cookin'. Tras unos instantes aparecerá un resultado(como
éste), en el que aparecen, en forma
gráfica, los codones de iniciación y terminación,
las fases abiertas de lectura en las seis fases posibles, el contenido
en G+C de la tercera base representado en forma de tres líneas,
y la misma información en forma de texto.
¿Por qué la representación
del contenido G+C se representa sólo en tres líneas?
¿Cuales son las ORFs mas probables?
-
Ahora hacemos click en el gráfico, sobre la linea que corresponde
al ORF probable más grande
-
Tras el proceso anterior se abrira una ventana (como ésta)
en la que aparecen las secuencias de DNA y proteinas del ORF seleccionado
y la opción de lanzar un BLAST con ellos. Lanzamos el BLAST y nos
llegará un resultado como éste.
El resultado de la búsqueda con BLAST apoya la hipótesis
de que la ORF seleccionada es real y permite hacer predicciones sobre la
función del producto génico.
-
Los dos pasos anteriores pueden repetirse con otras ORFs probables, para
intentar de nuevo encontrar evidencias que apoyen su asignación
como ORFs reales.
-
También podemos repetir el proceso seleccionando un ORF con poco
contenido en G+C en su tercera base. Un posible resultado, dependiendo
de la ORF que escojais, sería éste.
¿Hay mucha diferencia entre los resultados
de BLAST con esta ORF y los anteriores?
|
|
|