|
Práctica Procariotas
|
|
Esta va a ser una práctica muy sencilla donde vamos a usar herramientas para identificar secuencias codificantes
en un fragmento de ADN extraido de una nueva especie bacteriana relacionada con el género Streptomyces. Al igual que en
las aplicaciones destinadas a predecir la
estructura de un gen eucariota, las herramientas para identificar genes en bacterias pueden basarse en diferentes propiedades.
En este ejemplo usaremos un servidor que analiza el contenido en G+C de la 3 base y combina esa medida con
la predicción de fases abiertas de lectura y la búsqueda de secuencias similares con BLAST
|
|
Sequencia
|
>Str
GAATTCCACGGACTGCTGTATATTCAGCTCGCCGGCAACCGCATGCTGGAGCACCTCTAA
GGCATCGTCTCCGCCGCCCTCCAGACATCCAGCGGCCCGGCCACCGGCTGCGACCGGCCC
AACGAGACCTCTCTCGCACACCACCAACGCCCAATCGACACCCTCGCCGAGGGCGACGGC
GCCGCCACAGAGCACGCCATGAAGCAGCTCCTGACCGCCAGACCCGAGGTGGAGCGGGTC
GTCCCCGGACCGCGCGAGCAGCACGAACCCTCGCGGCCCACGGCGCGCCCTCCGCCGCCT
TCCGGTCCGCCGTAACTGCTGCCCCCCGTCCTGCCGGCCACCCCGCGGATCCCGCGAGCG
GGGAGGCCGGCGATTGCCGCGGCCCGGCCACCCGCCCCGGACGCCCCCGCACCGGGAGCC
GACCCGGGGAAACGTTCCCTCCCGCCCGCCCGGGCGACACGAAACCCCCTGTCGGCCCGA
GCAAGCCCGCCGCTAGGGGCCGCCATGTTTGCCGCCCGGGCGCGTATGCGCCGTAGCGCG
TAAGAGGAACGTGGGCGCGTAAGGGGAAGGTCAAGGAAGGTATGCGTCGCACCGGACGGA
GCCGGAGTACGGTCGGACACCCCGGTGGCTCCTTGCCGCAGCGGGCCGTACCGCGCACCG
TGCTCGGGGCTCCCCGTGACCGGAGTCCGGGCCTCCGGAGCTTCACGGCATCTTTATGTC
GCCCTCTGTAGACGCGGGTCGGAGAATTTTGACCGATATAGGGGTGTGACTCGGGCCACG
CACATTGGGCGTAACGCTCGACCGGGCAGCGCGATGACCTAAGAGGTGCCCATAGAAGAG
GGAATGCGGTCGTCGTTCGTGGCGCTGTACCCCCTCAATGCCGGTCCCGCAACGTCCCCG
GTCCAATCCCAGCCGTGGGTCGTCGGCTCCCGTCCTTCACCCAGGACAGGGGCCGGAAGC
CGTTATTCAACGTTCCGAGAGGTTGTTCGTGTCGGCCAGCACATCCCGTACGCTCCCGCC
GGAGATCGCCGAGTCCCAGTCTGTGATGGCGCTGATTCCGCGGGGAAAGGCTGATGGGAT
GATCGCCGGCGACGACGTGCGAAGGGCCTTCGAAGCTGACCAGATATACCCGGCGCATCA
GTGTCTGAAGAACGTTCTGCGCAGCCTCAATCAGATCCTCGAGGAAGAGGGTGTGACGCT
GATGGTCAGGTGGGCGGAGCCCAAGCGCACCCGAAAGAGCGTCGCAGCAATGAGCCCGGC
GAAGCGTCTCGCCACCACCAGGACCATGGTGGCCGCCAAGGCGGCCCCGGTGAAGAAGAG
CGCCCCCGCGGCCGCGCCCACGGACGAGGAGTCCGAACAGCCCGTGAAGAAGGCCGCGGC
CAAGAACGTCACCGCCAAGAAGACGGCGAAGAAGGCGACGGCGAAGAAGACCGCCGCCAA
GAAGACCGCGGCCAAGAACGTCGTCGACGAGCTGCTCGACGACGAGGCCGAGGAGAAGCC
CATCACCGGCAAGCCGGGCGAGGAAGGCGCGCCCGAGGGAACCGGCGGCGAGAGCCAGGG
CTTCGTTAGGTCCGACGACGACGAGGACCTCGCGCCCGCCCATTCGGTCGCGGCCGCCGG
TGCCACCGCCGACCCGGTCAAGGACTACCTCAAGCAGATCGGCAAGGTCCCCCTCCTCAA
CGCCGAGCAGGAGGTCGAACTCGCCAAGCGCATTTCGGCCGGCCTCTTCGCCGAGGACAA
GCTCGCCAACGCCGACAAGATCGCCCCCAAGCTCAAGTGCGAGCTAGAGATCATCGCCGA
GGACGGCCGCCGCGCCAAGAACCACCTATTGGAGGCCAACCTCCGCCTCGTGGTCTCGCT
GGCCAAGCGCTACACCGGCCGCGGGTTCATGCTCTTCCTGGACCTGATCCAGGAGGGCAA
CCTCGGTCTGATCCGCGCGGTCGAGAAGTTCGACTACACCAAGGGCCGCAAGTTCTCCAC
GTACCACACCTGGTGGATCCGGCAGGCGATCAACACCCGCGCCATGGCCGACCAGGCCCG
CACCATCCGTATCCCGGTGCACATGGTCGACTCGGTCATCAACAAAAGGGCCCGCGTGAC
GCGTCAGATGCTCCAGGACCTGGGCCGCGAGCCCACCCCGGAGGAGCTGGCCAAGGAACT
CGACATGACCCCCGAGAAGGTCATCGAGAGGGCGAAGTACGGCCGCGAGCCCATCTCCCT
GCACACCCCGCGCGGCGAGGAGGCCGGGGCCGACAGCGAGTTACGTGACCTCATCGAGGA
CTCCGAGGCGGTCGTCCCCCCCGACGCGGTCTCCTTCACGCTCCTCCAGGAGCAGCTGCA
CTCCGTCCTCGACACGCTCTCCGAGCGTGAGGCGGGCGTGGTCTCGATGCGGTTCGGTCT
CACCGACGGTCAGCCGAAGACCCTCGACGAGATCGGCAAGGTGTCCGGGGTGACGCGTGA
GCGCATCCGCCAGATCGAGTCGAAGACCATGTCGAAGTTGCGCCACCCGTCCCGCTCGCA
GGTCCTGACCGACTACCTCGACTAGGACCCGCTCCGCTCCGGGGAACTCCGGGAAAGGGG
CCTTCGCAGTCCACTCGCACGGGTGGAGGCTTAAGGCCCCTTGAATCGCCGTCCGGGGGC
CCGCGCCTCGCACGGACGGCGGCCGGGCGCACCTCCGTGCGGTTTCGGGCACTCCGTGTT
GGGCCAGTCGTGGCGCCGAACGTGGTACTCGGGGCCCCGCCGTGGATCACTCTGGGTGCG
TAACAGAACGCCGGGAGTGAGCAGAGAAGATGCCAAGTCGATGGAACCGAAGCGGCCGGG
CCGGGCTGGTCGCGGCCGTGGCCGTCCTGGCGGCCCCTCTGTCGGGTCCCGCCCCGGCGG
CGGCCGACAGCGTCGTGGTCGGCGGCAGCCTCGCCAGCGTCGACGACCACCCGTGGGTCG
TCGCCCTCGGCAGCCGCGACCGGTTCGGCATCAGCGAGCGCTCCGGCCAGTTCTGCGATG
GGGTGGTCGTCGGCGAGCGGACGGTGCTGACATCCGCGCACTGCGTGGACGAGGAGGTGC
TCGGGGTCGCCCTCTCCCCAATCCCCGCAATGCGGGTGATCTCCGGCCGCGACGACCTGC
GCTCCTCGGGGAAGGCTGGGGAGACCGCCGTCAGCGGTGTCCGGGACAACCCGGGGTACG
ACCCGGCCACCAACGCGGGTGACCTCGCCACGCTGACCCTCGCCGAGTCGCTGCCCGGGC
CGGCGGTGCTGCCCGTGGCCCGTCCGGGCAGTGCCGAGGAGAAGCCGGGCAGCAAGGATC
CCGTCATCGGCTGGGGCGACACGACCGGTAACGGAACGTACTGGCCCAGGCGGAGGTCCG
TCGGGGTGACGGTGCTGGAGGACGCCACCTGCCGCCGCGCCTACCCGGGCAGCTCGGTCG
GCCGGTGCTAGGCGGAGACCATGCTCTTCTCCGGTGACGCACGCGGCGGCCGGGACGCCT
GCCAGGGGGGCCGCGGCGGCCCGCTGGTGGCCGTAAGGTGCATCCTGATCGGCCTGGTCT
CGTGGGGCAGCGGCTATCGCGGGCGGGCCAGCAGTCCGGGCGTCTACACCCGGGTCTCCG
CGGTCGCTCCGTTTTCACGCGAGAGCGCCTGGAGGGTGTTCGGAAGGCGCCTGAAGCGCT
GAAGGCGCTGGAAGGGCGTCGTGGCCGACAGCATATCCGACTTCGGCCAACCTGGCGGCC
CGCTCGCCCGCTGCCGCGCAGGGGGCTCCAAACGCCCCCGGAAACCGAAACGGGCCTCCT
TCCCGCATTTGGGGCGGGGAGGAGGCCCGTACTCCGGTTAAAGGACCGGTGCCGGCTCGT
CGGGTTGATGGGTGCGAAGCGTCAGCGCTCGTCCTCGGCCGTGGCCGGGGTCGCAATCAG
CCGCTCGGACTCATCCTGTATCTCAGCGGCGATCTTCTTGAGTTCCGGCTCGAACTTGCG
GCCGTGCTAATCGGCGCAGAAGAGCAGTTCACCACCGCTCATGGACACGACGCGCAGGTA
GGCCTGGGCGCCGCAGCGGTCACAGCGGTCAGCGGCCGTCAGGGGGGTCGCGGGGGTGAA
AACAGTAGTCACGTCGCCCCCTCTCTAGCTCGACGAGCTGTCTGACCAGGGTCAACATCC
AACCAGGCCGAAAACGTTTACGCTCGCGGCATTTCCTCGAAAAGATCTTCCGGGGAGGCC
GGGTGCTACCGGTTTGGCGGCGAATGTGCCGTGTGGACTGTTGACGCTGTCACGTCATCG
GGTCCGGTCCCCCTCACCGGCTGGCTTGCCGGGGTGTTGAAGAGGACGTGCCCGGAGCCT
AAATGGTTCATGCCCGGAAGGGAACGTGACATCTGTTTCACCCCATCGAGGGATCGAACG
TCTGTACGGCTCTGGACTACGGTGGGTTTGAGCCGAGGGTGGCGTTACATCGGCTCTACC
TGGCCTCGGTACCCTCTGAGCGGCGACCGTGACCCAGGTCCCCGATCCCGTGGACCACCA
TCAGAATTC
|
|
Pasos:
|
- Vamos a FramePlot
- Insertamos la secuencia que que aparece arriba marcada como Str y hacemos click en Cookin'. Tras unos instantes aparecerá el resultado
(como este), en el que aparecen, en forma gráfica, los codones de iniciación y terminación, las fases abiertas de
lectura en las seis fases posibles, el contenido en G+C de la tercera base representado en forma de tres líneas, y la misma información en forma de texto.
¿Que se concluye al observar el gráfico?
¿Cual es el ORF mas probable ?
¿Por qué la representación del contenido G+C se representa sólo en tres líneas?
- En el gráfico pinchamos sobre la linea que corresponde al ORF mas probable
- Tras el proceso anterior se abrira una ventana en la que aparecen las secuencias de DNA y proteinas del ORF seleccionado
y la opción de lanzar un BLAST con ellos. Lanzamos el blast y nos llegará un resultado como
este.
- Repetimos los dos pasos anteriores esta vez seleccionando un ORF con poco contenido en G+C en su tercera base. Un posible resultado, dependiendo de
la ORF que escojais, sería éste.
¿Hay mucha diferencia entre los dos resultados de BLAST?
|
|
|