Práctica
Procariotas 2 |
En esta práctica vamos a identificar secuencias codificantes
en un fragmento de ADN extraido de una nueva especie bacteriana relacionada
con el género Streptomyces. En este caso, y a diferencia de lo que
se hizo para analizar la secuencia de Bacillus subtilis en la práctica
1, se combina la búsqueda de fases abiertas de lectura, con el análisis
del uso de codones y la búsqueda de secuencias similares con Blast.
El estadístico que se usa es el contenido en G+C de la 3 base. |
Secuencia |
>Str
GAATTCCACGGACTGCTGTATATTCAGCTCGCCGGCAACCGCATGCTGGAGCACCTCTAA
GGCATCGTCTCCGCCGCCCTCCAGACATCCAGCGGCCCGGCCACCGGCTGCGACCGGCCC
AACGAGACCTCTCTCGCACACCACCAACGCCCAATCGACACCCTCGCCGAGGGCGACGGC
GCCGCCACAGAGCACGCCATGAAGCAGCTCCTGACCGCCAGACCCGAGGTGGAGCGGGTC
GTCCCCGGACCGCGCGAGCAGCACGAACCCTCGCGGCCCACGGCGCGCCCTCCGCCGCCT
TCCGGTCCGCCGTAACTGCTGCCCCCCGTCCTGCCGGCCACCCCGCGGATCCCGCGAGCG
GGGAGGCCGGCGATTGCCGCGGCCCGGCCACCCGCCCCGGACGCCCCCGCACCGGGAGCC
GACCCGGGGAAACGTTCCCTCCCGCCCGCCCGGGCGACACGAAACCCCCTGTCGGCCCGA
GCAAGCCCGCCGCTAGGGGCCGCCATGTTTGCCGCCCGGGCGCGTATGCGCCGTAGCGCG
TAAGAGGAACGTGGGCGCGTAAGGGGAAGGTCAAGGAAGGTATGCGTCGCACCGGACGGA
GCCGGAGTACGGTCGGACACCCCGGTGGCTCCTTGCCGCAGCGGGCCGTACCGCGCACCG
TGCTCGGGGCTCCCCGTGACCGGAGTCCGGGCCTCCGGAGCTTCACGGCATCTTTATGTC
GCCCTCTGTAGACGCGGGTCGGAGAATTTTGACCGATATAGGGGTGTGACTCGGGCCACG
CACATTGGGCGTAACGCTCGACCGGGCAGCGCGATGACCTAAGAGGTGCCCATAGAAGAG
GGAATGCGGTCGTCGTTCGTGGCGCTGTACCCCCTCAATGCCGGTCCCGCAACGTCCCCG
GTCCAATCCCAGCCGTGGGTCGTCGGCTCCCGTCCTTCACCCAGGACAGGGGCCGGAAGC
CGTTATTCAACGTTCCGAGAGGTTGTTCGTGTCGGCCAGCACATCCCGTACGCTCCCGCC
GGAGATCGCCGAGTCCCAGTCTGTGATGGCGCTGATTCCGCGGGGAAAGGCTGATGGGAT
GATCGCCGGCGACGACGTGCGAAGGGCCTTCGAAGCTGACCAGATATACCCGGCGCATCA
GTGTCTGAAGAACGTTCTGCGCAGCCTCAATCAGATCCTCGAGGAAGAGGGTGTGACGCT
GATGGTCAGGTGGGCGGAGCCCAAGCGCACCCGAAAGAGCGTCGCAGCAATGAGCCCGGC
GAAGCGTCTCGCCACCACCAGGACCATGGTGGCCGCCAAGGCGGCCCCGGTGAAGAAGAG
CGCCCCCGCGGCCGCGCCCACGGACGAGGAGTCCGAACAGCCCGTGAAGAAGGCCGCGGC
CAAGAACGTCACCGCCAAGAAGACGGCGAAGAAGGCGACGGCGAAGAAGACCGCCGCCAA
GAAGACCGCGGCCAAGAACGTCGTCGACGAGCTGCTCGACGACGAGGCCGAGGAGAAGCC
CATCACCGGCAAGCCGGGCGAGGAAGGCGCGCCCGAGGGAACCGGCGGCGAGAGCCAGGG
CTTCGTTAGGTCCGACGACGACGAGGACCTCGCGCCCGCCCATTCGGTCGCGGCCGCCGG
TGCCACCGCCGACCCGGTCAAGGACTACCTCAAGCAGATCGGCAAGGTCCCCCTCCTCAA
CGCCGAGCAGGAGGTCGAACTCGCCAAGCGCATTTCGGCCGGCCTCTTCGCCGAGGACAA
GCTCGCCAACGCCGACAAGATCGCCCCCAAGCTCAAGTGCGAGCTAGAGATCATCGCCGA
GGACGGCCGCCGCGCCAAGAACCACCTATTGGAGGCCAACCTCCGCCTCGTGGTCTCGCT
GGCCAAGCGCTACACCGGCCGCGGGTTCATGCTCTTCCTGGACCTGATCCAGGAGGGCAA
CCTCGGTCTGATCCGCGCGGTCGAGAAGTTCGACTACACCAAGGGCCGCAAGTTCTCCAC
GTACCACACCTGGTGGATCCGGCAGGCGATCAACACCCGCGCCATGGCCGACCAGGCCCG
CACCATCCGTATCCCGGTGCACATGGTCGACTCGGTCATCAACAAAAGGGCCCGCGTGAC
GCGTCAGATGCTCCAGGACCTGGGCCGCGAGCCCACCCCGGAGGAGCTGGCCAAGGAACT
CGACATGACCCCCGAGAAGGTCATCGAGAGGGCGAAGTACGGCCGCGAGCCCATCTCCCT
GCACACCCCGCGCGGCGAGGAGGCCGGGGCCGACAGCGAGTTACGTGACCTCATCGAGGA
CTCCGAGGCGGTCGTCCCCCCCGACGCGGTCTCCTTCACGCTCCTCCAGGAGCAGCTGCA
CTCCGTCCTCGACACGCTCTCCGAGCGTGAGGCGGGCGTGGTCTCGATGCGGTTCGGTCT
CACCGACGGTCAGCCGAAGACCCTCGACGAGATCGGCAAGGTGTCCGGGGTGACGCGTGA
GCGCATCCGCCAGATCGAGTCGAAGACCATGTCGAAGTTGCGCCACCCGTCCCGCTCGCA
GGTCCTGACCGACTACCTCGACTAGGACCCGCTCCGCTCCGGGGAACTCCGGGAAAGGGG
CCTTCGCAGTCCACTCGCACGGGTGGAGGCTTAAGGCCCCTTGAATCGCCGTCCGGGGGC
CCGCGCCTCGCACGGACGGCGGCCGGGCGCACCTCCGTGCGGTTTCGGGCACTCCGTGTT
GGGCCAGTCGTGGCGCCGAACGTGGTACTCGGGGCCCCGCCGTGGATCACTCTGGGTGCG
TAACAGAACGCCGGGAGTGAGCAGAGAAGATGCCAAGTCGATGGAACCGAAGCGGCCGGG
CCGGGCTGGTCGCGGCCGTGGCCGTCCTGGCGGCCCCTCTGTCGGGTCCCGCCCCGGCGG
CGGCCGACAGCGTCGTGGTCGGCGGCAGCCTCGCCAGCGTCGACGACCACCCGTGGGTCG
TCGCCCTCGGCAGCCGCGACCGGTTCGGCATCAGCGAGCGCTCCGGCCAGTTCTGCGATG
GGGTGGTCGTCGGCGAGCGGACGGTGCTGACATCCGCGCACTGCGTGGACGAGGAGGTGC
TCGGGGTCGCCCTCTCCCCAATCCCCGCAATGCGGGTGATCTCCGGCCGCGACGACCTGC
GCTCCTCGGGGAAGGCTGGGGAGACCGCCGTCAGCGGTGTCCGGGACAACCCGGGGTACG
ACCCGGCCACCAACGCGGGTGACCTCGCCACGCTGACCCTCGCCGAGTCGCTGCCCGGGC
CGGCGGTGCTGCCCGTGGCCCGTCCGGGCAGTGCCGAGGAGAAGCCGGGCAGCAAGGATC
CCGTCATCGGCTGGGGCGACACGACCGGTAACGGAACGTACTGGCCCAGGCGGAGGTCCG
TCGGGGTGACGGTGCTGGAGGACGCCACCTGCCGCCGCGCCTACCCGGGCAGCTCGGTCG
GCCGGTGCTAGGCGGAGACCATGCTCTTCTCCGGTGACGCACGCGGCGGCCGGGACGCCT
GCCAGGGGGGCCGCGGCGGCCCGCTGGTGGCCGTAAGGTGCATCCTGATCGGCCTGGTCT
CGTGGGGCAGCGGCTATCGCGGGCGGGCCAGCAGTCCGGGCGTCTACACCCGGGTCTCCG
CGGTCGCTCCGTTTTCACGCGAGAGCGCCTGGAGGGTGTTCGGAAGGCGCCTGAAGCGCT
GAAGGCGCTGGAAGGGCGTCGTGGCCGACAGCATATCCGACTTCGGCCAACCTGGCGGCC
CGCTCGCCCGCTGCCGCGCAGGGGGCTCCAAACGCCCCCGGAAACCGAAACGGGCCTCCT
TCCCGCATTTGGGGCGGGGAGGAGGCCCGTACTCCGGTTAAAGGACCGGTGCCGGCTCGT
CGGGTTGATGGGTGCGAAGCGTCAGCGCTCGTCCTCGGCCGTGGCCGGGGTCGCAATCAG
CCGCTCGGACTCATCCTGTATCTCAGCGGCGATCTTCTTGAGTTCCGGCTCGAACTTGCG
GCCGTGCTAATCGGCGCAGAAGAGCAGTTCACCACCGCTCATGGACACGACGCGCAGGTA
GGCCTGGGCGCCGCAGCGGTCACAGCGGTCAGCGGCCGTCAGGGGGGTCGCGGGGGTGAA
AACAGTAGTCACGTCGCCCCCTCTCTAGCTCGACGAGCTGTCTGACCAGGGTCAACATCC
AACCAGGCCGAAAACGTTTACGCTCGCGGCATTTCCTCGAAAAGATCTTCCGGGGAGGCC
GGGTGCTACCGGTTTGGCGGCGAATGTGCCGTGTGGACTGTTGACGCTGTCACGTCATCG
GGTCCGGTCCCCCTCACCGGCTGGCTTGCCGGGGTGTTGAAGAGGACGTGCCCGGAGCCT
AAATGGTTCATGCCCGGAAGGGAACGTGACATCTGTTTCACCCCATCGAGGGATCGAACG
TCTGTACGGCTCTGGACTACGGTGGGTTTGAGCCGAGGGTGGCGTTACATCGGCTCTACC
TGGCCTCGGTACCCTCTGAGCGGCGACCGTGACCCAGGTCCCCGATCCCGTGGACCACCA
TCAGAATTC
|
Pasos: |
-
Conectarse al servidor de FramePlot
en una ventana nueva.
-
Insertamos la secuencia que que aparece arriba marcada como Str y hacemos
click en Cookin'. Tras unos instantes aparecerá un resultado(como
éste),
en el que aparecen, en forma gráfica, los codones de iniciación
y terminación, las fases abiertas de lectura en las seis fases posibles,
el contenido en G+C de la tercera base representado en forma de tres líneas,
y la misma información en forma de texto.
¿Por qué la representación
del contenido G+C se representa sólo en tres líneas?
¿Cuales son las ORFs mas probables?
-
Ahora hacemos click en el gráfico, sobre la linea que corresponde
al ORF probable más grande
-
Tras el proceso anterior se abrira una ventana (como ésta)
en la que aparecen las secuencias de DNA y proteinas del ORF seleccionado
y la opción de lanzar un BLAST con ellos. Lanzamos el BLAST y nos
llegará un resultado como éste.
El resultado de la búsqueda con BLAST apoya la hipótesis
de que la ORF seleccionada es real y permite hacer predicciones sobre la
función del producto génico.
-
Los dos pasos anteriores pueden repetirse con otras ORFs probables, para
intentar de nuevo encontrar evidencias que apoyen su asignación
como ORFs reales.
-
También podemos repetir el proceso seleccionando un ORF con poco
contenido en G+C en su tercera base. Un posible resultado, dependiendo
de la ORF que escojais, sería éste.
¿Hay mucha diferencia entre los resultados
de BLAST con esta ORF y los anteriores?
-
Para comprobar que las frecuencias de uso de codones
tienen el sesgo comentado más arriba, conectarse a la Codon
Usage Database y buscar la tabla de Streptomyces coelicolor (accesible
también aquí).
|
|
|