Práctica Eucariotas: gen de Arabidopsis
|
Vamos a analizar con diferentes herramientas de predicción de genes
una secuencia de Arabidopsis thaliana. Intentaremos identificar los exones
y los intrones, deducir la ORF del mRNA maduro y predecir si hay una región promotora en la secuencia.
|
Secuencia:
|
>Arabidopsis
GCCATATTGCTTTCCTCTTTAGCCAAATTGCGTGTTAATATCCTTCCCGT
TGCATTTGATTCTATATCTTGTTTCTGTTTGATTTTTATGCATCTGTCAC
CTCCATGATAGTTTCTCTTGGTTAATGGCTGAAACAAGTTTAGTTTTGGA
TAGAGAATCAAAGAGTCTCTTCTTGTTCGTTTGTATCTTTCCTCTTGCGG
TATATGTTGAAGAACTTTAGGGAAACAAAGTGAATGAAAGCTAAGAGTTT
TTTTTATGACCAAAGGCAAAACAAAAAGTGAAGAATATTCCTTTGGAAAG
TTTTGAAAGGGAAATACATATAGGATATTAACTAGGCGAATGGAATTTTT
TCACTCATACAGAGTCATTTTCTGTATATATAACTTAGTGATTGTGAGTT
CTCATATTGCTTCTATGTAACACTCCTTGTAAAGCTAAATAGCCCTTTTG
TGCTAAGTCTCTGATATCTATTGTTATCTTCTCAATACTGCACTTGTTCA
ATGACACTTGCTAGCGATTTTGGTTTTCCATCCGCTATATCTTCATCTTT
TACAATTCTAGAAGAGAGATACCACAATAACTTTCCTAACACTTTGTGTG
TTTCATCAGGACAGGAATCGATGAATAACAACCCCGTCCCCTGTCAGGTG
TTTCCTCTGGTCTCTGGTGGTAGTTCTGGTGGGAATTTGTTTTCATCTTC
TTCCGGATTCTGCAATGGTGTCTATGTTTCATCTTCCTCCCAGGCACGGC
CATCTGTTTCTACCGTGCCAAGAGACAGAATTACTGTTGCTCACGTCTCT
GGTGAAGGGCAGAGGCAGGAATGCCCTGTGGAAACACATTCCTTGCAATT
GATCAATCAACCTCAAGAACAGAAAATTATGACTTGGTCTTCAGACCAGA
TTCGGGGCTTCTTCGATTTTCCTGTTCCAGATCCACAAGCAGCGAGCAGC
AGAACTATGGTTTCATCCAAGGAAGTGCTTTCAAAATGCGAATGGCCAGA
CTGGGCGGATCAGTTGATCTCTGATGATAGTCTTGAACCAAATTGGTCGG
AGCTTCTAGGTGATCCTAATGTACTCAATCTATATTCAAAGGTTCGTTTC
TTTCAGCTAAATATGAATCTCTACGCTTATTTCAGCTAAATATGATTCTT
CTATTAAGACTGACTCTGATAATGTCTTACAGATAGAAACACAGTCTTCT
GATATAGCAAGGCAAGAGATCGTCTTTAGAAATCAGCATCAGGTGGATCC
ATCAATGGAGCCGTTTAATGCCAAAAGCCCACCAGCTAGTTCAATGACAT
CTAAGCAAAGAATGCGTTGGACACCAGAACTTCATGAAGCATTTGTCGAA
GCTATCAATCAGCTCGGTGGTAGTGAACGTGCGTATGCCCTTTTTTTTTC
CTTCTCATGCCTGCAAAATTTAGCTGAACAACTTATTATTATTCTCTTGG
CTTATAATTTCAAACCACAGGAGCCACCCCTAAGGCTGTTTTGAAGCTCA
TCAATAGCCCTGGGTTGACCGTTTATCATGTCAAAAGCCATTTGCAGGTT
ACTATTCTCCATCTATGTTTTCGGTTTGTATGCTTACAGCTCATCTTAAA
CGTCTTTATATTATTGGCTTGTCCAGAAATACAGAACTGCAAGGTATAAA
CCAGAGCTTTCCAAAGATACAGGTACTTGAGGCATCTAAGGATTCAAACT
GTCTTCTCAATATTTCACATAAGCTTATTATACTTTGGAAACATAATGGC
ATTTAAAAGACTCTTGTGTGATGAAACACGTCTTTATACATAATCAGCTT
TTCTTCTTGGACAGAAGAACCTCTAGTAAAGAATTTGAAAACCATTGAAG
ATATCAAATCTCTTGACTTGAAGACGTAAGGAACATTTTACTTCTCTGTC
AGAACAGACTAAGTATCACCTAGGATAATATTTCTTCATATCTAAGATTT
TTTTTTTTTATTCTTCTTCAGGAGCATTGAAATCACTGAAGCTCTCCGGT
TACAGATGAAAGTTCAAAAACAACTCCACGAGCAACTTGAGGTATAATAA
TTCAAACTGCCTAAAAGAAGCTTTTATAAAACAAAACAGTGTCCTTTCCT
CTTCATTTGTCTGATTTCTTAGTTTTTGGTTTTAGCTGGTGATTTTGATC
TTATATTGGTCTTAATACAATGCAGATCCAAAGATCACTGCAGTTACAAA
TCGAAGAACAAGGTCGGTATCTTCAGATGATGATTGAGAAACAACAGAAG
ATGCAAGAGAACAAAAAAGACTCTACTTCCTCATCATCAATGCCAGAAGC
TGACCCTTCAGCTCCATCACCAAACCTTTCACAACCTTTCCTCCATAAAG
CAACCAATTCAGAACCATCAATAACTCAGAAACTGCAGAATGGTTCTAGC
ACAATGGATCAAAGTGAATCTACTTCTGGGACTAGTAATAGAAAACGGGT
TAGAGAAGATTAGACATCTCATGAGTATGATCCAAAGATGTTGCAAACAT
ATGTAATTGTGTATATAAAATTGAAAATATCACAGCAGCAAGAAAATGAA
AATTTCTTCTTAATGGAGATGACGTGGACAAATCACTGTCGAGTTGGAAT
GTTGTCGGCTGATGAGTCAGCAATTTAGATGACGTGGCTAAAGAACATCC
TTATTTATGACGTAATTAATAATGATCTCTCGAAATGCGTCTTTTCTTCG
TCTGTTCTATCTTCTTTACCAATTTCTGCAATTCTGGAGAAGCTAAAGGT
CTCAATCTCTCAGTCAAAAACAAAAGGTCTCTCCTTTATTAAACTATCTA
TCACTAACTAGAAGAAGAGATTAGAGGAGGAGGAAGAAGATGTTGTTTCA
GGTGGGAGGTGAAGGCACACGCCCCACCTTCTTTGAGATGGCTGCTGCTC
AGCAACTTCCTGCTAGCCTTCGCGCCGCTCTCACCTATTCCCTCGGCGTA
TAATGCCCTTCTC
|
Pasos:
|
En general, seguiremos el mismo protocolo que se usó en la práctica anterior, en la que se construyó un
modelo para un gen humano.
|
- Primero intentaremos encontrar evidencias de transcripción de algún fragmento de nuestra
secuencia.
Para ello usaremos la herramienta BLAST contra una base de datos de EST (Expresed Sequence Tag).
Seguimos los mismos pasos que los descritos para la secuencia humana, aunque en éste caso la base de datos seleccionada
debe ser "est" o "est-others". Después de un rato debería salir un resultado semejante a
este .
¿Cuales son las diferencias obvias, respecto a los resultados obtenidos con la secuencia humana de la práctica
anterior?
Sería conveniente ir haciendo un esquema en una hoja de papel, en forma de mapa lineal, y representar los datos
que vamos obteniendo.
¿Sería suficiente con este resultado para conocer la estructura génica de nuestra secuencia?
Podríamos intentar construir un modelo del gen a partir de los resultados de BLAST contra ESTs, pero dado
que la cantidad de información disponible es aparentemente menor, es especialmente importante usar servidores de predicción para
intentar construir un modelo.
|
- Análisis de la secuencia de Arabidopsis con varios servidores de predicción de genes.
|
- Análisis de la secuencia de Arabidopsis con el Metaserver
Nos conectamos a METAGENE
- Escribimos nuestro correo electrónico en el campo correspondiente. No es obligatorio pero si conveniente
- Insertamos la secuencia en "Secuence"
- Pasamos a "Sequence Analysis Options":
- Orientation y Fetures: todo seleccionado
- Engine Select: quitamos geneID y geneview
- Ebest: Others y Both seleccionados
- GeneFinder: FGENE y Plant seleccionado
- GeneMark: A.thaliana W size 96 Threshold 0.5 ORFs y Regions seleccionado
- Genei: Human or other seleccionado
- GeneScan: Arabidopsis seleccionado
- Grail: Arabidopsis seleccionado
- Nnpp: Eukaryote seleccionado
- ProScan: ---
- Submit
Para ver los resultados hacemos click en el enlace "Current Search Results". Esto nos llevará a una página donde tendremos
la oportunidad de ver el resultado de cada servidor en detalle. Lo mas conveniente es apretar donde pone "click here to annotate the results"
Esto nos abre un ventana donde compara los resultado de todos los servidores. En el menu pinchamos en tools
y seleccionamos "Analysis"; veremos un resultado como éste.
¿Vemos algo interesante?
|
- Usaremos Proscan para buscar posibles promotores.
¿Hay algún promotor interesante?
resultados.
|