Práctica Eucariotas: gen de Arabidopsis
Vamos a analizar con diferentes herramientas de predicción de genes una secuencia de Arabidopsis thaliana. Intentaremos identificar los exones y los intrones, deducir la ORF del mRNA maduro y predecir si hay una región promotora en la secuencia.
Secuencia:
>Arabidopsis 
GCCATATTGCTTTCCTCTTTAGCCAAATTGCGTGTTAATATCCTTCCCGT  
TGCATTTGATTCTATATCTTGTTTCTGTTTGATTTTTATGCATCTGTCAC  
CTCCATGATAGTTTCTCTTGGTTAATGGCTGAAACAAGTTTAGTTTTGGA  
TAGAGAATCAAAGAGTCTCTTCTTGTTCGTTTGTATCTTTCCTCTTGCGG  
TATATGTTGAAGAACTTTAGGGAAACAAAGTGAATGAAAGCTAAGAGTTT  
TTTTTATGACCAAAGGCAAAACAAAAAGTGAAGAATATTCCTTTGGAAAG  
TTTTGAAAGGGAAATACATATAGGATATTAACTAGGCGAATGGAATTTTT  
TCACTCATACAGAGTCATTTTCTGTATATATAACTTAGTGATTGTGAGTT  
CTCATATTGCTTCTATGTAACACTCCTTGTAAAGCTAAATAGCCCTTTTG  
TGCTAAGTCTCTGATATCTATTGTTATCTTCTCAATACTGCACTTGTTCA  
ATGACACTTGCTAGCGATTTTGGTTTTCCATCCGCTATATCTTCATCTTT  
TACAATTCTAGAAGAGAGATACCACAATAACTTTCCTAACACTTTGTGTG  
TTTCATCAGGACAGGAATCGATGAATAACAACCCCGTCCCCTGTCAGGTG  
TTTCCTCTGGTCTCTGGTGGTAGTTCTGGTGGGAATTTGTTTTCATCTTC  
TTCCGGATTCTGCAATGGTGTCTATGTTTCATCTTCCTCCCAGGCACGGC  
CATCTGTTTCTACCGTGCCAAGAGACAGAATTACTGTTGCTCACGTCTCT  
GGTGAAGGGCAGAGGCAGGAATGCCCTGTGGAAACACATTCCTTGCAATT  
GATCAATCAACCTCAAGAACAGAAAATTATGACTTGGTCTTCAGACCAGA  
TTCGGGGCTTCTTCGATTTTCCTGTTCCAGATCCACAAGCAGCGAGCAGC  
AGAACTATGGTTTCATCCAAGGAAGTGCTTTCAAAATGCGAATGGCCAGA  
CTGGGCGGATCAGTTGATCTCTGATGATAGTCTTGAACCAAATTGGTCGG  
AGCTTCTAGGTGATCCTAATGTACTCAATCTATATTCAAAGGTTCGTTTC  
TTTCAGCTAAATATGAATCTCTACGCTTATTTCAGCTAAATATGATTCTT  
CTATTAAGACTGACTCTGATAATGTCTTACAGATAGAAACACAGTCTTCT  
GATATAGCAAGGCAAGAGATCGTCTTTAGAAATCAGCATCAGGTGGATCC  
ATCAATGGAGCCGTTTAATGCCAAAAGCCCACCAGCTAGTTCAATGACAT  
CTAAGCAAAGAATGCGTTGGACACCAGAACTTCATGAAGCATTTGTCGAA  
GCTATCAATCAGCTCGGTGGTAGTGAACGTGCGTATGCCCTTTTTTTTTC  
CTTCTCATGCCTGCAAAATTTAGCTGAACAACTTATTATTATTCTCTTGG  
CTTATAATTTCAAACCACAGGAGCCACCCCTAAGGCTGTTTTGAAGCTCA  
TCAATAGCCCTGGGTTGACCGTTTATCATGTCAAAAGCCATTTGCAGGTT  
ACTATTCTCCATCTATGTTTTCGGTTTGTATGCTTACAGCTCATCTTAAA  
CGTCTTTATATTATTGGCTTGTCCAGAAATACAGAACTGCAAGGTATAAA  
CCAGAGCTTTCCAAAGATACAGGTACTTGAGGCATCTAAGGATTCAAACT  
GTCTTCTCAATATTTCACATAAGCTTATTATACTTTGGAAACATAATGGC  
ATTTAAAAGACTCTTGTGTGATGAAACACGTCTTTATACATAATCAGCTT  
TTCTTCTTGGACAGAAGAACCTCTAGTAAAGAATTTGAAAACCATTGAAG  
ATATCAAATCTCTTGACTTGAAGACGTAAGGAACATTTTACTTCTCTGTC  
AGAACAGACTAAGTATCACCTAGGATAATATTTCTTCATATCTAAGATTT  
TTTTTTTTTATTCTTCTTCAGGAGCATTGAAATCACTGAAGCTCTCCGGT  
TACAGATGAAAGTTCAAAAACAACTCCACGAGCAACTTGAGGTATAATAA  
TTCAAACTGCCTAAAAGAAGCTTTTATAAAACAAAACAGTGTCCTTTCCT  
CTTCATTTGTCTGATTTCTTAGTTTTTGGTTTTAGCTGGTGATTTTGATC  
TTATATTGGTCTTAATACAATGCAGATCCAAAGATCACTGCAGTTACAAA  
TCGAAGAACAAGGTCGGTATCTTCAGATGATGATTGAGAAACAACAGAAG  
ATGCAAGAGAACAAAAAAGACTCTACTTCCTCATCATCAATGCCAGAAGC  
TGACCCTTCAGCTCCATCACCAAACCTTTCACAACCTTTCCTCCATAAAG  
CAACCAATTCAGAACCATCAATAACTCAGAAACTGCAGAATGGTTCTAGC  
ACAATGGATCAAAGTGAATCTACTTCTGGGACTAGTAATAGAAAACGGGT  
TAGAGAAGATTAGACATCTCATGAGTATGATCCAAAGATGTTGCAAACAT  
ATGTAATTGTGTATATAAAATTGAAAATATCACAGCAGCAAGAAAATGAA  
AATTTCTTCTTAATGGAGATGACGTGGACAAATCACTGTCGAGTTGGAAT  
GTTGTCGGCTGATGAGTCAGCAATTTAGATGACGTGGCTAAAGAACATCC  
TTATTTATGACGTAATTAATAATGATCTCTCGAAATGCGTCTTTTCTTCG  
TCTGTTCTATCTTCTTTACCAATTTCTGCAATTCTGGAGAAGCTAAAGGT  
CTCAATCTCTCAGTCAAAAACAAAAGGTCTCTCCTTTATTAAACTATCTA  
TCACTAACTAGAAGAAGAGATTAGAGGAGGAGGAAGAAGATGTTGTTTCA  
GGTGGGAGGTGAAGGCACACGCCCCACCTTCTTTGAGATGGCTGCTGCTC  
AGCAACTTCCTGCTAGCCTTCGCGCCGCTCTCACCTATTCCCTCGGCGTA  
TAATGCCCTTCTC
Pasos:

En general, seguiremos el mismo protocolo que se usó en la práctica anterior, en la que se construyó un modelo para un gen humano.

  1. Primero intentaremos encontrar evidencias de transcripción de algún fragmento de nuestra secuencia.
    Para ello usaremos la herramienta BLAST contra una base de datos de EST (Expresed Sequence Tag).
    Seguimos los mismos pasos que los descritos para la secuencia humana, aunque en éste caso la base de datos seleccionada debe ser "est" o "est-others". Después de un rato debería salir un resultado semejante a este
  2. .

    ¿Cuales son las diferencias obvias, respecto a los resultados obtenidos con la secuencia humana de la práctica anterior?
    Sería conveniente ir haciendo un esquema en una hoja de papel, en forma de mapa lineal, y representar los datos que vamos obteniendo.
    ¿Sería suficiente con este resultado para conocer la estructura génica de nuestra secuencia?


    Podríamos intentar construir un modelo del gen a partir de los resultados de BLAST contra ESTs, pero dado que la cantidad de información disponible es aparentemente menor, es especialmente importante usar servidores de predicción para intentar construir un modelo.

  1. Análisis de la secuencia de Arabidopsis con varios servidores de predicción de genes.
  1. Análisis de la secuencia de Arabidopsis con el Metaserver
    Nos conectamos a METAGENE

    • Escribimos nuestro correo electrónico en el campo correspondiente. No es obligatorio pero si conveniente
    • Insertamos la secuencia en "Secuence"
    • Pasamos a "Sequence Analysis Options":
      - Orientation y Fetures: todo seleccionado
      - Engine Select: quitamos geneID y geneview
      - Ebest: Others y Both seleccionados
      - GeneFinder: FGENE y Plant seleccionado
      - GeneMark: A.thaliana W size 96 Threshold 0.5 ORFs y Regions seleccionado
      - Genei: Human or other seleccionado
      - GeneScan: Arabidopsis seleccionado
      - Grail: Arabidopsis seleccionado
      - Nnpp: Eukaryote seleccionado
      - ProScan: ---
    • Submit


  2. Para ver los resultados hacemos click en el enlace "Current Search Results". Esto nos llevará a una página donde tendremos la oportunidad de ver el resultado de cada servidor en detalle. Lo mas conveniente es apretar donde pone "click here to annotate the results" Esto nos abre un ventana donde compara los resultado de todos los servidores. En el menu pinchamos en tools y seleccionamos "Analysis"; veremos un resultado como éste.
    ¿Vemos algo interesante?
  1. Usaremos Proscan para buscar posibles promotores.
    ¿Hay algún promotor interesante? resultados.

Manuel José Gómez Rodriguez y Ramón A-Allende