Prácticas de Predicción de Características 1D


 

Como se recordará de la parte de teoría, las características 1D de una secuencia son aquellas que pueden ser representadas por un solo valor  asociado a cada aminoácido (B. Rost). Estos son, por ejemplo, H -helix-, E -strand-, L -loop-, etc, para la Estructura Secundaria; buried o exposed (o porcentaje de accesibilidad) para la accesibilidad; ua serie de valores para  la hidrofobicidad, etc.

En el siguiente ejemplo se muestra la salida típica de un programa que compara la estructuras secundaria y la accesibilidad observada y predicha, para un cierto péptido.
 
 

AA :    Residuos de la secuencia
OBSsec: Estructura secundaria observada (E: sheet, H: helice)
OBSacc: Accesibilidad observada (e: exposed, b: buried)
PHDsec: Estructura secundaria predecida
PHDacc: Accesibilidad predecida


Ejercicios

¿Que características de la estructura secundaria o de 1D se pueden predecir para las siguientes secuencias?

Emplear las "url" que tenéis en la teoría o en la parte superior de este documento.

1. Coger las siguientes secuencias polipeptídicas en formato fasta y enviarlas a los diferentes servidores de predicción de estructura secundaria (PredictProtein, JPred, JPred2, PsiPred). Comparar los resultados obtenidos.

Después enviar la secuencia al servidor de predicción de péptidos señal (SignalP)

- Opcional: generar un alineamiento múltiple con alguna de las secuencias y enviarlo a aquellos servidores que te permite este tipo de input (JPred2 o PredictProtein Advanced submission form). Comparar el resultado con el generado por el servidor cuando se le envía solamente la secuencia.

>1_T0112
MASDNLSAVL YKQNDLRLEQ RPIPEPKEDE VLLQMAYVGI CGSDVHYYEH GRIADFIVKD PMVIGHEASG TVVKVGKNVK HLKKGDRVAV EPGVPCRRCQ FCKEGKYNLC PDLTFCATPP DDGNLARYYV HAADFCHKLP DNVSLEEGAL LEPLSVGVHA CRRAGVQLGT TVLVIGAGPI GLVSVLAAKA YGAFVVCTAR SPRRLEVAKN CGADVTLVVD PAKEEESSII ERIRSAIGDL PNVTIDCSGN EKCITIGINI TRTGGTLMLV GMGSQMVTVP LVNACAREID IKSVFRYCND YPIALEMVAS GRCNVKQLVT HSFKLEQTVD AFEAARKKAD NTIKVMISCR QG
 

>APTE_DROME


MGVCTEERPVMHWQQSARFLGPGAREKSPTPPVAHQGSNQCGSAAGANNNHPLFRACSSSSCPDICDHST
 

>AREA_EMENI


MSGIAQLRLSDRVSNTPTTTADTVSDAMNLDDFIIPFSPSDHPSPSTTKASEATTGAIPIKARRDQSASE
 

>ARG1_YEAST


MTSNSDGSSTSPVEKPITGDVETNEPTKPIRRLSTPSPEQDQEGDFEEEDDDDKFSVSTSTPTPTITKTK
 
 

2. Envía la siguiente secuencia al servidor de predicción de hélices transmembrana TMHMM, y a algun otro, y compara resultados.

>2_636 AA
MEGPAFSKPL KDKINPWGPL IILGILIRAG VSVQHDSPHQ VFNVTWRVTN LMTGQTANVT SLLGTMTDAF PKLYFDLCDL IGDDWDETGL GCRTPGGRKR ARTFDFYVCP GHTVPTGCGG PREGYCGKWG CETTGQAYWK PSSSWDLISL KRGNTPRNQG PCYDSSAVSS NIKGATPGGR CNPLVLEFTD AGKKASWDGP KVWGLRLYRS TGIDPVTRFS LTRQVLNIGP RVSIGPNPVI TDQLPPSRPV QIMLPRPPQP PPPGAASIVP ETAPPSQQPG TGDRLLNLVD GAYRALNLTS PDKTQECWLC LVAGPPYYEG VAILGTYSNH TSAPANCSVA SQHKLTLSEV TGQGLCVGAV PKTHQALCNT TQTSSRGSYY LVAPTGTMWA CSTGLTPCIS TTILNLTTDY CVLVELWPRV TYHSPSYVYG LFERSNRHKR EPVSLTLALL LGGLTMGGIA AGIGTGTTAL MATQQFQQLQ AAVQDDLREV EKSISNLEKS LTSLSEVVLQ NRRGLDLLFL KEGGLCAALK EECCFYADHT GLVRDSMAKL RERLNQRQKL FESTQGWFEG LFNRSPWFTT LISTIMGPLI VLLMILLFGP CILNRLVQFV KDRISVVQAL VLTQQYHQLK PIEYEP
 

3. Envía la siguiente secuencia a los servidores de predicción de fosforilación y glicosilación (NetOGly, NetPhos)

>3_41 AA
ASYDGHKLVAGYDFTPPSTPSTDDPNVCREYSYKLGTYGAP

NetOGlyc output

>4_153 AA
ASQKRPSQRHGSKYLATASTMDHARHGFLPRHRDTGILDSIGRFFGGDRGAPKNMYKDSHHPARTAHYGSLPQKSHGRTQ DENPVVHFFKNIVTPRTPPPSQGKGRKSAHKGFKGVDAQGTLSKIFKLGGRDSRSGSPKPELVISALIVESRR

NetPhos output
 
 

VOLVER