Prácticas de Predicción de Características 1D
Como se recordará de la parte de teoría, las características 1D de una secuencia son aquellas que pueden ser representadas por un solo valor asociado a cada aminoácido (B. Rost). Estos son, por ejemplo, H -helix-, E -strand-, L -loop-, etc, para la Estructura Secundaria; buried o exposed (o porcentaje de accesibilidad) para la accesibilidad; ua serie de valores para la hidrofobicidad, etc.
En el siguiente ejemplo se muestra la salida típica de un programa que compara la estructuras secundaria y la accesibilidad observada y predicha, para un cierto péptido.
AA : Residuos de la secuencia
OBSsec: Estructura secundaria observada (E: sheet, H: helice)
OBSacc: Accesibilidad observada (e: exposed, b: buried)
PHDsec: Estructura secundaria predecida
PHDacc: Accesibilidad predecida
Ejercicios
¿Que características de la estructura secundaria o de 1D se pueden predecir para las siguientes secuencias?
Emplear las "url" que tenéis en la teoría o en la parte superior de este documento.
1. Coger las siguientes secuencias polipeptídicas en formato fasta y enviarlas a los diferentes servidores de predicción de estructura secundaria (PredictProtein, JPred, JPred2, PsiPred). Comparar los resultados obtenidos.
Después enviar la secuencia al servidor de predicción de péptidos señal (SignalP)
- Opcional: generar un alineamiento múltiple con alguna de las secuencias y enviarlo a aquellos servidores que te permite este tipo de input (JPred2 o PredictProtein Advanced submission form). Comparar el resultado con el generado por el servidor cuando se le envía solamente la secuencia.
>1_T0112
MASDNLSAVL YKQNDLRLEQ RPIPEPKEDE
VLLQMAYVGI CGSDVHYYEH GRIADFIVKD PMVIGHEASG TVVKVGKNVK HLKKGDRVAV EPGVPCRRCQ
FCKEGKYNLC PDLTFCATPP DDGNLARYYV HAADFCHKLP DNVSLEEGAL LEPLSVGVHA CRRAGVQLGT
TVLVIGAGPI GLVSVLAAKA YGAFVVCTAR SPRRLEVAKN CGADVTLVVD PAKEEESSII ERIRSAIGDL
PNVTIDCSGN EKCITIGINI TRTGGTLMLV GMGSQMVTVP LVNACAREID IKSVFRYCND YPIALEMVAS
GRCNVKQLVT HSFKLEQTVD AFEAARKKAD NTIKVMISCR QG
MGVCTEERPVMHWQQSARFLGPGAREKSPTPPVAHQGSNQCGSAAGANNNHPLFRACSSSSCPDICDHST
MSGIAQLRLSDRVSNTPTTTADTVSDAMNLDDFIIPFSPSDHPSPSTTKASEATTGAIPIKARRDQSASE
MTSNSDGSSTSPVEKPITGDVETNEPTKPIRRLSTPSPEQDQEGDFEEEDDDDKFSVSTSTPTPTITKTK
2. Envía la siguiente secuencia al servidor de predicción de hélices transmembrana TMHMM, y a algun otro, y compara resultados.
>2_636 AA
MEGPAFSKPL KDKINPWGPL IILGILIRAG
VSVQHDSPHQ VFNVTWRVTN LMTGQTANVT SLLGTMTDAF PKLYFDLCDL IGDDWDETGL GCRTPGGRKR
ARTFDFYVCP GHTVPTGCGG PREGYCGKWG CETTGQAYWK PSSSWDLISL KRGNTPRNQG PCYDSSAVSS
NIKGATPGGR CNPLVLEFTD AGKKASWDGP KVWGLRLYRS TGIDPVTRFS LTRQVLNIGP RVSIGPNPVI
TDQLPPSRPV QIMLPRPPQP PPPGAASIVP ETAPPSQQPG TGDRLLNLVD GAYRALNLTS PDKTQECWLC
LVAGPPYYEG VAILGTYSNH TSAPANCSVA SQHKLTLSEV TGQGLCVGAV PKTHQALCNT TQTSSRGSYY
LVAPTGTMWA CSTGLTPCIS TTILNLTTDY CVLVELWPRV TYHSPSYVYG LFERSNRHKR EPVSLTLALL
LGGLTMGGIA AGIGTGTTAL MATQQFQQLQ AAVQDDLREV EKSISNLEKS LTSLSEVVLQ NRRGLDLLFL
KEGGLCAALK EECCFYADHT GLVRDSMAKL RERLNQRQKL FESTQGWFEG LFNRSPWFTT LISTIMGPLI
VLLMILLFGP CILNRLVQFV KDRISVVQAL VLTQQYHQLK PIEYEP
3. Envía la siguiente secuencia a los servidores de predicción de fosforilación y glicosilación (NetOGly, NetPhos)
>3_41 AA
ASYDGHKLVAGYDFTPPSTPSTDDPNVCREYSYKLGTYGAP
>4_153 AA
ASQKRPSQRHGSKYLATASTMDHARHGFLPRHRDTGILDSIGRFFGGDRGAPKNMYKDSHHPARTAHYGSLPQKSHGRTQ
DENPVVHFFKNIVTPRTPPPSQGKGRKSAHKGFKGVDAQGTLSKIFKLGGRDSRSGSPKPELVISALIVESRR