Proteinstrukturprediksjon

Proteinstrukturprediksjon er et aktivt forskningsfelt hvor målet er å forutsi den tredimensjonale strukturen til proteiner utfra sekvensen (primærstrukturen). Dette er en tverrfaglig disiplin i bioinformatikk som i tillegg til bioinformatiske metoder bruker kunnskap fra fysikk, matematikk, statistikk, visualisering, informatikk og kjemi.

I naturen finnes det utallige proteiner som deltar i alle prosesser som gjør at en organisme kan utvikle seg, vokse og vedlikeholde seg. Proteiner har dermed blitt studert nøye helt siden forskere oppdaget at det fantes proteiner. Den første strukturen ble bestemt i 1958, og siden den gang har mer enn 59 000 strukturer blitt eksperimentelt bestemt og publisert i den offentlige databasen Protein Data Bank.[1]

Bare i menneskekroppen finnes det mellom 20 og 30 000 gener som koder for proteiner, og ett gen kan gi opphav til flere proteiner gjennom spleisingsprosessen som foregår i alle eukaryotiske organismer. Når det i tillegg finnes utallige andre arter og organismer, både planter og dyr, blir det klart at proteinene vi kjenner strukturen til bare utgjør en liten del av hva som faktisk finnes.

Strukturen til et protein henger nøye sammen med hvilken funksjon proteinet har, og det er dermed viktig å vite strukturen. I noen tilfeller er dette innen rekkevidde selv om bare sekvensen til proteinet er tilgjengelig, siden mange proteiner er beslektet og har samme funksjon i ulike organismer. Strukturen til et protein kan være nesten identisk mellom to beslektede arter, og hvis strukturen i ene arten er kjent kan denne brukes som et utgangspunkt for å gjette strukturen til det andre, tilsvarende proteinet. Dette kalles homologimodellering. Noen forskere mener at vi snart kan bruke bare homologimodellering for å finne strukturene til resten av proteinene vi ikke kjenner strukturen til.[2] Nyere homologimodelleringsmetoder kan bruke flere proteiner som utgangspunkt dersom sekvensen indikerer at strukturen er en kombinasjon av ulike andre proteiner.

I noen tilfeller er det umulig å finne slektskap mellom en kjent struktur og proteinsekvensen som ikke har struktur. Da brukes ab initio-prediskjon. Ab initio er latin og brukes i betydningen fra begynnelsen. Metoder for å gjøre ab initio-prediksjon prøver å gjette strukturen kun utfra sekvensen. Noen aminosyrer har en tendens til å forme bestemte sekundærstrukturer, og denne informasjonen kan brukes til å danne et bilde av hvordan sekundærstrukturen i proteinet kan være. Eksisterende proteinstrukturer analyseres stadig for å prøve å finne generelle trekk som gjør dem stabile, og dette kan brukes i gjetningen av strukturer. Prediksjon av proteinstruktur når den eneste informasjonen tilgjengelig er sekvensen er et meget vanskelig problem å løse, og krever store ressurser.

Et beslektet problem er å prøve å finne den overordnede ordningen av proteinkjeden, kalt proteinets fold. Her er ikke målet å finne nøyaktige koordinater for alle aminosyrene, men å finne ut hvordan proteinkjeden krøller seg sammen. Denne informasjonen må være på plass før detaljer som nøyaktig hvor hver enkelt aminosyre befinner seg kan komme på plass. Dersom en kjent struktur er utgangspunkt kan denne jobben allerede være gjort.

Når plasseringen av selve ryggraden er utført, gjenstår fortsatt plasseringen av sidekjedene i aminosyrene. Funksjonen til et protein er nesten alltid avhengig av hvordan sidekjedene er plassert og jobber sammen. Det er ikke alltid nødvendig å finne en god plassering for alle sidekjedene, men de som er involvert i funksjonen til proteinet, som oftest i proteinets overflate, er viktige å få på plass. En kompliserende faktor her er at sidekjeder er fleksible og kan ha flere konformasjoner.

Referanser rediger