Mange proteiner folder og krøller seg på intrikate måter.

DeepMind AI har løst 50 år gammelt problem: Kan forutse proteiners form

– Jeg tror de som lager legemidler vil juble over dette, sier norsk forsker. Andre kaller det et fantastisk fremskritt og en revolusjon for forskningsfeltet.

Norsk-amerikanske Christian Anfinsen fikk nobelprisen i kjemi i 1972. Han hadde skjønt noe viktig:

I teorien skal det være mulig å beregne den tredimensjonale strukturen til et protein, hvis man kjenner rekkefølgen på aminosyrene det er laget av.

Siden har forskere forsøkt å lage dataprogrammer som kan knekke den uhyre kompliserte gåten.

Nå har Google-selskapet DeepMind slått alle rekorder.

AI-programmet deres, AlphaFold2, danket ut rundt hundre andre team i en konkurranse kalt CASP (Critical Assessment of Structure Prediction).

AlphaFold2 endte med et medianresultat på 92,5 av 100. En score over 90 er regnet for å være sammenlignbart med det forskere oppnår gjennom tidkrevende og vanskelige laboratoriemetoder.

– Det er stort å se den menneskelige triumfen av nysgjerrighet, innsats og intelligens for å løse dette problemet, sier Janet Thornton, direktør emeritus ved EMBLs European Bioinformatics Institute, i en pressemelding.

Byggesteiner i alt liv

Proteiner er grunnleggende bestanddeler i alt liv. De er med å bygge opp alt fra organer til hud og gjør en rekke oppgaver inne i cellene. Antistoffer er også en type proteiner.

Forskere har identifisert omtrent 200 millioner proteiner. Men de kjenner bare formen til en liten del av dem.

Ved å se på gener som koder for proteiner, kan forskere finne rekkefølgen av aminosyrene det består av.

Men proteiner er ikke bare utstrakte tråder, de kan krølle og folde seg i kompliserte strukturer. Det er først når proteinene har funnet sin form at deres egenskaper kommer fram.

I teorien kan foldingen skje på astronomisk mange forskjellige måter. Et tall på 1 fulgt av 300 nuller er foreslått. Tankeeksperimentet kalles Levinthals paradoks.

Hva som styrer hvordan proteinet får sin form er ikke kjent til det fulle.

– Man vet en hel del, men ikke nok, sier Rein Aasland, instituttleder ved Institutt for biovitenskap, Universitet i Oslo (UiO) .

– Dersom man hadde visst det fysisk i detalj så kunne man beregne dette på grunnleggende prinsippbasis.

– Fantastisk fremskritt

Men kunstig intelligens har evnen til å se mønstre som så langt er skjult for oss.

AlphaFold2 har gjort det.

– Det er et gjennombrudd. Det er ingen tvil om det. Vi visste alle at denne typen fremgangsmåte ville få stor betydning, men jeg tror ingen drømte om at det skulle bli så bra så fort, sier Aasland. Han har fulgt med på feltet lenge.

Andre forskere er også imponert.

– Dette dataarbeidet representerer et fantastisk fremskritt på proteinfoldning-problemet, en 50 år gammel «grand challenge» i biologi, sier Venki Ramakrishnan, nobelprisvinner i kjemi og president i britiske Royal Society, i en pressemelding.

Nathalie Reuter er professor ved Kjemisk institutt ved Universitetet i Bergen. Hun forsker på proteiner og deres struktur opp i mot legemiddelutvikling. Hun betegner prestasjonen som nærmest en revolusjon på feltet.

– Folk har brukt årevis på å prøve å finne måter å predikere proteiners 3D-strukturer. Og så kommer AlphaFold2 og får det til bedre enn noen andre noen gang har gjort. Prediksjonene er såpass gode at de er nesten like gode som det man oppnår med eksperimenter, sier Reuter til forskning.no.

Kjent for superintelligens i spill

DeepMind er kjent for å laget AI-en AlphaGo som har slått en av verdens beste spillere i brettspillet Go. Et annet program, AlphaZero, brukte bare fire timer på å bli så god i sjakk at den slo Stockfish, det beste sjakkprogrammet i 2017.

DeepMind har de siste årene også rettet seg mot å løse et av biologiens store problemer: Hvordan proteiner foldes.

Kostbare metoder

Det finnes eksperimentelle metoder for å avdekke proteiners form: røngtenkrystallografi, NMR og kryoelektronmikroskopi.

– Det er ekstremt tidkrevende og veldig kostbare metoder, sier Rein Aasland fra UiO.

– Det å få penger og folk nok til å prioritere det, er svært krevende. Hvis man kan få datamaskiner til å beregne strukturene, så er det rett og slett en økonomisk besparelse. Man vil kunne gjøre mange ting mye fortere. Det er hastigheten også her som har stor betydning.

Konkurransen CASP ble startet i 1994. Den har vært avholdt hvert andre år siden. Dataprogrammer som er designet for å avdekke proteiners struktur måles mot hverandre.

Teamene får aminosyresekvenser til et par hunder proteiner og sender inn sine forslag. Strukturene til proteinene er nylig avdekket eksperimentelt og ukjente for deltakerne mens konkurransen pågår.

En uavhengig komité sjekker deltakernes resultater opp mot de eksperimentelle dataene.

– Det er en slags standard slik at de som konkurrerer blir målt mot de samme oppgavene. Det er veldig nyttig. Hvis vi ikke hadde det, ville alle som prøver å utvikle en metode bare kjøre sine egne tester. Da ville vi aldri vite hvilken metode som er best, sier Nathalie Reuter ved UiB.

Høy presisjon

AlphaFold2 oppnådde et medianresultat på over 90 av 100. Dette er en nøyaktighet på 1,6 ångstrøm, omtrent som diameteren av et atom.

På de mest utfordrende sekvensene klarte AlphaFold en medianscore på 87.

En tidligere versjon av AlphaFold gjorde det også best i 2018. Da med en medianscore på under 60 på de mest utfordrende oppgavene.

Den kunstige intelligensen er trent på 170 000 kjente proteinstrukturer, i tillegg til store databaser med proteinsekvenser uten kjent form, skriver DeepMind.

– De som lager legemidler vil juble

DeepMind skriver at de har begynt å utforske hvordan gi andre grupper tilgang til deres struktur-prediksjoner. Videre er de i gang med å forberede en vitenskapelig artikkel som skal fagfellevurderes.

Teknologien vil bli nyttig for på flere felt, mener Aasland.

– Jeg tror nok den farmasøytiske industrien og alle de som vil lage legemidler vil juble over dette her. Men også de som vil ha grunnleggende kunnskap om hvordan naturen fungerer i seg selv, sier han.

Legemiddelutvikling er et godt eksempel, sier også Nathalie Reuter.

– I alle prosjektene jeg jobber med er vi veldig avhengig av å skjønne strukturer til proteiner. Et legemiddel er som en nøkkel som passer i en lås, og låsen er proteinet. Hvis vi ikke kjenner 3D-strukturen, så vet vi ikke hvordan låsen ser ut, og det blir veldig vanskelig å finne en legemiddelkandidat, sier hun.

Den andre delen av problemet er ikke løst

Aasland tror at AlphaFold2 sin prestasjon vil gjøre at flere forskere som jobber med det samme i dag vil kaste kortene og se etter noe annet å gjøre.

– Eller de vil dreie fokuset til andre områder innen dette feltet, for eksempel å se på større proteiner eller komplekser av proteiner. Mange av proteinene jobber i komplekser og blir «maskiner» som jobber inne i cellene.

– Er problemet om hvordan proteiner folder seg nå løst?

– Nei, sier Aasland.

Foldeproblemet kan deles i to.

– Det ene er: Gitt en sekvens av aminosyrer av et protein, gi meg en prediksjon så god at jeg kan gjøre eksperimenter på grunnlag av den. Nå ser vi løsningen på det. Men foldeproblemet er også å forstå selve prosessen for hvordan proteiner folder seg. Man kan si: Glem kunstig intelligens. Nå bruker vi menneskelig intelligens til å forstå det.

Dette problemet er ikke løst og er en enda større utfordring, sier Aasland.

Eksperimenter er fortsatt nødvendige

De eksperimentelle metodene vil ikke bli overflødige med det første.

– Jeg tror ikke AlfaFold2 vil gjøre at vi ikke vil trenge eksperimenter lenger, men det vil hjelpe, sier Reuter ved Universitetet i Bergen.

Den kunstige intelligensen kan for eksempel hjelpe forskere der de står fast.

Aasland ved Universitetet i Oslo sier at kryoelektronmikroskopi vil gå hånd i hånd med AlphaFold2 i årene som kommer og at de vil bli et kraftig teknologisk par.

I en del prosjekter vil man nok kunne hoppe over den eksperimentelle delen og gå rett til å bruke prediksjoner laget av AlphaFold2.

Aasland er ikke i tvil om at den kunstige intelligensen representerer en utvikling.

– Jeg synes dette er noe av det absolutt største som har skjedd på lenge innen dette faget, helt klart. Det har vært kjent som et av molekylærbiologiens kardinalproblem lenge.

– Jeg tror også dette kommer til å inspirere mange unge som tenker på å gå inn i forskning til å se at wow, her vil jeg være med. Jeg tror at dette gjennombruddet kommer til å få mange unge talenter til å velge en karriere innen strukturbiologi, maskinlæring og kunstig intelligens.

Powered by Labrador CMS