Denne artikkelen er produsert og finansiert av Universitetet i Oslo - les mer.

Gruppen som forsker James Fleming kaller de slimete, omfatter alt fra blekkspruter til mark.

Blekkspruten er i slekt med snegler, men ingen vet nøyaktig hvordan

For å finne ut hvordan slimete dyr er i slekt, har forsker James Fleming laget matematiske verktøy.

Hvordan ser egentlig livets tre ut blant de slimete dyrene? James Fleming, forsker ved Naturhistorisk museum, sier det i hovedsak er tre store grupper som alle dyr kan deles inn i: 

  • Ryggstrengdyrene, hvor vi mennesker befinner oss.
  • Ecdysozoa, som for eksempel insekter.
  • Lophotrochozoa, som for eksempel blekkspruten. 

I tillegg finnes noen mindre grupper, men ifølge Fleming er disse tre de viktigste.

– For en lekmann er det kort og godt de dyrene som har ryggrad og de to gruppene uten ryggrad: de slimete og de knasende.

I følge Fleming er det mye mark, snegler og en god del parasitter blant de slimete dyrene.

– Det er mange dyr med navn som slutter på mark og så har du noen underlige former som blekksprut, forklarer han. Men maneter er noe helt annet. Det er mer en slags søstergruppe til de tre andre gruppene.

De slimete etterlater seg få spor

Flemings oppgave høres enkel ut: Finn ut hvordan de slimete er i slekt.

James Fleming er forsker ved Naturhistorisk museum.

– For dyr med ryggrad og de knasende har vi en god forståelse for utviklingen basert på fossiler. Det er fordi de etterlater seg harde rester som kan ses i fossilt materiale. De slimete derimot etterlater seg ikke mye. Samtidig, når vi ser på DNA, så er det store forskjeller. Så vi må forvente at denne gruppen er ekstremt variert, sier Fleming.

Noe av grunnen til den ekstreme variasjonen skyldes at de slimete dyrene ofte lever i havet. De har vært på planeten lenge – lenge før oppfinnelser som ryggrad eller knasende skall. 

Likevel vet vi lite om denne gruppen. Den slimete gruppen omfatter noen dyr som sannsynligvis er svært intelligente, som blekksprut. Men også dyr som få har lagt merke til, som kolonidyrene som bor på tang.

– Hvis du har plukket tang, så har du kanskje lagt merke til et hvitt nett som sitter oppå? Det er et kolonidyr. Den slimete gruppen omfatter alt fra blekksprut til slike, så det er åpenbart en hel masse evolusjon som har skjedd. Vi kan bare ikke finne det i fossiler fordi det ikke er bevart, sier Fleming.

For stor variasjon blir bare støy med genanalyser

På grunn av mangelen på fossiler har Fleming måttet finne andre metoder. Men fordi variasjonen i denne gruppen er så stor, er det nesten vanskeligere å finne slektskapet:

– Når vi bruker moderne genetiske metoder, opplever vi at det har vært så mye forandring at vi bare ser støy. På samme måte som hvis du tuner radioen for fort. Derfor har vi flere ulike teorier for hvordan alle disse passer sammen, sier Fleming.

Statistikk blir redningen

Ifølge Fleming handler mye av vår forståelse av evolusjon om å telle og registrere forandringer. Gjerne ved hjelp av ulike sannsynlighetsberegninger. Problemet er at det er veldig mange ukjente størrelser i likningene:

– Vi har ukjente størrelser som skyldes utdøing og variasjon som vi ikke ser. Vi har også mange ukjente fordi historien til et gen ikke er den samme som historien til en art, forteller Fleming.

Han forklarer historien til et gen slik: 

Hvis en tidligere populasjon med aper har både blå og brune øyne, men dagens etterkommere bare har brune, er den variasjonen tapt. 

Hvis den nåværende populasjonen har brune øyne, og det tilfeldigvis også er tilfelle med noen liknende arter, kan det se ut som at de to artene er nærmere beslektet enn de egentlig er. Og det bare fordi de har vært gjenstand for like endringer.

Det hender også at noen grener av livets tre er mer utsatt for forandring enn andre. Det kan skyldes flere ting. Det kan være at alle slektningene har dødd ut eller at det faktisk er mye endringer. Forskerne kaller dette for komposisjonell heterogenitet. Enkelt sagt betyr det bare at et dyr eller en liten gruppe med dyr, har endret seg så mye at de ikke likner på det de faktisk slekter på.

Da kan vi bruke våre metoder til å prøve å finne ut hvor den hører hjemme. Det kan være at den feilaktig likner noe annet. 

– Noe av det jeg jobber med, er å prøve å finne et tall som sier noe om sannsynligheten for at de er i slekt likevel, sier Fleming. 

Får hjelp fra biologiens månelanding

For å kunne gjøre dette er Fleming avhengig av gode genetiske data. Hele det menneskelige genom var ferdig sekvensert i 2003. Det er bare 20 år siden. Å sekvensere handler om å lese den nøyaktige rekkefølgen av et DNAs bestanddeler. 

Nå har forskere satt seg fore å sekvensere alle verdens arter, med unntak av bakterier. Prosjektet er så omfattende at flere har kalt det for biologiens månelanding.

– Hvis vi har alle genene til en blekksprut og alle genene til en snegle, kan vi kanskje ha nok gener til å finne ut av slektskapet, undrer Fleming.

Likevel advarer han:

– Matematikken kan komme fram til en rekke ideer som ser fornuftige ut, men i dag har vi ideer som ser fornuftige ut og som likevel er i strid med hverandre, sier Fleming.

Vanskelige gener

Noen av genene som forskere bruker til å se på slektskapet mellom dyr, kan lure dem. 

Fleming forklarer at hvis man skulle sjekke slektskapet mellom fisk og delfin ved å se på kroppsform eller leveområde, ville man kanskje lande på at de var nær beslektet, selv om delfinene er pattedyr. 

Noen gener kan også likne hverandre i ulike dyr uten at det betyr at dyrene er nær beslektet. Likheten kan være tilfeldig. Derfor må forskerne være svært nøye med hvilke gener de velger.

– Hvis vi ser på historien til alle de individuelle genene og gjør en statistisk analyse, kan vi få et tall på om vi lurer modellen. Eller om det er sannsynlig at svaret er overraskende, men fornuftig, forklarer han.

Dette tallet blir ofte kalt for posterior sannsynlighet fordi det gjøres etter at genanalysen er gjort. Og det sier noe om sannsynligheten for at analysen stemmer.

– Analysen kan bare være sann i henhold til data som jeg har gitt den, sier Fleming. Dårlige data, gir dårlige svar.

Tilfeldig, stort utvalg er like godt som nøye, lite utvalg

Så hvordan skal forskerne finne en metode for å velge de riktige genene? 

For ordens skyld: Det er ekstremt dyrt å ta med alle genene. Det krever store mengder data. Derfor må forskerne gjøre et utvalg. 

Tidligere har det vært vanlig å velge gener, men Fleming mener vi fort kan velge gener som peker mot en gitt konklusjon. Det kan gi oss feil svar om slektskap, slik som kroppsform i eksempelet med delfiner og fisk. I noen tilfeller kan gener se like ut, selv om organismene ikke er i slekt.

– Det vi har jobbet med i det siste, er å gjøre det motsatte: Ikke identifisere genområder i det hele tatt, det er en slags matematisk naivitet. Hvis du velger de genområdene som du tror at passer vår forståelse av evolusjon best, så er svaret du får, det du trodde du ville få. Det støtter gjerne den eksisterende teorien. Vi har laget en ny form for program som vi kaller speiderkniven, sier Fleming.

Fleming har laget programmet sammen med masterstudenten Pia Merete Eriksen. Speiderkniven er først og fremst et statistikkverktøy. 

Dersom en organisme har 5.000 gener, velger programmet 50 av dem helt tilfeldig. Dette gjør den 100 ganger.

– På denne måten vil enkeltgener som peker i feil retning, drukne i data fra andre gener. Sannsynligheten for at man velger et problematisk gen, er ikke så høy. Samtidig er det alltid sannsynlig at et problematisk gen er en del av utvalget. Med denne metoden er det likevel ikke så viktig fordi sannsynligheten for å utelukkende velge vanskelige gener er veldig lav, sier han.

Fleming bruker slegge der andre forskere velger skalpell

For å forsikre seg om at det er mulig å gjøre dette har Fleming og kollegene hans testet metoden på 18 slike genetiske slektskapsanalyser som allerede var gjennomført. Disse analysene er gjort med nøye utvalgte gener. 

Fleming tok imidlertid de samme organismene og valgte gener tilfeldig.

– Dette kan sammenliknes med å slenge en slegge mot en vegg, mens andre genetiske metoder er mer som en liten skalpell, som møysommelig velger ut hver eneste lille bit, sier han.

Likevel kom programmet frem til samme konklusjon som de forskerne som hadde valgt data på den tidkrevende måten.

– Hver gang fikk vi det samme svaret som de kom fram til. Det antyder at vår metode er like god, selv om vi ikke bruker tid på å velge ut gener. Vår metode er vesentlig raskere og litt mindre fordomsfull, sier Fleming.

Det største problemet med metoden, ifølge ham selv, er at den krever mye data. Dette problemet vil imidlertid løses med det nevnte prosjektet som skal sekvensere alle verdens arter.

– Betyr dette at du vil være i stand til å se bakover i historien og gjenskape familietreet til de slimete dyrene?

– Ja, det kan det bety. Det betyr i alle fall at vi kan lære mer om evolusjonsraten og hvordan ulike rater i evolusjonen virker, sier Fleming.

Han legger til at metoden kanskje er raskere enn tidligere metoder. Samtidig er sikkerheten på at svaret er rett, noe lavere. Derfor har han laget ett program til. Det kan sammenlikne modeller for slektskap og gi en figur for hvilken modell som er mer sannsynlig.

Tillit oppsummert i et tall

Fleming forklarer at metodene som brukes til å analysere data, kan gi debatt i miljøet. Et spørsmål som lenge har vært sentralt, er hvilket dyr som kom først: svampen eller ribbemaneten? Har strides forskerne.

Her håper Fleming at hans nye metoder kan gi en objektiv måte å finne ut av det på.

Han sier at forskere av og til prøver å bruke den andre sidens metoder for å bevise sin egen teori. Selv anser han kontroversen som løst når et laboratorium som tror sterkt på den ene teorien, publiserer en vitenskapelig artikkel som viser tro på den andre.

– Derfor har jeg samarbeidet med forskere fra Berkeley om å lage et program som tallfester tilliten vi kan ha til resultatet, sier han.

Metoden går ut på å ta to slektstrær det er forsket på og datasettene som er brukt for å komme fram til resultatet. Deretter tar programmet datasettet fra det ene settet inn i den andres modell og motsatt.

Det slektstreet vi bør ha størst tro på at stemmer, er det som har høyest sannsynlighet for å gjenskapes med begge datasettene. I alle fall hvis dataene er gode, sier Fleming.

Tallet som kommer ut, er et mål på tillit, eller sikkerhet, til at analysen stemmer.

Skrotet sin egen teori med den nye metoden

– Det er det som er så fint med dette programmet: Å sette et tall på vår egen fordomsfullhet eller usikkerhet, sier han.

Han legger til at han for tiden tester modellen på en av sine egne ideer om slektskap. Arbeidet er foreløpig ikke publisert vitenskapelig.

– Vi analyserte alle de ulike modellene for slektskap for de slimete dyrene. Analysen viste at det definitivt ikke var den ene, og at de to øvrige hadde like stor sannsynlighet for å være riktig, sier han.

Fleming forteller at den hypotesen som programmet landet på at det definitivt ikke var, det var hans egen. Det var et arbeid han hadde publisert vitenskapelig tidligere, som han var ganske sikker på og ganske fornøyd med. 

– Det var min hypotese som ble skrotet av min egen metode. Det er jeg i grunnen ganske fornøyd med, sier han.

Referanser:

James F. Fleming og Torsten H. Struck: nRCFV: a new, dataset-size-independent metric to quantify compositional heterogeneity in nucleotide and amino acid datasets. BMC bioinformatics, 2023. Doi.org/10.1186/s12859-023-05270-8

James Fleming mfl.: Scoutknife: A naïve, whole genome informed phylogenetic robusticity metricF1000Research, 2023.

Powered by Labrador CMS