Denne artikkelen er produsert og finansiert av Universitetet i Oslo - les mer.

Kunstig intelligens er god til å lese snirklete håndskrift. Kan du lese det som står her?

Ved hjelp av kunstig intelligens og dugnadsånd skal Naturhistorisk museum gjøre tusenvis av gamle alger tilgjengelige over internett.

Her ser du en av algene som ble digitalisert. Kan du se hva som står under den?
Publisert

Trygt forvart i 350 små pappkasser ligger tusenvis av alger.

Naturhistorisk museum i Oslo har Norges største algesamling, men de er vanskelige å finne.

Delvis på grunn av snirklete håndskrift. Delvis fordi det er mange kasser, samlet gjennom århundrer. Det gjør det også vanskelig å forske på dem.

Hvordan skal man for eksempel finne alle alger som er funnet i Oslofjorden? Eller alle alger samlet før år 1900 for å se om de har endret seg over tid?

Derfor skal hele algesamlingen digitaliseres.

Eirik Rindal er nestleder for samlingene og initiativtaker til digitaliseringen. Han har anslått at det skulle være 12.600 alger.

I samarbeid med konservator Wenche Ekrem har de planlagt arbeidet.

Slik jobbet de

IT-avdelingen ved museet har laget en metode hvor kunstig intelligens hjelper til med å tyde den snirklete håndskriften.

Rindal var spent på om de klarte å digitalisere hele samlingen på den tiden de hadde satt av til digitaliseringsdugnaden. 

Bak lukkede dører på Økern sitter et tyvetalls mennesker. Stemningen er preget av en konsentrert, effektiv jobbing.

I bakgrunnen høres en lav mumling når noen stiller et spørsmål, lyden av tørre, gule ark som blas om og raske skritt med knirkende sko.

I flere dager har de sittet her. Rindal kaller arbeidet semi-tvang, men med et smil.

– Det er faktisk en form for miljøtiltak, sier han.

Å jobbe sammen på denne måten, skaper bedre samhold på tvers av fagmiljøene, mener han.

– Tanken er at alle ansatte gir samlingen et løft som én enkelt person ikke kan gjøre alene. Vi blir gode sammen, sier han.

Slik ser det ut når 15.000 alger blir gjort tilgjengelige for allmennheten.

Flere tusen alger mer enn beregnet

Til nå har de fotografert om lag 15.000 alger. Det er 2.400 mer enn det Rindal anslo. Fremdeles er de ikke ferdige. Dette er den femte dagen.

Rindal går inn i arkivet og demonstrerer hvor mye 15.000 algeprøver faktisk er. Det er en hel vegg med kasser. I hver kasse ligger flere titalls eksemplarer av én eller flere arter.

Tilbake i samlingen viser han fram en av algene.

– Se her. Dette er en rødalge. Er den ikke nydelig? Man blir glad av å se på slikt, sier han.

Rindal kommenterer at i forrige uke var det andre alger: De så mer ut som snørrklyser.

– Fem minutter til frukt, roper Rindal utover forsamlingen.

Den konsentrerte raslingen intensiveres av pausevarslingen. Mest mulig skal unna før avbrekket.

Rindal forteller at stasjonene for fotografering sender en belønning i form av fyrverkeri når det er tatt 400 bilder.

– I går tok den mest effektive stasjonen 1.000 bilder, sier han.

Her er det mer enn 15.000 alger, sortert og oppbevart. Frem til der Eirik Rindal står er alt også digitalisert. Fremdeles er det noen bokser igjen.

Museumsarbeid er ikke samlebåndsarbeid

Vi passerer en merkelig konstruksjon, og Rindal forklarer at dette er et samlebånd som ble kjøpt inn til forrige digitaliseringsdugnad.

– Men da ble det store protester. De ansatte ville slett ikke jobbe ved et samlebånd, sier han.

Likevel er arbeidet effektivt organisert. Fra før er samlingen gjennomgått slik at det skal være enkelt å åpne og fotografere alle eksemplarene.

Ved den første stasjonen blir boksen åpnet. Mappen med algen i får så en strekkode-etikett. Dersom det er nødvendig å åpne en ekstra konvolutt blir det lagt ved en rosa lapp.

Når alle algene i én boks har fått etikett, blir hele boksen satt på en ventestasjon. Her går den videre til fotografering.

Bildene blir lagt i en digital database. Deretter scannes strekkoden, og eksemplaret av algen finnes som en digital fil.

Her tar Rindal over.

Her jobber en av de ansatte med å fotografere alger på fotostasjonen.

Hele samlingen skal gjøres tilgjengelig på nettet

– Jeg laster opp bildene i en løsning som Michal Torma, en av våre programmerere har laget, sier han.

I denne løsningen bruker forskerne kunstig intelligens til å lese av all tekst på bildet og analysere hva bildet viser.

Deretter standardiserer den svarene slik at informasjonen blir søkbar og tilgjengelig.

Er den ikke vakker? Noen av algene er mer fotogene enn andre.

Rindal forklarer at den tekniske løsningen er det som gjør arbeidet mulig. De standardiserte svarene inneholder informasjon om art, funnsted, tidspunkt og hvem som fant den.

Når hvert eneste av de 15.000 alge-preparatene er standardisert, kan hele samlingen bli tilgjengelig på nettet.

Rindal viser fram et eksempel. Håndskriften fra tidlig 1900-tall er vanskelig å lese. Det viser seg raskt at den kunstige intelligensen er vesentlig bedre på å tyde klassisk håndskrift enn undertegnede.

– Kunsten ligger i promten. Hvis du forteller KI at den er god, blir den god. Den liker smisking. Vi sier blant annet at den skal være en «experienced biologist», sier han.

Klarer du å lese hvilken art dette er, hvor den er samlet, dato og hvem som har gjort det?

EU er inspirert av arbeidet

Fra før har Naturhistorisk museum hatt flere prosjekter med digitalisering.

– Den første samlingen vi hadde digitaliseringsdugnad på, var sopp. Men vi har også hatt dugnader på eksotiske fugler, lav og fossiler, sier Rindal.

Arbeidet har blitt lagt merke til utenfor Norges grenser.

– Hver alge skal få en DOI-kode. Vi får dette fra en digital infrastruktur fra EU. Målet er å gjøre naturhistoriske samlinger tilgjengelige og lettere å forske på, sier han.

– Vi er de første i verden som gjør dette, så vårt system skal bli en del av EU rammeverk i det videre arbeidet, legger han til.

Metoden de har utviklet ved museet blir sannsynligvis eksportvare til resten av verden.

Mål med dugnaden

  1. Gjøre det mulig å finne ting i samlingen

  2. Digitalt tilgjengelige eksemplarer

  3. Lære noe om algesamlingen

  4. Godt arbeidsmiljø

forskning.no vil gjerne høre fra deg!

Har du en tilbakemelding, spørsmål, ros eller kritikk? TA KONTAKT HER

Powered by Labrador CMS