Denne artikkelen er produsert og finansiert av Universitetet i Oslo - les mer.

Kan forskere bruke KI til å designe forskningsprosjekter?

–  Etter min mening vil KI påvirke arbeidsmarkedet for forskere, sier forsker som testet en språkmodell i sitt fag.

Kjemiker på lab med pc
– Jeg var ganske imponert over kvaliteten på hva den fikk til, sier forsker om oppgaven språkmodellene utførte.
Publisert

David Balcells er forsker i kjemi ved Universitetet i Oslo og bruker språkmodeller til mange ting. 

Han mener modellene er et godt verktøy hvis de blir brukt riktig og kritisk. Derfor ville han se hva de kunne få til dersom han ba dem om å bli forsker.

Han kaller metoden for co-intelligent design. Det er ikke ulikt det som skjer når eksperter jobber sammen. Selv om det i dette tilfellet er ham selv, sammen med et kollegium av ulike språkmodeller.

– Co-intelligent design brukes også om å jobbe tverrfaglig, forklarer Balcells. 

Når teoretikere og forskere som gjør praktiske eksperimenter jobber sammen, kan de gjøre ting som ikke er mulig alene. 

– Derfor ville jeg se om jeg kunne få den samme effekten med KI.

Kan KI forbedre KI?

Utfordringen Balcells gav språkmodellen ChatGPT handlet om å lage en maskinlæringsmodell som skulle forutse store kombinatoriske rom i kjemisk katalyse.

Det vil si å finne ulike måter kjemiske strukturer kan settes sammen på. 

Slik finner kjemikerne nye kombinasjoner, altså nye stoffer. Det er en del av kjemien som brukes mye innen farmasøytisk industri for å lage nye medisiner. 

Balcells jobber selv med å lage maskinlæringsverktøy for denne typen kjemiske oppgaver.

– Og det er morsomt å se om en KI kan utvikle en ny KI, mener Balcells.

I tillegg ville han se om kunstig intelligens på dette området har blitt hausset opp, eller om det faktisk kan brukes til å utvikle og designe forskningsprosjekter.

KI i forskning

Kunstig intelligens og språkmodeller brukes allerede til en del oppgaver i forskning. Det finnes automatiske laboratorier hvor en språkmodell kan assistere i flere oppgaver.

De er også brukt til katalyse, data-mining, molekyl- og materialdesign, utforske antall mulige kombinasjoner av stoffer, organisk syntese, optimering av egenskaper, undervisning og kritisk tenkning.

Det er utfordringer, men det bør ikke hindre oss 

– Det er utfordringer med at KI-modeller trener på innhold som er beskyttet av åndsverkloven, eller at eksperter opplever en reduksjon av ferdigheter. I tillegg kan modellene misbrukes til å gi informasjon om hvordan en bombe kan bygges eller bidra til kjemisk krigføring, sier han.

Han mener at en del av kritikken av KI-modellene går tilbake i tid.

– Noen modeller ble lansert før de var klare. Nå finnes det modeller som er laget for forskning. Forskjellen mellom dem og de generelle modellene er betydelig, sier han.

Til tross for utfordringene, mener han det ikke må hindre oss i å bruke KI.

– Noen av dagens modeller kan lastes ned eller tilpasses eget bruk. Det er mulig å lage et helt lag av kollegaer som kan samarbeide og reflektere hvis du forteller dem hvem de er, forklarer Balcells.

Han påpeker også at det er enkelte versjoner som viser til kildematerialet og hallusinerer mindre enn andre.

Forsker David Balcells på kontoret sitt foran PC
David Balcells ved Universitetet i Oslo er interessert i å finne ut mer om hvordan KI kan brukes i forskning.

En måte å bruke KI-modeller på, er å gi modellene tilgang til millioner av forskningsartikler og be om forbindelser på tvers av fag. 

Da er det mulig å se sammenhenger som kan være vanskelig å få til med ren menneskelig intelligens fordi ingen kan lese så mange artikler.

– Å bruke KI kan få arbeidet til å gå raskere. Jeg bruker det mye til koding, men uansett hva KI brukes til må du være årvåken, sier Balcells. 

«En spennende bestrebelse», mener ChatGPT

Balcells forklarer at målet var å teste KI-modellene for å se hva de fikk til uten at han skrev en detaljert oppgave eller prompt til den.

Til oppgaven brukte han ChatGPT modell 4.0.

– Det finnes KI som er designet for å brukes til å løse forskningsoppgaver eller kjemioppgaver, sier Balcells. 

Målet var å se om en mer generell KI kan gjøre det samme.

– Jeg ba ChatGPT om å være forsker i beregningsorientert kjemi. Deretter skulle den samarbeide med meg om å designe et forskningsprosjekt, sier han.

Balcells forteller at språkmodellen fremstod entusiastisk i svaret. Oversatt til norsk sa den: «Det høres ut som en spennende bestrebelse.»

Den fikk til mye, men ikke alt

En av oppgavene ChatGPT måtte løse var et regnestykke hvor målet var å finne mulige kombinasjoner av hundre ulike molekyldeler.

– Den gjorde noen antagelser som var rimelige, men som den ikke forklarte eller gjorde rede for i svaret, sier Balcells.

Alt i alt lyktes den i å designe et prosjekt, selv om den var noe vag og heller ikke refererte til treningsdata, ifølge Balcells.

– Den ville ha vært i stand til å passere Turingtesten. Forskningsprosjektet den designet hang på greip, mener forskeren.

Turingtesten

I 1950 formulerte matematikeren Alan Turing en test kjent som Turingtesten. 

Testen skal se om en maskin kan imitere menneskelig tenkeevne, altså være så lik et menneske at et menneske ikke klarer å skille mellom hvem som er menneske og hvem som er maskin i testen.

Referanse: Store norske leksikon

KI kritiserer annen KI

Da ChatGPT hadde designet forskningsprosjektet, ba Balcells om følgende:

– Kan du gjøre en kritisk evaluering av forskningsprosjektet og deretter si om et menneske vil kunne se at det var co-designet med en KI?

Balcells forteller at ChatGPT klarte å evaluere sitt eget prosjekt og både påpeke styrker og svakheter.

– ChatGPT påpekte noen sider ved prosjektet som kunne antyde at det var laget med KI, men yttrykte at det var vanskelig å komme med et klart svar, sier forskeren.

Deretter testet Balcells om de to andre KI-modellene DeepSeek og Gemini kunne gjøre det samme.

– Det interessante her var at DeepSeek og Gemini var uenige med hverandre. Men begge har litt rett, sier Balcells.

Balcells mener at DeepSeek generelt er mer kritisk, på grensen til uhøflig. Han tilskriver dette kulturforskjeller ettersom DeepSeek er kinesisk. Amerikanske ChatGPT er på sin side i overkant entusiastisk.

Slik ble konklusjonen

Etter testen mener Balcells at co-intelligent design av et forskningsprosjekt er mulig uten å bruke spesialiserte modeller eller sofistikerte bestillinger.

Den klarte å gjøre oppgaven uten å hallusinere, men den utelot noen sentrale elementer, noe som ikke ville ha blitt akseptert av eksperter, forklarer Balcells.

Balcells brukte generelle språkmodeller som er tilgjengelige for alle. Etter han gjorde forsøket sitt har det blitt lansert to språkmodeller som begge er myntet på forskning: Deep Research fra OpenAI og Gemini Deep Research fra Google.

KI vil endre arbeidsmarkedet for forskere – til det bedre om det brukes riktig

Balcells mener at begge disse vil kunne ta co-intelligent design til et nytt nivå innen forskning.

– Jeg var ganske imponert over kvaliteten på hva modellen jeg brukte fikk til. Med tanke på at dette er såkalt single-shot prompting, som egentlig ikke er anbefalt, så gjorde den det ganske bra.

– Mange er bekymret for arbeidsmarkedet. Etter min mening vil KI påvirke arbeidsmarkedet for forskere – ikke ved at det blir færre stillinger, men ved at kvaliteten og kvantiteten på forskningen går opp, sier han.

Men det er bare hvis vi lærer oss å bruke dette verktøyet riktig, legger han til.

Referanser:

David Balcells: Co-intelligent Design of Catalysis Research with Large Language Models: Hype or Reality? ACS Catalysis, 2025. https://doi.org/10.1021/acscatal.5c04238

Thomas Marwitz mfl.: Predicting New Research Directions in Materials Science using Large Language Models and Concept Graphs. arXiv, 2025.  https://doi.org/10.48550/arXiv.2506.16824

Powered by Labrador CMS