Kan du komme på noen oppfinnsomme måter å bruke et stearinlys? ChatGPT var flinkere til det enn den jevne person.

Kan kunstig intelligens være kreativ? ChatGPT var bedre enn mennesker på en klassisk test

Kunstig intelligens kan etterligne et aspekt ved kreativitet, men kreativitet er sammensatt. 

De siste to årene har kunstig intelligens fascinert med ferdigheter til å lage bilder og musikk, kode, skive dikt og svare på eksamensoppgaver

Kunstig intelligens (KI) har tatt steget inn i det kreative domenet, som før har vært forbeholdt mennesker. 

– Det er mye diskusjon for tiden om KI kan være kreativ, sier Simone Grassini, førsteamanuensis i psykologi ved Universitetet i Bergen. 

Kunstig intelligens er ikke kreativ på samme måte som mennesker, sier han. Isteden kan vi si at kunstig intelligens imiterer menneskelig adferd basert på statistiske mønstre. 

Men om vi måler ut fra resultater, så simulerer KI menneskelig kreativitet, sier Grassini. 

Dette har Grassini og hans finske kollega, Mika Koivisto, nylig undersøkt i en studie som er publisert i tidsskriftet Scientific Reports. 

Forskerne testet tre KI-systemer: ChatGPT3, ChatGPT4 og Copy.Ai (som er basert på ChatGPT3-teknologi).

Gjorde det bra

Grassini og Koivisto har målt prestasjonen til chatbots sammenlignet med mennesker i en klassisk test. Testen måler en måte å tenke på som har blitt knyttet til kreativitet. 

Det var på et vis overraskende hvor godt den kunstige intelligensen gjorde det, sier Grassini. 

ChatGPT presterte på et høyt nivå og i gjennomsnitt bedre enn folk. 

Samtidig, feltet utvikler seg raskt. 

– Vi vet, bare fra å leke oss med dette, at KI har egenskaper som simulerer menneskelig kreativitet, så det var ikke helt uventet at KI har blitt så god. 

Simone Grassini, førsteamanuensis i psykologi ved Universitetet i Bergen.

Hvordan bruke et tau? 

Testen forskerne brukte kalles Alternate Uses Task (AUT) og ble utviklet av Joy Paul Guilford i 1967. 

Den går ut på å komme opp med kreative ideer til hvordan bruke objekter. 

Objektene forskerne valgte ut var tau, boks, blyant og stearinlys. 

256 deltakere mellom 19 og 40 år ble instruert til å komme opp med originale og kreative bruksområder for objektene. De fikk 30 sekunder på seg per gjenstand. 

Deltakerne ble fortalt at målet var at ideene skulle slå folk som fiffige, uvanlige og oppfinnsomme, heller enn at de skulle liste opp de vanligste bruksområdene. 

ChatGPT fikk samme instruksjoner. 

Forskerne testet tre KI-systemer: ChatGPT3, ChatGPT4 og Copy.Ai (som er basert på ChatGPT3-teknologi).

Fikk poeng 

Det forskerne testet var såkalt divergent tenkning. Det handler om å komme på flere, nye og uvanlige løsninger og har blitt knyttet til kreativitet. 

En kan skille mellom denne måten og tenke på og konvergent tenkning, som handler om å komme med det beste svaret ut fra kjente løsningsmåter. 

I den nye studien ble svarene gitt en poengsum mellom 1 og 5 ut fra hvor originale og kreative de var. 

La oss si at du skulle komme opp med oppfinnsomme bruksområder for en penn. 

Hvis du skriver at du kan bruke pennen som en fallskjerm, får du dårligst score, for det gir ikke mening.

Hvis svaret ditt er «å skrive en bokstav», får du også lavest score, fordi avstanden mellom betydningen av ordene penn, det å skrive og bokstav, er kort, forklarer Grassini.

– Men hvis du sier at du kan bruke en penn som en pil for å spille dart, er avstanden mellom betydningen av ordene lenger.

Forskerne fikk et dataprogram til å vurdere denne avstanden. I tillegg instruerte de seks personer til å vurdere hvor kreative svarene var og gi poeng. De fikk ikke vite at KI hadde laget en del av svarene. 

Det var stor grad av samsvar mellom vurderingene fra dataprogrammet og de menneskelige poenggiverne. 

Mennesker svarte både verst og best

– Det vi fant var at KI-systemene gjorde det bedre enn mennesker i gjennomsnitt, fastslår Grassini. 

Om forskerne fjernet de dårligste svarene, presterte chatbotene i gjennomsnitt rundt 0,5 poeng bedre enn mennesker.

Noe annet som kom frem, var at de kunstige intelligensene konsekvent unngikk å svare dårlig. Ingen av svarene fikk en score på 1. Det gjorde imidlertid flere av svarene som ble gitt av mennesker. 

Til menneskets forsvar, var det også mennesker som kom med de aller beste svarene. 

– Menneskelige respondenter med et høyt nivå av kreativ adferd presterte fremdeles bedre enn maskinen. 

Noe annet som var interessant, synes Grassini, var at ChatGPT4 ikke gjorde det bedre enn den tidligere versjonen ChatGPT3, målt med dataprogrammet. 

Men ChatGPT4 fikk likevel bedre score av de menneskelige poenggiverne. 

– Det er interessant, fordi det ser ut til at med forbedringen av modellen, så er den i stand til å simulere adferd som er mer tiltalende for mennesker. Da uten at det er en endring i den objektive avstanden som ble kalkulert av algoritmen. 

– Måler ikke kreativitet 

Pianist Ole Fredrik Norbye er førstelektor musikk NLA Høgskolen og har blant annet kreativitet som fagfelt.

Han har sett på den nye studien. Han sier det forskerne har testet er spennende, men han har flere bemerkninger til hvordan studien bør tolkes. 

Noe han ikke synes kommer godt nok frem i artikkelen er at AUT-testen ikke måler kreativitet, men kun divergent tenkning. 

– Divergent tenkning kan være noe som antyder at man kan bli kreativ.

– Men det er ikke så enkelt at om du scorer høyt på testen, så er du en kreativ person. 

Kreativitet er et litt vrient begrep, sier Norbye. 

– Det blir til mellom de personlige egenskapene og ferdighetene du har og det sosiale miljøet du er en del av.

Tre aspekter 

Norbye utdyper. Kreativitet er gjerne sammensatt av tre ting. 

Du trenger fagkunnskap innenfor feltet du vil være kreativ. 

– Det er ikke sånn at hvis jeg er kreativ som musiker, så blir jeg automatisk en kreativ ingeniør. En kreativ ingeniør trenger fagkunnskaper for å kjenne de fysiske lovene, for å vite hva som har blitt gjort før og hva som er mulig å få til. 

Det er en forutsetning for å komme opp med gode nye ideer, påpeker Norbye. 

Videre trenger du kreative ferdigheter, som handler om å kunne utfordre antagelser, tenke nye tanker og se et problem fra flere vinkler. Her kan divergent tenkning inngå. 

Det siste handler om motivasjon og det sosiale. 

– Kreativitet skaper en endring. Det kan skape uro og støy og det kan koste å komme med noe nytt. Hvis man ikke man har motivasjon og insentiver, så får man ikke ut det kreative potensialet.

En person kan være kreativ på en arbeidsplass og stagnere på den neste på grunn av det sosiale miljøet.  

Mener chatbotene hadde bedre utgangspunkt

Norbye er ikke overrasket over at chatbotene i gjennomsnitt presterte bedre enn mennesker på testen, men at mennesker hadde de aller beste ideene. 

Måten testen ble gjennomført, gir chatbotene et bedre utgangspunkt på startstreken, mener Norbye. 

Mennesker fikk 30 sekunder på å tenke seg om. 

– Det vil si at man også tester hvor rask du er til å skrive inn ord og komme på ord. Der vil chatboten gjøre det ekstremt bra.

For mennesker er det gjerne slik at de første ideene man kommer på, ofte er de vanligste. 

– Deltakerne ble bedt om å ikke skrive de mest åpenbare. Men ofte må vi mennesker få ut de mest åpenbare først, før vi begynner å tenke nytt. 

AUT-testen er mye brukt innen forskning. Det er sannsynlig at chatbotene har lest forskningsartikler om den samme testen tidligere, som en del av treningsmaterialet sitt, mener Norbye.

De kan altså ha lest eksempler på gode forslag til hvordan å bruke et tau tidligere. 

Bør utvikles en ny test

Simone Grassini sier han er helt enig i at kreativitet er mer enn divergent tenkning. 

– Dette står noen få ganger i artikkelen, og jeg vil også understreke det igjen. 

For å begrense problemet med at KI er raskere til å svare, hadde de begrenset antallet svar som chatbotene kunne gi. Det var basert på gjennomsnittet av antall svar som menneskene ga. 

– Hvis vi ikke hadde begrenset antallet svar som KI ga, ville den ha overgått mennesker bare med hastighet.

Når det gjelder at KI kan ha funnet svar i treningsdataene, sier Grassini at dette er noe de tar opp i den vitenskapelige artikkelen. De skriver at det er mulig at chatbotene simpelthen henter ideer som finnes i databasen deres. Mennesker kan også ha vært borte i testen før. 

Fremtidige studier bør utvikle en komplett ny test som det ikke finnes eksiterende svar på, anbefaler de. 

Trussel mot de kreative yrkene? 

Vil kunstig intelligens bli en trussel for de som jobber i kreative yrker? 

Simone Grassini sier at dette er noe som diskuteres mye. 

Han påpeker at hvordan kunstig intelligens presterer på en individuell oppgave, som i denne studien, ikke direkte er overførbart til hvordan KI ville gjort det i en kreativ jobb. 

Men, det åpner for refleksjon at teknologien er på vei til å bli god til ting som vi trodde at bare mennesker kunne få til, sier han. 

Når det gjelder om KI vil ta jobbene, så sier Grassini at han tenker at KI heller vil hjelpe folk med å forbedre kvaliteten på arbeidet. 

– Jeg foretrekker å tro at mennesker og KI vil samarbeide, heller enn at i KI vil bli den neste Leonardo da Vinci. 

———

Denne saken kan du også lese på engelsk på sciencenorway.no

Referanse: 

Mika Koivisto & Simone Grassini: «Best humans still outperform artificial intelligence in a creative divergent thinking task», Scientific Reports, 14. september 2023. 

Få med deg ny forskning

MELD DEG PÅ NYHETSBREV

Du kan velge mellom daglig eller ukentlig oppdatering.

Powered by Labrador CMS