Denne artikkelen er produsert og finansiert av Universitetet i Oslo - les mer.

Modellen har ikkje noko logisk forståing, sjølv om den skråsikkert slår fast at slik er det.

Chatroboten er dårlegare til å løysa likningar enn ein gjengs ungdoms­skulelev

– Så lenge KI ikkje tenkjer logisk, er den ikkje eigentleg intelligent, seier matematikkforskar.

La oss seia at absolutt alle innbyggjarar i landet Alfabetia bur i enten den eine eller den andre av dei to byane i landet, Bjørgvin og Christiania, og det finst òg ein by i Alfabetia som heiter Drammen, der det bur minst ein innbyggjar. Er denne påstanden sann eller usann?

Forhåpentleg får du ikkje dette til å gå opp, og konkluderer med at påstanden må vera usann. ChatGPT hevdar derimot at han er sann, fordi Drammen er ein by i Alfabetia som verken er Bjørgvin eller Christiania.

Slik var det i alle fall for ti månadar sidan, men sidan den gong har ChatGPT lært seg riktig svar. For den som ynskjer det, vil likevel ikkje by på store vanskar å setja ChatGPT eller andre språkmodellar fast på liknande logiske feller.

– Lukkast vi fyrst i å utvikla modellar som skjønar logikk, kan vi ta med oss det til andre fag, som realfag og jus, seier Trung Tuyen Truong.

Hamnar fort på djupt vatn

For professor Trung Tuyen Truong ved Matematisk institutt, Universitetet i Oslo, er den manglande logikken derimot alvor. Dette er det fyrste steget som må overvinnast før vi kan snakka om ein intelligent kunstig intelligens.

– Språkmodellane kjenner att mønster i språk, og dermed kan dei føra ein velstrukturert samtale. Dei skjønar at det passar med ein positiv respons på «Eg har det bra i dag» og at «Eg har vondt i hovudet» er negativt, og at andre utsegner er nøytrale, seier han.

– Men dei hamnar fort på djupt vatn når dei må argumentera logisk for noko. Fyrst når dei er i stand til det, får vi det som vert kalla kunstig generell intelligens, KGI. På engelsk «artificial general intelligence», AGI.

Tolking av lovtekstar

Med såkornmidlar frå Veksthuset for verdiskaping har Truong det siste året arbeidd med å utvikla ein modell som kan hjelpa lærarar å gje gode matematikkoppgåver til elevane i grunnskulen.

– Matematikk er mitt eige fag, men hovudgrunnen er at det er det mest logiske faget samanlikna med til dømes fysikk og kjemi, seier Truong.

– Lukkast vi fyrst i å utvikla modellar som skjønar logikk, kan vi ta med oss det til andre fag. Ikkje berre til andre realfag, men òg til fag som jus, som baserer seg på logisk tolking av lovtekstar.

GPT UiO er ikkje heilt stø på fyrstegradslikningar.

Menneske heng ikkje med

Men det er eit stykke dit. Sjølv ei enkel likning som 2x+1=3 vert for vanskeleg for Universitetet i Oslo sin modell GPT UiO, som likevel klarar å løysa x+1+x=3.

– Vi ser at modellen ikkje har noko logisk forståing, sjølv om den skråsikkert slår fast at slik er det, seier Truong.

Han forklarar at i prinsippet kan alle matematiske bevis reduserast til ei logisk form. Dermed skulle ein KI med forståing for logikk kunna sjekka matematiske spørsmål.

– Problemet er at dersom slike bevis skal skrivast på ei form som ein datamaskin kan lesa, vert dei så lange og innfløkte at vi menneske ikkje heng med. Vi uttrykkjer oss i setningar i staden for, og skjønar det betre, forklarar han.

Mange milliardar løysingar

Han fortel at i ein artikkel i Nature presenterte Google nyleg modellen AlphaGeometry, som – ifylgje Google – presterer godt nok til ei topplassering i den internasjonale matematikkolympiaden, ei tevling for elevar under 20 år frå heile verda.

Han går tilbake til eksempelet med positive, negative og nøytrale utsegner.

– Då må modellen forholda seg til éin variabel med tre moglege verdiar. Men i ei geometrisk oppgåve har du kanskje femti variablar med ti moglege verdiar kvar. Talet på moglege løysingar er mange milliardar, forklarar han.

Kan gje fleire oppgåver

– Å begynna på toppen og rekna seg gjennom moglege løysingar er sjølvsagt håplaust for eit menneske. AlphaGeometry kan identifisera mønster og raskt finna fram til dei mest aktuelle løysingane veldig fort der eit menneske ville trengt mykje lenger tid. Sjølv om AlphaGeometry imponerer, har han enno ikkje noko forståing av logiske argument.

Sjølv om det opphavlege prosjektet hans er ferdig, er han open for å arbeida vidare med å bruka modellar til å skriva betre matematikkoppgåver for norske skular, om det dukkar opp nokon som er interesserte i å samarbeida..

– Ein modell vil dessutan ha tid til å gje mange fleire oppgåver enn ein lærar i løpet av ein time. Elevane kan òg få støtte til læringa si som kanskje ikkje alle kan få frå foreldra sine.

Referanse: 

Trung Tuyen Truong: Forskningsprosjekt som ble avsluttet desember 2023: Harnessing AI to assist human experts in creating mathematical questions in elementary schools. Nettside på Universitetet i Oslo om prosjektet.

Powered by Labrador CMS