Machine Learning Maskinlæring, det vil si teknikker som gjør at datamaskinen lærer på egen hånd
Anaphora Resolution Anaforløsning, det vil si identifisering av hvilke ord som refererer til det samme, jevnfør ”han” og ”Ibsen”
Named Entity Recognition Programvare som skiller mellom forskjellige typer egenavn, jevnfør firmaet eller personen ”Ericsson”
Animacy Detection Programvare som skiller mellom om noe refererer til et menneske/dyr eller en ting, jevnfør ”lærer” og ”flyplass”
PP Attachement Disambiguation Programvare som finner ut hva preposisjonsfraser sier noe om, jevnfør ”med hendene” og ”med pepperoni”
- Det finnes faktisk teknikker som gjør at datamaskiner kan tenke selv, og ikke bare gjøre det vi ber dem om å gjøre.
Det er maskinlæring han snakker om, Anders Nøklestad, som i sin ferske doktoravhandling har utviklet programvare som gjør at en datamaskin kan lære språklige regler av seg selv.
Lærer av eksempler
- Vi mennesker har mye ubevisst kunnskap som gjør at vi forstår språk, uten at vi nødvendigvis klarer å formulere regler for hvordan dette skjer. Da blir det vanskelig å programmere disse reglene inn i datamaskiner, sier Nøklestad.
Forrige uke gjennomførte han sin doktorgrad ved Institutt for lingvistiske og nordiske studier ved Universitetet i Oslo.
Barn lærer språk gjennom eksempler, ikke ved å pugge regler. Hjernens evne til å lære er universell, og metoden er den samme om vi lærer norsk, japansk eller tysk.
Nøklestad forklarer at datamaskiner kan lære på samme måte, slik at de selv finner ut hva som er reglene. Maskinlæring er navnet på denne teknikken.
- For eksempel gir uttrykket ”Han er født i 1828” liten mening hvis vi ikke vet hvem det er snakk om. Men hvis vi like før har snakket om Ibsen, da forstår vi hvem som ble født det året.
- På fagspråket sier vi at ”han” er en anafor, det vil si et ord som viser til et tidligere ord. Målet for min avhandling er blant annet å lage regler som gjør at en datamaskin kan forstå hvem ”han” er, forklarer Nøklestad.
Han er den første som har utviklet et såkalt anaforløsningssystem for norsk språk ved bruk av maskinlæring.
Menneske eller ei
For å komme frem til den tilsynelatende enkle forbindelsen mellom ”han” og ”Ibsen”, kreves stor og sammensatt kunnskap.
Blant annet må datamaskinen finne ut at ”han” viser til et menneske, ikke en ting, at Ibsen er en person, og ikke et sted eller et firmanavn.
Basert på internasjonalt utviklete teknikker og programvare, har Nøklestad laget programvarebiten som manglet for å få dette til.
Nøklestad har også utviklet programmer som lærer seg å skille mellom mobilselskapet Ericsson og en person med samme navn, samt å forstå forskjellen på setningene ”de spiser pizza med hendene” og ”de spiser pizza med pepperoni”.
Tenke sjæl
Kunnskapen som datamaskinen får ved hjelp av Nøklestads teknologi, gjør at søk og automatiske oversettelser blir enklere og mer presise.
Annonse
- Ser vi konturene av datamaskiner som kan tenke selv?
- I veldig beskjeden grad, ja. Men de er langt unna menneskelig tankekraft. Hjernen er mange ganger kraftigere enn den mest avanserte datamaskin.
- Dessuten vet vi for lite om menneskelig tankekraft til å vite om det i det hele tatt er mulig gjenskape dette i en maskin, sier Nøklestad, som med sin doktoravhandling har brakt oss et steg nærmere den selvlærende datamaskin.