
– I maskinlæring har alle overtenning og dårlig tid
PODCAST: – Statistikkens framgangsmåte er nobel, men det er ikke alltid den er gjennomførbar i praksis, sier KI-ekspert Inga Strümke.
Statistisk analyse av tall har en helt sentral plass i samfunnet. Og jo flere tall vi har fått tilgang til, jo viktigere har statistisk analyse blitt. Men hva gjør vi når vi har så mye tall at statistikkens gullstandarder og gjennomtestede framgangsmåter blir så tidkrevende at vi ikke rekker å komme i mål før sola har sloknet?
I denne episoden av statistikk-podkasten Nakne Tall snakker statistiker Jo Røislien med informatiker og KI-ekspert Inga Strümke om høytsvevende korrelasjoner og mangedimensjonale rom – og om problemer som kan løses med matematikk og maskiner, men som hjernen sliter med å forstå.
Tema for denne episoden er altså statistikkens søskenbarn maskinlæring.
Både statistikk og maskinlæring bruker statistiske metoder for å analysere tall på systematisk vis. Er det to sider av samme sak eller to forskjellige ting?
– Tradisjonelt har statistikk hatt mer fokus på det å forstå og det å tallfeste usikkerhet, mens maskinlæring gjerne har hatt mer fokus på det å spå, sier Kathrine Frey Frøslie i podcastens faste ekspertpanel.
I tradisjonell statistisk analyse bruker vi tall til å lage hypoteser, for deretter å teste disse hypotesene på nye tall. Det er en tidkrevende prosess, og noe man ikke alltid tar seg tid til i maskinlæring der man slipper datamaskinen løs på tallene på jakt etter ulike typer korrelasjoner.
– I maskinlæring har alle overtenning og dårlig tid, sier Strümke.