
Fisker du i tallene?
PODCAST: – En enkel definisjon av de statistiske begrepene som alle kan forstå på første forsøk? Det tror jeg ikke finnes, sier psykolog Jan-Ole Hesselberg.
Å teste hypoteser ved hjelp av tall er en del av den vitenskapelige grunnmuren. Men hva skjer om vi snur det hele på hodet? At heller enn å samle inn tall for å teste en hypotese, så starter vi med tallene og leter rundt i dem og ser hva vi finner? Vel, da kan det hele gå skikkelig, skikkelig galt.
I denne episoden av statistikk-podkasten Nakne Tall snakker statistiker Jo Røislien med psykolog Jan-Ole Hesselberg om farene ved å lete rundt i et tallmateriale etter signifikante resultater.
Tema for den sjette episoden av Nakne Tall er p-verdier: Statistikkens kanskje mest brukte – og misbrukte – tall. Tallet som forteller om det er sannsynlig at tallmaterialet vi har samlet inn støtter hypotesen vi hadde om verden eller ikke.
– P-verdier er det tallet forskere baserer flest av konklusjonene sine på – samtidig som det er det tallet de strever mest med å forstå, sier statistiker Kathrine Frey Frøslie i podkastens faste ekspertpanel.
P-verdiene som kommer ut av de statistiske analysene er uløselig knyttet til hypotesetesting, der vi starter med en hypotese, samler inn tall som bevismateriale og så regner på disse med en statistisk test.
Ofte kan det være fristende å gjøre det motsatte, nemlig starte med tallene og lete rundt etter statistiske sammenhenger. Men da bryter man egentlig med hele premisset for den statistiske testingen. Og resultatene blir tilsvarende langt mindre troverdige.
– Det er lov å lete rundt i tallene, sier Hesselberg.
– Man må ikke alltid ha en hypotese om hva det er man leter etter. Men da må man også fortelle at det er det man har gjort. Man kan ikke gå på fisketur i tallene og så, når man skal formidle resultatene til andre, late som om man startet med en hypotese som man så har fått bekreftet.