
The Stanford Prison Experiment er en av historiens mest kjente psykologistudier.
Men det har vist seg at resultatene fra både denne og mange andre studier innen psykologien ikke lar seg gjenskape.

Forskningen i dette faget har alvorlige problemer, mener forskere.
Noe er galt i
forskningen på psykologi
Nesten alle studier innen psykologi bekrefter det forskeren trodde. Bør det få alarmene til å ringe?
Enhver forsker drømmer nok om det:
Du har en hypotese – en djerv antagelse om hvordan noe henger sammen – som du tester i en vitenskapelig studie.
Og når resultatene kommer, innfrir de forhåpningene. Det stemmer! Resultatene bekrefter at du hadde rett i dine antagelser.
En vitenskapelig seier.
Eller er det det?
Må bli lei av å vinne!
I 2022 kom psykologiprofessor Gerald Haeffel med en innstendig oppfordring til sine kollegaer verden over:
Nå må vi forskere innen psykologi bli lei av å vinne hver gang!
Haeffel refererte blant annet til en ny undersøkelse som viste at 96 prosent av studiene innen psykologi konkluderte med at hypotesen stemte.
Det er ikke bra.
For når forskere nesten alltid har rett, er det ikke et tegn på at de er geniale. Det er i stedet et urovekkende hint om at noe er galt med studiene.
Bekymringsverdig studie
Undersøkelsen Haeffel viste til, er slett ikke første tegn til problemer innen forskningen på psykologi.
Tidlig på 2010-tallet hadde flere forskere begynt å stille spørsmål ved kvaliteten på mange undersøkelser.
Og i 2015 ble en brannfakkel av en studie publisert i det vitenskapelige tidsskriftet Science.
Forskeren Brian Nosek og en stor gruppe kollegaer hadde satt opp en diger test:
De hadde plukket ut 100 tilfeldige psykologistudier nylig publisert i tre prestisjetunge vitenskapelige tidsskrifter. Så hadde forskerne rett og slett gjort studiene på nytt, for å se om de fikk samme resultat.
Det gjorde de ikke.
Replikasjonskrise
97 prosent av de originale studiene hadde bekreftet forskernes hypoteser. Da nøyaktig de samme undersøkelsene ble gjort igjen, var det bare 37 prosent som bekreftet hypotesen.
Og selv i disse studiene var resultatene ofte langt svakere enn i de originale studiene.
I kjølvannet av denne og andre undersøkelser ble flere store sannheter innen psykologien trukket i tvil.
En betydelig andel av det jeg lærte på grunnfag i psykologi i 2001, har siden vist seg å ikke holde vann.
Joar Øveraas Halvorsen, psykolog og forsker
Problemene på feltet blir ofte omtalt som replikasjonskrisen. Mange har pekt spesielt på problemene innen sosialpsykologien, som forsøker å forklare hvordan vi mennesker påvirker hverandre mentalt. Men også andre områder, som klinisk psykologi, ser ut til å være rammet.

Den kjente statistikeren og vitenskapskritikeren John Ioannidis skrev i 2022 at det meste av dokumentasjonen vi har på psykoterapi, er svært fordreid:
– De fleste former for psykoterapi gjør trolig ingen eller liten nytte, selv når publisert litteratur antyder at de er svært effektive, skrev han i Epidemiology and Psychiatric Sciences.
– Usunne forskningspraksiser
Henrik Berg er utdannet i både psykologi og filosofi og jobber som professor i vitenskapsteori ved Universitetet i Bergen. Han bekrefter at forskningen på psykologi står overfor utfordringer.
Saken er komplisert. Psykologiske mekanismer kan være ekstremt komplekse, og det er utfordrende å sette opp gode studier uten å forenkle fenomenene i hjel.
Men det er ingen tvil om at en del av forskningen på feltet har vært av lav kvalitet, mener Berg.
– De siste ti årene har man avdekket en del ganske usunne forskningspraksiser innen helsefag og psykologi, sier han til forskning.no.
Alle kunne kanskje ikke bli onde likevel
Joar Øveraas Halvorsen er psykologspesialist og førsteamanuensis ved NTNU. Også han mener mange av studiene innen psykologi er for dårlige. Det fører igjen til at mye av kunnskapen på feltet blir usikker.
– Det er veldig få ting vi kan påstå med stor grad av sikkerhet i fagfeltet mitt. En betydelig andel av det jeg lærte på grunnfag i psykologi i 2001, har siden vist seg å ikke holde vann, sier han.

Det var for eksempel lenge kjent at nesten alle mennesker kan bli onde når de bare får sjansen.
Dette ble tydelig vist i de berømte fengselseksperimentene til forskeren Philip Zimbardo og kollegaene hans ved Stanford i 1971.
Flere studenter ble stengt inne i en kjeller og fikk roller som fanger og fangevoktere.

Studentene som skulle være fangevoktere, begynte snart å behandle studentfangene umenneskelig.
Alle så ut til å bli onde, bare de fikk sjansen.
Men senere viste det seg at forskerne hadde gått langt i å instruere vokterne i hvordan de skulle oppføre seg.

– Jeg tenker at vi har vært i – og fremdeles er i – en replikasjonskrise i psykologifaget, sier Halvorsen.
Forskerens egen metode virker alltid best
Jan Ivar Røssberg er professor i psykiatri ved Universitetet i Oslo og overlege i psykiatri ved Oslo universitetssykehus. Han har selv gjort mange studier på psykoterapi og kjenner forskningen på feltet godt.
Også han bekrefter problemene.
– Du skal lete lenge etter studier der ikke det forskeren selv tror på, vinner igjennom. Jeg vet bare om én studie der forskerens egen metode kom ut som minst effektiv, sier Røssberg.
Dette er faktisk så uvanlig at denne ene studien ble kjent i fagkretsene – nettopp fordi den ikke viste at forskerens favorittmetode var best. Denne studien skal vi komme tilbake til.
Men først:
Hvorfor er det slik? Hvorfor finner forskerne til stadighet ut at hypotesene deres stemmer, samtidig som under halvparten av resultatene blir bekreftet hvis den samme studien gjøres på nytt?

Problem i forskningskulturen
La det ikke være tvil: Trøbbel med kvaliteten i forskningen rammer også andre fagfelt. Studier har for eksempel vist tegn på replikasjonskrise både innen kreftforskning og økonomi.
Men Gerald Haeffel mener psykologien har et spesielt problem i forskningskulturen sin.
Han mener psykologien rett og slett har sluttet å bruke vitenskapen til å undersøke årsaker og virkninger.
Hypotesetesting
Det finnes mange måter å samle kunnskap på, for eksempel gjennom dybdeintervjuer med pasienter. Her er Haeffel imidlertid spesielt opptatt av den delen av forskningen som driver med hypotesetesting.
Innen mange fagfelt, som fysikk, biologi og medisin, skjer kunnskapsjakt typisk ved å sette opp hypoteser – altså modeller for hvordan man tror ting henger sammen.
Så gjør forskerne eksperimenter eller andre undersøkelser for å teste om disse modellene faktisk stemmer med virkeligheten.
Hele poenget med disse testene er at de også skal kunne vise at hypotesene ikke stemmer. Slik falsifisering er et kjennetegn ved vitenskapen.
Mener psykologien har sluttet å teste hypoteser
Ut fra resultatene, vil hypotesene finslipes, forandres eller forkastes. Ny kunnskap bygger på tidligere funn, og ulike hypoteser konkurrerer mot hverandre. Etter hvert vil de modellene som best forklarer virkeligheten, vinne fram.
På denne måten er det mulig å bygge stadig mer presise teorier om hvordan fenomener i verden virker. Innen biologien har for eksempel evolusjonsteorien vokst fram.
Men veldig mye av forskningen innen psykologi er ikke slik, skriver Haeffel og fortsetter:
Psykologien har stoppet å bruke denne vitenskapelige metoden slik den skal.
Om å gjøre å publisere flest mulig positive resultater
I mange tilfeller kan ikke ideene innen psykologi falsifiseres. Altså, det er ikke mulig å sette opp tester som kan vise om de er feil.
I stedet er målet ofte å publisere flest mulig studier som viser at forskernes egne hypoteser stemmer, uavhengig av om dette gir større innsikt eller bedre behandling, skriver Haeffel.
En slik kultur oppfordrer til dårlig forskning, mener han.
Dette trenger slett ikke handle om bevisste forsøk på å manipulere resultatene. Men i virkeligheten kan det likevel bli slik.
Rigget for positivt utfall
Dette kan Røssberg fra UiO bekrefte.
– Mange studier er satt opp slik at de må gi positive resultater. En av verdens beste forskere på depresjon har skrevet en veldig god artikkel om dette, sier han.
Røssberg sikter til en dryppende ironisk artikkel av Pim Cuijpers og Ioana Alina Cristea, publisert i Epidemiology and Psychiatric Sciences i 2016.
Forskerne beskriver hvordan man skal legge opp en vitenskapelig studie som vil vise at terapien din virker selv om den egentlig ikke gjør det. I faktaboksen under ser du oppskriften.
Undergraver psykologiens troverdighet
Oppskriften på studier med gode resultater er selvfølgelig satt på spissen.
Men poenget til Cuijpers og Cristea er at mange studier innen psykologi nettopp er designet litt på en slik måte. Punktene representerer ulike dårlige praksiser innen forskningen som til sammen kan gi studier med slående, men lite troverdige resultater.
– Vi vet fra klinisk forskning at studier med lav kvalitet har en tendens til å finne høyere effekt enn dem med god kvalitet, sier Halvorsen fra NTNU.
Han mener dårlig forskning er med på å undergrave troverdigheten til psykologien som vitenskap.
Men her er det også stor uenighet mellom ulike forskere på feltet.
Mange mener at replikasjonskrisen er reell og må tas på alvor. Men det er ikke enighet om hvilke metoder som er gode nok.
Et godt eksempel på dette er diskusjonene rundt bruken av venteliste som kontrollgruppe.
Sammenligning er viktig
Når forskere skal undersøke en type behandling på mennesker, er det viktig å ha noe å sammenligne med. Altså en kontrollgruppe.
En undersøkelse kan for eksempel vise at pasienter som får en viss behandling, blir bedre. Men er det behandlingen som virker?
Pasientene kan også ha blitt bedre av seg selv eller opplevd en generell placeboeffekt.
Det er her kontrollgrupper kommer inn. Ved å sammenligne resultatene i de to gruppene, kan forskerne finne ut om behandlingen i seg selv har en virkning.
Venteliste som kontrollgruppe
I de fleste studier innen psykologien sammenlignes resultatene av behandlingen med pasienter som står på venteliste for den samme behandlingen.
Men slike studier kan ikke vise om deler eller hele effekten bare skyldes placeboeffekten. Dette kan bety at vi får et skjevt bilde av hvor godt behandlingen virker.
Behandlingsformene vi tilbyr, kan i virkeligheten være langt mindre effektive enn studiene tilsier, skriver Beth Patterson fra McMaster University og hennes kollegaer, etter å ha undersøkt saken i 2016.
Dette er noe av grunnen til at forskere er så uenige om hvor godt psykoterapi virker. Noen forskere mener ventelistestudiene skal være med i vurdering av hvor godt terapi virker. Da viser oppsummeringer gjerne at behandlingen har stor effekt.
Andre forskere mener ventelistestudiene må tas ut. Da viser oppsummeringene en mer beskjeden virkning.
(Les mer om utfordringene med ventelistestudier her.)

– Jeg mener ventelistekontroll er å legge lista litt for lavt. Med den kunnskapen vi har i dag, vil jeg anbefale at andre kontrollgrupper brukes, sier Røssberg.
Kan ikke stoppe der
Sverre Urnes Johnson er professor og psykologspesialist ved Universitetet i Oslo og Modum Bad. Han argumentere for bevissthet rundt bruken av ventelister.
– Venteliste som kontrollgruppe har svakheter, men det avgjørende er at man sammenligner med noe, sier Johnson.
Det viktigste er at forskerne er bevisste på hvordan de bruker og tolker slike studier, mener Johnsen.
– Vi kan ikke stoppe der og hevde at vi har funnet løsningen, sier Johnsen.
– Neste skritt er å sette teorien på spill – å sette opp en større studie der vi sammenligner effekten med de best dokumenterte behandlingsformene på feltet. Altså at aktive behandlingsformer sammenlignes mot hverandre.
Må legge sin egen behandlingsform i potten
Men innen psykologien skjer ikke alltid dette.
Å teste sin egen metode mot andre behandlingsformer, kan være følsomt og vanskelig for forskerne, som gjerne har sterk tro på sine egne metoder.
– Terapeuter identifiserer seg ofte i stor grad med metodene sine. Det krever tillit til forskerteamene som er involvert å legge sin behandlingsform i potten, sier Johnsen.
For hva om resultatene blir dårligere enn forventet?
Det var akkurat dette som skjedde med den beryktede artikkelen som ikke bekreftet forskerens hypotese.
Sjokkstudie
Stig Bernt Poulsen og Susanne Lunn ved Københavns Universitet ville teste virkningen av sin egen behandlingsform – psykoanalytisk terapi – på pasienter med bulimi.
Denne gangen sammenlignet de ikke med venteliste. I stedet lot de pasientene i kontrollgruppen få behandling med terapiformen kognitiv terapi. De som analyserte dataene, visste ikke hvem som hadde fått hva.
Og resultatene kom som et sjokk.

Bare 15 prosent av pasientene som fikk psykoanalyse, hadde sluttet med overspising og oppkast etter to år.
I gruppa som fikk kognitiv terapi, hadde 44 prosent sluttet med det.
Og det til tross for at kontrollgruppa bare hadde fått 20 timer kognitiv terapi over fem måneder, mens de andre hadde fått ukentlige timer med psykoanalyse i to år.
Skuffende resultater er gull verdt
Slike resultater kan fortone seg som katastrofale for forskerne som har satt sin teori på spill. Særlig når de ikke får støtte fra sine kollegaer.
Forskere som publiserer negative funn, kan nok fort bli uglesett av andre innen samme terapiform, sier Røssberg fra UiO.
Men for pasientene er denne typen resultater gull verdt. For nå har vi fått mer kunnskap om hva som virker og hva som ikke virker.
– Det er utrolig viktig for faget at også negative resultater blir publisert, selv om det kan være tøft for forskerne som gjør det, sier Røssberg.
Haeffel påpeker at det nettopp er slike resultater som driver vitenskapen framover.

Han mener uviljen mot negative utfall gjør at psykologifaget stagnerer som vitenskap.
– Mer elendig forskning hjelper ingen
Flere forskere oppfordrer til mer bevissthet rundt hva som skjer innen forskningen på psykologi.
Svein Magnussen, professor emeritus i psykologi ved Universitetet i Oslo, mener stikkordet er kvalitet.
– Mitt inntrykk er at det hele tiden ropes på mer forskning. Men ingen stiller spørsmålet: Hva med den forskningen som faktisk blir gjennomført hele tiden – er kvaliteten god nok? Stiller vi de riktige spørsmålene?
– Mer elendig forskning hjelper ingen. Jeg tror vi trenger bedre forskning, sier han.
– Det blir bedre
Røssberg mener likevel det er grunn til optimisme.
– Vi henger litt etter. Men forskningen på psykoterapi er bedre i dag enn for bare ti år siden, sier han.
Selv gjør han og kollegaene nettopp randomiserte, kontrollerte studier for å finne ut mer om hvordan ulike typer psykoterapi virker.
Han mener det er viktig å få fram hvor vanskelig dette er.
– Psykoterapistudier vil aldri kunne bli like strenge og optimale som legemiddelstudier, sier han.
I en studie av et legemiddel kan du gi alle den samme pillen. Men i psykoterapien er behandlingen et samspill mellom behandleren og pasienten. Det kan ikke standardiseres på samme måte.
I Røssberg og kollegaenes studier går forskerne gjennom videoopptak av tusenvis av terapitimer for å se hva terapeutene faktisk gjør.
– Jeg tror mange av dem som uttaler seg om hvordan studier i psykoterapi bør gjøres, ikke har prøvd det selv, sier han.
– Det er utrolig vanskelig å gjøre slike studier. Jeg pleier å si at før jeg gjorde en randomisert kontrollert studie av psykoterapi, var jeg også høy og mørk.
– Etter å ha gjort noen studier, er jeg blitt tjukk og skalla.
———
Denne saken kan du også lese på engelsk på sciencenorway.no
Bilder:
Alle bildene fra det The Stanford Prison Experiment: PrisonExp.org.
Det blå illustrasjonsbildet: Yiucheung/Shutterstock/NTB