Kronikk: Personlighetstesting er mer pålitelig enn jobbintervju
Det er på tide å sette personlighetstesting inn i faglig sammenheng, skriver Rolf Marvin Bøe Lindgren i denne kronikken.
Rolf MarvinBøe Lindgrenpsykolog
Publisert
Denne artikkelen er over ti år gammel og kan inneholde utdatert informasjon.
Det finnes mange misoppfatninger og feil i medienes omtale av personlighetstesting. Også her på forskning.no i artikkelen Personlighetstester viser ikke hvem du er. Det er derfor på sin plass å rette opp noen fakta og sette personlighetstesting i en god faglig sammenheng.
Måler personlighet
Personlighetstester måler en person i en bestemt situasjon.
Noen ganger er er målet å studere menneskers personlighet, andre ganger er målet å forutse hvordan mennesker kommer til å oppføre seg i framtida. Det første baserer seg på teori, det andre på empiri gjennom målinger.
De fleste tester er basert på begge deler. Da legger man en teorietisk modell til grunn, men gjør også målinger fordi man skal forutse ting som modellen ikke tar høyde for. Å lage en god personlighetstest i næringslivet er svært dyrt fordi man må teste ut om spørsmålene faktisk forutsier det de skal forutsi.
Personlighetstester måler mønstre av atferd. De forutsier ikke enkeltstående tilfeller av atferd. At mennesker unntaksvis er i situasjoner som ikke ligner testsituasjonen er ikke noe argument mot testing.
Personlighetstester versus intervjuer
Det som burde uroe mennesker som vurderer å bruke tester i ansettelser er ikke bare at personlighetstester er upålitelige. Det burde uroe dem mer at de vanlige metodene, som intervju, referansesjekk og cv-sjekk, er enda mer upålitelige.
Vi vet faktisk svært mye om hvor upålitelige både intervjuer og personlighetstester er: I hvilken grad de er upålitelige, hvordan, på hvilken måte, i hvilke sammenhenger og så videre. Norsk forskning på dette området er nok for de spesielt interesserte. I utlandet er forskningstradisjonene omfattende, og de har holdt på i over hundre år.
Såkalte strukturerte intervjuer virker i noen sammenhenger bedre enn personlighetstester. Men strukturerte intervjuer forutsetter at man på forhånd gjør en jobbanalyse, slik at man har målinger og tall på hvorfor man spør som man gjør. Det er altså ikke noen veldig stor forskjell på et strukturert intervju og en personlighetstest. De fungerer best på stillinger med enkle stillingsbeskrivelser, altså manuelt arbeid.
Andre alternativer til å bruke personlighetstester er å se på tidligere atferd. Det er ingenting som forutsier hva man har tenkt å gjøre så godt som hva man alt har gjort. Problemet er at dette forutsier at omgivelsene er de samme. Når folk bytter jobb er det jo ofte fordi de vil gjøre noe annet enn det de har gjort før.
Det er vanskelig å bruke hva kandidaten har gjort tidligere til å forutsi hvordan vedkommende vil oppføre seg i en annen stilling, med andre oppgaver og andre kolleger.
De fem store
Siden 1980 har det vært generell enighet blant forskere om at personlighet kan beskrives med utgangspunkt i fem generelle personlighetstrekk. Når personlighetstester til bruk innen klinisk psykologi eller i arbeidslivet, er det vanlig at den teoretiske modellen som ligger bak på en eller annen måte forholder seg til disse fem trekkene.
De kalles ganske enkelt De fem store (DFS).
DFS er ikke arbeidet til én eller en håndfull forskere. Det er neppe feil å si at omtrent hele den personlighetspsykologiske forskningen som foregår for tida, forholder seg til DFS på en eller annen måte. Mange forskere har sin egen variant. De fem store personlighetstrekkene som til sammen utgjør DFS heter i én populær norsk variant:
Styrke (Extraversion, Surgency): Tendens til å oppsøke fart, spenning og oppmerksomhet
Varme (Agreeableness): Tendens til å oppsøke eller unngå følelser
Kontroll (Conscientiousness): Tendens til å være ryddig, punktlig, pertentlig
Følelser (Emotional stability, Neuroticism): Tendens til å være påpasselig, urolig og bekymret
Kultur (Openness to Experience): Tendens til å oppsøke eller være åpen for nye opplevelser, verdier eller følelser
Motvilje mot intelligenstesting
Annonse
Den store utfordringa innen ansettelser er likevel den store motviljen mot å bruke intelligenstester. Personlighetstestene vil, med unntak av Kontroll, i langt større grad forutsi hva kandidaten trives med å arbeide med enn hvor flink vedkommende kommer til å være. Måling av intelligens øker derfor verdien av personlighetstesting dramatisk.
Skribenten Knut Ulsrud leverer i forskning.no en interessant bredside mot noe han later til ikke helt å vite hva er. Teksten inneholder så mange feil og misforståelser at det er vanskelig å si hvor man skal begynne. Det virker på meg som om Ulsrud baserer sin argumentasjon på en svært overfladisk litteraturgjennomgåelse uten å skjele til hva som faktisk foregår der ute.
Hvordan personlighetstesting skal foregå i arbeidslivet
Ulsrud skriver om en personlighetstest som han mener er svært utbredt og som heter FFA. Denne testen finnes ikke. Han mener muligens NEO-PI, som utvilsomt er verdens mest anerkjente test av femfaktormodellen, men den er ikke veldig utbredt i næringslivet.
Noen populære tester i arbeidslivet er DISC, Belbin og MBTI, men femfaktormodellen er kjent først og fremst ved lekkasjer fra universitetene.
Men til rekruttering skal man verken bruke DISC, MBTI, Belbin eller NEO-PI. De er ikke er utviklet med tanke på rekruttering. Personlighetstester som skal brukes i rekruttering må ha utgangspunkt i teori og forskning om hva som faktisk skjer i arbeidslivet. Vanligvis er de ikke basert på DFS i det hele tatt, men basert på studier av mennesker i situasjoner i arbeidslivet. Én anerkjent indikasjon på om en test er god, er om de trekkene testen måler, kan beskrives ut fra DFS. En test kan for eksempel ha et mål på konfliktskyhet, og man kan da typisk finne at konfliktsky mennesker skårer lavt på Følelser og høyt på Varme.
Kritikk mot typeteorier, ikke trekkteorier
I sin artikkel på forskning.no skriver Knut Ulsrud at «for å bygge på kritikken fra Jack Block, kan man nesten si at man snublet over et rammeverk som på tvers av kulturer klarer å skille ulike personlighetstyper fra hverandre. Problemet oppstår når man skal forsøke å forutse menneskers adferd på bakgrunn av personlighetstrekkene.»
DFS dreier seg om trekk, ikke typer. Det kan virke som om Ulsrud blander dette. Typeteorier har slått bredt an i markedet fordi typer er noe mennesker intuitivt forstår. Så mye av den kritikken Ulsrud siterer, ville nok passet atskillig bedre på typeteorier enn på trekkteorier.
Mønstre av atferd
Ulsrud skriver også at «Modellen beskriver generelle typer, men det vil alltid være avvik. For eksempel samsvarer faktoren kontroll med lav fraværsstatistikk. Men dette kan ikke brukes til å forutse om en person kommer tidsnok til møter.»
Jo, det kan man faktisk. Det vil si, man kan måle sannsynligheten for det. Også de som skårer høyt på Kontroll kommer for seint til møter, men ikke så ofte som de som skårer lavt. Og det er slike mønstre av atferd det har vist seg å være nyttige og interessante å måle.
Annonse
Den totale mangelen på forståelse avslører Ulsrud når han skriver at «Rent praktisk er det problematisk at testen har et for ensidig fokus på de positive sider ved ulike personlighetstrekkene. For eksempel anses kontroll for å være det beste trekket å ha, mens lav følelsesmessig stabilitet anses som negativt.»
Resultatet av en personlighetstest sier noe om personen. Den sier i utgangspunktet ingenting om hvor godt en person passer til en gitt jobb.
Man begynner med å definere en jobbprofil. Den forteller hvordan man bør være for å yte best i akkurat den aktuelle stillingen. I idealtilfellet vil jobbanalysen ende opp i en formel som man kan legge resultatet av personlighetstesten i, hvor resultatet er en skår for hvor godt denne ansatte passer i denne stillingen.
Testen er ikke bedre enn jobbanalysen. At NEO-PI er en svært god test er helt riktig – den gir et veldig godt bilde av den som testes. Men hvis man ikke har en god jobbanalyse, blir NEO-PI ubrukelig i rekruttering. Jeg tviler på, for å si det sånn, at det finnes noe verktøy på norsk som kan fortelle hva en god NEO-PI-skår skal være for en gitt stilling – særlig i og med at NEO-PI ikke er utviklet for å brukes i arbeidslivet.
Ulsruds artikkel er fullstendig skivebom: Testen FFA finnes ikke, Big Five har ikke noen utbredt bruk i næringslivet, ingen personlighetstest sier i seg selv noe om hvem som passer i en gitt stilling, og det er lagt mye arbeid i å sette DFS i en teoretisk sammenheng.
Veien videre
DFS er et så spennende forskningsfelt fordi det har gitt svar på veldig mange spørsmål som har vært stilt de siste årene.
Personlighetstester som brukes i arbeidslivet vil i større grad bygges rundt DFS uten at det nødvendigvis er lett å se. Det er ganske riktig ei utfordring at DFS dreier seg om trekk som er forholdsvis stabile. Så et steg i forskning vil være å finne en måte å beskrive og måle aspekter ved personlighet som ikke er stabile.
Det antas for eksempel at når IQ kan forutsie evner til ledelse bedre enn personlighet, er det fordi intelligens nettopp har sammenheng med evne til fleksibilitet, mens DFS dreier seg om de stabile aspektene ved personlighet.
Historien bak personlighetstestene
Hva er faktisk opprinnelsen til De fem store?
I begynnelsen gjør Ulsrud The Big Five De fem store til en britisk modell, men den leksikalske tradisjonen og alle de andre kildene til DFS stammer fra USA (med noen betydelige nederlandske bidrag). DFS ble heller ikke til på sekstitallet, men ca. 1980. Og de er et resultat av mange sammenfallende ting, blant annet enkeltartikler så langt tilbake som tidlig seksti-tall.
Annonse
Fra slutten av seksti-tallet og fram til 1980 ble personlighetstesting sett på som uvitenskapelig. Det ble antatt at personlighet var så avhengig av situasjonen at det var meningsløst å snakke om stabile, målbare personlighetstrekk. Mennesker oppfatter hverandre som stabile og med kjernepersonlighet, men dette ble antatt å skyldes et menneskelig behov for å gjøre verden mer forutsigbar enn den egentlig er. Hvor rart det enn kan høres i våre dager, var det gode vitenskapelige argumenter for hvorfra det var slik.
Grunnen til at DFS slo an i arbeidslivet er en meta-analyse (altså en analyse av de samlede vitenskapelige artikler med høy kvalitet innen feltet) fra 1991 hvor det ble vist at det er en sammenheng mellom hvor man er på faktoren Kontroll og hvor flink man er til å levere i arbeidslivet.
To ulike retninger
DFS er hovedsakelig basert på to separate forskningsretninger. Den ene, den leksikalske, tar utgangspunkt i en hypotese om at de viktigste menneskelige trekk er speilet i dagligspråk. Her prøver man, kort fortalt, å finne paralleller mellom personbeskrivende adjektiver og atferd: Hvis en person ofte kalles snill, kalles hun også ofte omtenksom, men sjelden slu.
Den andre forskningsretningen, baserer seg på empiriske studier og på analyser av tester som har vist seg å være brukbare. Det er faktisk svært lite psykologisk teori som har så mange og så varierte kilder som DFS.
Ulsrud nevner Block som en anerkjent psykolog som og en sentral kritiker av DFS. Det finnes mange «anerkjente» psykologer, og mange sentrale kritikere av DFS. Det er ikke så rart, i og med at det foregår så mye aktiv forskning rundt den. Men den artikkelen av Block som Ulsrud åpenbart baserer seg på presenterer ikke noe egentlig nytt i sin kritikk av DFS: Artikkelen er en grei oppsummering av hva det forskes på for tida, for eksempel å sette DFS i evolusjonsperspektiv eller andre teoretiske sammenhenger. Det er for eksempel velkjent at ekstraversjon og varme henger sammen med nevrologisk aktivitet i hjernen, og at kultur henger sammen med intelligens, som er svært godt forstått.
Femfaktormodellen
Den mest kjente teoretiske modellen som tar utgangpsunkt i DFS heter Femfaktormodellen. Mens DFS bare er en beskrivelse av personlighetstrekk, er FFM en hel teori om menneskers utvikling av personlighet gjennom livsløpet.
Block er selv ikke egentlig nøytral. Han har sin egen alternative personlighetsmodell, som han kaller Q-Sort. Men også den er vist å ha paralleller til DFS.
Ulsruds påstand om at det er mer synsing enn forskning som ligger bak må være basert på uvitenhet.