Kronikk: Nasjonale prøver - et uetisk eksperiment?

Det er etisk problematisk at uferdige tester med usikker kvalitet gjøres obligatorisk for elevene, skriver professor Elling Ulvestad i denne kronikken om nasjonale prøver.

Publisert

Denne artikkelen er over ti år gammel og kan inneholde utdatert informasjon.

Som far til to barn som er utpekt til å delta i de nasjonale prøver, har jeg latt meg engasjere av mediedebatten rundt prøvene.

Det mest slående trekket ved ordvekslingene er at debattantene, som er enige om at skolen ikke makter å bibringe elevene nok kunnskaper, har så ulik oppfatning av hvordan elevenes manglende kunnskaper skal dokumenteres og forbedres.

Et annet trekk ved debatten er at mens Elevorganisasjonen og til dels foreldre og lærere er kritiske til prøvene, er regjering, Storting og de politiske partier for de nasjonale prøver. De sistnevnte ønsker å avdekke kunnskapsmangel og skolens eventuelle pedagogiske problem gjennom en test, og på bakgrunn av testresultatet sette i verk nødvendige korrigerende tiltak slik at kunnskap igjen kan bygge landet.

De fleste er vel fortrolige med at kunnskap kan måles ved prøver, og at dette gjøres på en forstandig måte ved de fleste skoler. De nasjonale prøver går utenpå ordinære prøver ved at de i tillegg til kunnskap skal måle den enkelte elevs grunnleggende ferdigheter, samt at resultatet skal ende opp som en elevprofil som skal følge eleven videre i utdanningsløpet.

Formålet med denne kartleggingen hevdes å være at den enkelte elev skal få den hjelp og støtte han har behov for. Motivet bak de nasjonale prøver er tilsynelatende edelt, og et samlet Storting har derfor stilt seg bak vedtaket om å gjøre dem obligatoriske.

Påbudet om testing har gitt opphav til en vidtfavnende og spennende debatt. Debatten angår vår framtid som kunnskapsnasjon, men dreier seg også om makt og overgrep, og om hvorvidt den enkeltes interesser skal overstyres av gruppen.

Debatten berører også etiske aspekter ved samhandling. I stedet for å gå i dialog med elevene har for eksempel Stortingets politikere sagt seg villige til å sette makt bak sitt vedtak, ved å ta til orde for å straffe elever som ikke møter fram til prøve. Dette er en holdning som er både politisk og pedagogisk tvilsom.

Et neglisjert moment

Debatten om hvorvidt man skal boikotte de nasjonale prøver eller ikke har vært heftig og steil. Den har også vært klargjørende på en rekke punkter. Men ett vesentlig moment, som vedrører prøvenes kvalitet, har merkelig nok vært lite fremme.

Jeg tror at mye ville vært vunnet dersom Storting og regjering hadde tatt seg tid til diskutere hvorvidt tester med tilfredsstillende målekvalitet fantes tilgjengelig. Kanskje ville den etterfølgende debatt da ikke ha vært nødvendig. I hvert fall ville den tatt en helt annen form, siden det da ville blitt klargjort at den typen tester Stortinget etterspurte ikke er å finne.

Veiledende og villedende tester

Mange fenomener, særlig på den sosiale arena, kan vanskelig diagnostiseres med enkle tester. Det kreves derfor et grundig forarbeid av dem som skal lage gode tester, og et tilsvarende stort etterarbeid for å definere hva de måler.

En forutsetning for at tester skal fungere er at de måler det de skal, at de anvendes riktig og at de benyttes på de problemstillinger de er utviklet for. Dersom disse forutsetningene ikke oppfylles, vil testene gi misvisende resultater; de vil ikke måle det de er satt til å måle, og korrigerende tiltak basert på testresultatene kan i verste fall gjøre tilstanden verre.

Tilsvarende tankegang finner vi i medisinen. Dersom en lege måler forhøyde verdier på en prøve for leddgikt betyr ikke dette at han skal behandle pasienten for leddgikt. Det er mange andre faktorer som kan gi forhøyede verdier på prøven, og legen undersøker derfor om det er andre forhold ved pasienten som taler for at hun har leddgikt. Først etter en grundig gjennomgang av andre forhold vil behandling settes i verk. Det å behandle på grunnlag av en enkelt test kan være farlig på grunn av bivirkningene behandlingen gir.

Mange av oss har en for stor tiltro til tester og til autoriteter som forteller oss hva testene måler. Vi aksepterer at en IQ-test måler noe som er tilnærmet likt intelligens, og at tester utført av arbeidsgivere måler noe som er relatert til kvalifikasjoner du trenger til jobben du søker på.

Men vi vet også at forhold rundt testingen avgjør om testen måler det den skal. For eksempel vil antall tester en har tatt påvirke senere testresultater, ofte i en positiv retning for den som testes. Dette viser at tester som måler egenskaper ved mennesker ikke nødvendigvis er like tids- og stedsuavhengige som termometre og barometre som tester fysiske egenskaper. Tester som skal måle menneskelige ferdigheter må derfor vurderes særlig kritisk.

En forsker som konstruerer en test, men som ikke dokumenterer testens egenskaper, vil aldri få testen anerkjent. Og det å foreskrive behandling på basis av tester som ikke er evaluert med en akseptert metode, helst av uavhengige eksperter, er å betrakte som en uetisk handling. Tester som brukes i medisin, psykologi, sosiologi og naturvitenskap er derfor nøye utprøvd for å dokumentere at de virkelig måler det de skal måle.

Informasjon om testenes egenskaper kan enhver finne i vitenskapelig litteratur, og forskere og andre interesserte kan derved ta stilling til om testene er anvendelige til det formålet de er sagt å være anvendelige til. Det er ikke uvanlig at man ved en slik uavhengig granskning finner at annonserte tester er langt dårligere enn det produsenten angir. Så selv om det er “de beste fagmiljøene på området her i landet” som har fått i oppgave å utvikle de nasjonale prøvene, borger ikke dette for kvaliteten så lenge den ikke er dokumentert.

Dersom testene er mangelfulle kan resultatet av testingen være at vi feildiagnostiserer skolens pedagogiske utfordringer, og at korrigerende tiltak settes inn på feil områder. Da vil norsk skole være virkelig ille ute.

En urovekkende undersøkelse

Når det gjelder de nasjonale testene var jeg lenge ute av stand til å finne uavhengig informasjon om i hvilken grad de er i stand til å måle det de skal. Verken i informasjonsmateriellet som ble sendt hjem med elevene eller på Utdanningsdirektoratets nettsider fantes slik informasjon.

Men endelig, i slutten av februar 2005, fant jeg ved et søk på Internett en rapport utarbeidet av Svein Lie og medarbeidere. Rapporten, som ble publisert den 15. februar 2005 på Skoleportalen, ligger godt skjult og det var derfor relativt tilfeldig at jeg fikk den fram.

I rapporten, som var rekvirert fra Utdanningsdirektoratet (den gang Læringssenteret), ble kvaliteten på de nasjonale prøver fra våren 2004 evaluert. Flere kritiske merknader til prøvene kom fram, og det ble derfor frarådet å publisere resultatene av prøvene som planlagt. Dette blant annet fordi forskjellene som kom fram ikke nødvendigvis representerte reelle forskjeller, men kunne skyldes tilfeldigheter basert på prøvenes utforming og lærernes vurdering av prøvesvaret.

Det er påtagelig at en slik kritisk rapport ikke refereres til av Utdanningsdirektoratet, som jo satte den i bestilling, og at Kristin Clemet i sitt innlegg om de nasjonale prøver i Dagsavisen 26. februar 2005 heller ikke nevner rapportens konklusjon med ett ord.

Lie og medarbeidere anbefalte, på basis av sin gjennomgang, en “kraftig kompetanseheving på det testteoretiske feltet.” Videre konkluderte de med at “Vi mener det er avgjørende for de nasjonale prøvenes funksjon og omdømme at prøvene PÅ FORHÅND er påvist å tilfredsstille grunnleggende krav. I dette ligger det blant annet at det ikke legges opp til å rapportere fagkompetanse i form av “profiler” uten at hver delkompetanse på forhånd kan påvises å ha god validitet og reliabilitet.” “Dersom man virkelig mener å skulle måle utvikling i elevenes kompetanse over tid, både på individnivå og på nasjonalt nivå, er det nødvendig å gjøre en egen grundig planlegging av hvordan man skal få til dette”.

Gruppene som stod bak de nasjonale prøver fikk i løpet av høsten 2004 anledning til å kommentere evalueringen utført av Lie og medarbeidere. Det framkom en del innvendinger mot tekniske detaljer i evalueringen, men gruppene var enige med Lie og medarbeidere at det var avsatt for lite ressurser og tid til å evaluere prøvene i forkant. Konklusjonen ble derfor at de nasjonale prøvene er under utvikling, og at de ennå ikke er gode nok til at vi kan stole på resultatene.

Et uetisk eksperiment

Men denne konklusjonen betyr også at våre barn ikke er deltagere i en nasjonal test, men at de faktisk deltar i et gigantisk nasjonalt eksperiment. Eller som uttalt av Lie og medarbeidere: “Som forskningsprosjekt er dette uhyre interessant”.

Konsekvensene av dette forskningsprosjektet er det ingen som kjenner. Gad vite om Utdanningsdirektoratet ville fått prosjektet gjennomført dersom direktoratet var nødt til å søke prosjektet godkjent av en forskningsetisk komité.

Som forsker er jeg bekymret for hvordan et slikt eksperiment i det hele tatt kan settes i verk uten at det er etisk klarert og offentlig debattert. I all eksperimentering med mennesker skal forsøkspersonene ha avgitt informert samtykke. Jeg har ikke fått en slik forespørsel, og antar derfor at det ikke er bedt om slikt samtykke fra andre. Eller kan det være slik at Stortinget har gitt generelt samtykke på vegne av alle foreldre? I så tilfelle har de tiltatt seg en rettighet som ikke harmonerer med de verdier som det samme Storting ønsker å forfekte innen helsesektoren.

I helsevesenet forlot man en tilsvarende formyndersk holding overfor brukerne for lang tid tilbake. Pasienter har, i motsetning til skoleelever, rett til å reservere seg mot å bli testet. Dette i erkjennelse av at det er pasienten som best ivaretar sine egne interesser. Selv om en lege mener at det er til pasientens beste at denne testes for en bestemt sykdom, kan ikke dette gjøres uten at pasienten samtykker.

Et sentralt spørsmål blir derfor om foreldre er villige til å akseptere at offentlige instanser skal kunne eksperimentere med og endatil lage profiler av deres barn uten at de blir forespurt. Er dette mulig i et demokrati? Kan en statsråd eller et departement overprøve etiske retningslinjer som de selv har behandlet og ratifisert, og som alle forskere og terapeuter må forholde seg til? I så fall har vi i Norge en for tett integrasjon mellom den lovgivende og den utøvende makt. Det paradoksale her er jo at det er Stortingets politikere som legger opp til hvilke etiske retningslinjer forskere må følge - de bør derfor føle seg forpliktet av disse retningslinjene også i egen praksis.

Avslutning

Dersom de nasjonale prøver hadde blitt skikkelig evaluert av fagmiljøene som utformet dem ville de neppe blitt tatt i bruk i norsk skole. Dette betyr ikke at de som har laget prøvene har gjort en dårlig jobb; de har forsøkt å optimalisere testene i forhold til de ressurser de hadde til rådighet.

De som bør kritiseres er Storting og regjering, som har presset fram bruk av uegnet måleredskap, og Utdanningsdirektoratet som har hatt overordnet styring med utvikling og gjennomføring av testene.

Framgangsmåten man har valgt ved innføring av testene er etisk tvilsom, og det er også etisk problematisk at uferdige tester med usikker kvalitet gjøres obligatorisk for elevene, særlig siden testresultatene får konsekvenser for dem som testes.

Jeg tror at dette stuntet hemmer mer enn fremmer norsk skole, og at ettertiden derfor vil vurdere prosjektet som mislykket og forfeilet.

Les mer…

“Rapporten Nasjonale prøve på prøve av Lie S, Caspersen M og Björnsson JK”:http://www.skoleporten.no/templates/Page.aspx?id=17324&parentid=2011. Der finnes også faggruppenes svar på rapporten.

Kristin Clemets innlegg i Dagsavisen den 26. februar 2005

Powered by Labrador CMS