Stort sprik i sensorenes karakterer
200.000 eksamensvurderinger analysert: I nesten 15.000 tilfeller er spriket mellom sensorene to karakterer eller mer. – Sjokkerende. Her er det mange elever som får feil karakter, sier professor.
Se for deg at du går siste året på videregående og får karakteren 4 på eksamen i norsk hovedmål. Det du ikke vet, er at sensorene var uenige da de vurderte besvarelsen din. Mens den ene mente du burde få 3, innstilte den andre på karakteren 5.
Denne våren var det ikke ett, men 1602 slike eksempler i norsk hovedmål på vg3. Det viser Aftenpostens gjennomgang av 211.371 eksamensvurderinger i 26 ulike fag fra våren 2018.
Gjennomgangen viser at:
De to sensorene var helt enig i vurderingen av 113.607 besvarelser, 53,8 prosent. I 39,3 prosent av tilfellene skilte én karakter.
Spriket var på to karakterer eller mer i 6,9 prosent, det vil si 14.654 besvarelser. Det er svaert store variasjoner mellom fagene.
I faget politikk og menneskerettigheter var sensorene uenige i vurderingen av 16,2 prosent av besvarelsene. Tilsvarende tall for matematikk på 10. trinn er 0,2 prosent.
Møtes nesten alltid på midten
I de 14.654 tilfellene der spriket var på to karakterer eller mer, endte sensorene med å gi eleven en karakter midt imellom i nesten ni av ti tilfeller.
Eksempel 1: Sensor 1 mener eleven skal få karakter 6 i internasjonal engelsk. Sensor 2 mener eleven skal få karakter 2. Endelig karakter blir 4.
Eksempel 2: Sensor 1 mener eleven skal få karakter 5 i sosialkunnskap. Sensor 2 mener eleven skal få karakter 1. Endelig karakter blir 3.
Det finnes 1902 tilfeller der den ene sensoren ikke har rikket seg. I alle disse tilfellene måtte den andre sensoren gå med på å gi en karakter som var minst 2 karakterer høyere eller lavere enn sensoren først forslo.
Hevet fra 4 til 6
Emil Røys Reite (19) er til vanlig nestleder i Elevorganisasjonen og gikk ut fra Fagerlia videregående skole i Ålesund før sommeren.
Han opplevde selv å få eksamenskarakteren sin i norsk hovedmål hevet med to karakterer etter å ha klaget.
Da han var ferdig med eksamen, følte han at det hadde gått strålende og håpet på toppkarakter. Skuffelsen var stor da han fikk karakteren 4.
– Vi var samlet en gjeng i biblioteket på skolen da noen fikk nyss om at karakterene var ute. Det var en litt sjokkartet stemning, og det var flere som fikk utbrudd som «Hae, hva skjer nå?» sier han.
Han klaget umiddelbart og lovpriser skolen for å ha lagt godt til rette for å kunne bruke klageretten.
For ham kunne karakteren blitt utslagsgivende.
– På det tidspunktet ville jeg inn på studier som psykologi og sivilingeniør. Hadde fireren stått, hadde nok ingen av dem gått. Nå ble det Elevorganisasjonen likevel, men det sier noe om hvor viktig det kan vaere, sier Reite.
Mener eksamen ikke fungerer
– Dette er sjokkerende tall. Her er det mange elever som får feil karakter. Eksamen er en gammel tradisjon, som vi tror fungerer. Det gjør den åpenbart ikke, sier Kjell Lars Berge, professor ved Universitetet i Oslo.
Han har skrivevurdering som et av sine kompetanseområder og skrev doktorgrad om sprikvurdering i 1995. Berges tall for norsk hovedmål på Vg3 fra 1995 er naermest identiske med tallene Aftenposten har kommet frem til for 2018.
– Funnene er en klar indikator på at prøven ikke oppfyller de kvalitetskrav som bør stilles til prøver som har så stor betydning for elevenes fremtid, sier Berge.
I sommer skrev Aftenposten om Marie Ulven (19) som strøk i norsk skriftlig, men klaget og fikk toppkarakteren seks.
Det finnes flere eksempler i datasettet på elever som har gjort et betydelig karakterhopp etter å ha klaget:
– Utdatert og urettferdig
– Dette viser det som er vår store bekymring. Eksamen som vurderingsform er utdatert og urettferdig. Det kan vaere tilfeldig hvilken karakter du får, og det er utrolig kjipt for de elevene det gjelder, sier Elevorganisasjonens leder Agathe Waage.
Hun ønsker ikke å rette kritikk mot sensorene, men mener systemet har en svakhet ved at eleven ikke får vist sin fulle kompetanse med dagens eksamensform.
– Vi mener man for eksempel kan prøve ut mappevurdering, hvor elevene leverer inn arbeid i løpet av året, som eksterne vurderer til slutt. Da vil det vaere lettere å vurdere helheten i elevenes kompetanse.
– Bør ikke vaere avvik
Førsteamanuensis Lise Vikan Sandvik ved Institutt for laerer utdanning ved NTNU understreker viktigheten av at vurderingen av eksamen er relevant, gyldig og pålitelig.
– Det er viktig for at vi som samfunn skal ha tillit til resultatet. Vurderingens gyldighet handler om hvorvidt vi kan trekke en slutning om hva slags kompetanse eleven har på bakgrunn av den.
Sandvik er ikke overrasket over funnene, men bemerker at et avvik opp mot 15–16 prosent er «ganske stort». Hun synes det er vanskelig å angi hvor mye avvik man kan akseptere.
– Hvis man skal ha tillit til et system, bør det ideelt sett ikke vaere avvik. Men testingens kontekst vil alltid innebaere en usikkerhet hos dem som vurderer, sier hun.
Hvis man skal ha tillit til et system, bør det ideelt sett ikke vaere avvik Lise Vikan Sandvik, førsteamanuensis, Institutt for laererutdanning ved NTNU