• No results found

Hvordan kan vi lage gode eksamener?

N/A
N/A
Protected

Academic year: 2022

Share "Hvordan kan vi lage gode eksamener?"

Copied!
33
0
0

Laster.... (Se fulltekst nå)

Fulltekst

(1)

Hvordan kan vi lage gode eksamener?

Stefan Schauber

Centre for Educational Measurement (CEMO) &

Helsevitenskapelig utdanningssenter

1 / 33

(2)

«Nøyaktighet og presisjon»

(3)

Presisjon

«Presisjon, i vitenskapen betegnelse for i hvilken grad en serie gjentatte målinger av det samme forholdet samler seg rundt samme verdi. Målingen har stor presisjonnår man gang etter gang treffer samme verdi. Det er viktig å merke seg at dette ikke betyr at man treffer den sanne verdien.»

(https://sml.snl.no/presisjon)

3 / 33

(4)

Nøyaktighet

«Nøyaktighet, i hvilken grad en måling eller en serie målinger gir uttrykk for den egentlig sanne verdien av det fenomenet man ønsker å vite noe om.

Målingen har stor nøyaktighet når man er i stand tilå treffe nær den sanne verdien» (https://sml.snl.no/nøyaktighet)

(5)

Presisjon uten nøyaktighet

5 / 33

(6)

Nøyaktig, ikke presis

(7)

Presis og nøyaktig

7 / 33

(8)

Måling av overvekt/fedme, midjemål

Relativ risiko for diabetes type 2, høyt blodtrykk og hjerte- og karsykdom i forhold til måling av KMI og livvidde:

♂ ♂

KMI midjemål<102 midjemål≥102

Undervekt 18,5 Ikke økt Ikke økt

Normalvekt 18,5-24,9 Ikke økt Noe økt

Overvekt 25,0-29,9 Noe økt Høyt

Fedme grad I 30,0-34,9 Høyt Veldig høyt

Fedme grad II 35,0-39,9 Veldig høyt Ekstremt høyt Fedme grad III ≥40 Ekstremt høyt Ekstremt høyt

(Siteret frahttps://sml.snl.no/overvekt)

(9)

Eksempel: KMI 24,9 og midjemål 101,9 cm

Relativ risiko for diabetes type 2, høyt blodtrykk og hjerte- og karsykdom i forhold til måling av KMI og livvidde:

♂ ♂

KMI midjemål<102 midjemål≥102

Undervekt 18,5 Ikke økt Ikke økt

Normalvekt 18,5-24,9 Ikke økt Noe økt

Overvekt 25,0-29,9 Noe økt Høyt

Fedme grad I 30,0-34,9 Høyt Veldig høyt

Fedme grad II 35,0-39,9 Veldig høyt Ekstremt høyt Fedme grad III ≥40 Ekstremt høyt Ekstremt høyt

(Siteret frahttps://sml.snl.no/overvekt)

Måling i en medisinske kontekst.

9 / 33

(10)

Eksempel: KMI 25,1 og midjemål 102,1 cm

Relativ risiko for diabetes type 2, høyt blodtrykk og hjerte- og karsykdom i forhold til måling av KMI og livvidde:

♂ ♂

KMI midjemål<102 midjemål≥102

Undervekt 18,5 Ikke økt Ikke økt

Normalvekt 18,5-24,9 Ikke økt Noe økt

Overvekt 25,0-29,9 Noe økt Høyt

Fedme grad I 30,0-34,9 Høyt Veldig høyt

Fedme grad II 35,0-39,9 Veldig høyt Ekstremt høyt Fedme grad III ≥40 Ekstremt høyt Ekstremt høyt

(Siteret frahttps://sml.snl.no/overvekt)

(11)

Ikke økt Høyt

KMI: 20; Midjemål: 90

KMI: 28; Midjemål: 110

KMI: 24,9 Midjemål: 101

KMI: 25 Midjemål: 102

KMI * midjemål

Relativ Risiko

Måling i en medisinske kontekst.

11 / 33

(12)

Ikke økt Høyt

KMI: 20; Midjemål: 90

KMI: 28; Midjemål: 110

KMI: 24,9 Midjemål: 101

KMI: 25 Midjemål: 102

KMI * midjemål

Relativ Risiko

(13)

Presisjon av en eksamen:

Hvor sikker er pass/fail avgjørelser?

Presisjon eller «Reliabilitet»

13 / 33

(14)

Fire resultater, pass score er 65%

FAIL PASS

pass score (65%)

clear fail

clear pass

0% 10% 20% 30% 40% 50% 60% 70% 80% 90% 100%

Percentage Correct Score

(15)

Hvor sikker er vi at de strøk/bestod virkelig?

FAIL PASS

fail?

pass?

pass score (65%)

0% 10% 20% 30% 40% 50% 60% 70% 80% 90% 100%

Percentage Correct Score

Presisjon eller «Reliabilitet»

15 / 33

(16)

Usikkerheten ved «pass score»

FAIL PASS

fail?

pass?

0% 10% 20% 30% 40% 50% 60% 70% 80% 90% 100%

Percentage Correct Score

(17)

Hvor stor er (u)sikkerheten? En simulasjon med 50 spørsmål

20% correct;

100% confidence

62% correct;

25% confidence

68% correct;

47% confidence

98% correct;

100% confidence

95 % 90 % 80 % 0 %

0 5 10 15 20 25 30 35 40 45 50 55 60 65 70 75 80 85 90 95 100 Percentage Correct Score

Confidence for Dichotomous Decision

Presisjon eller «Reliabilitet»

17 / 33

(18)

Eksempel: MED4400 EKSAMEN

hele eksamen

60.2% − 70.1%

(90 % sikkerhet)

95 % 90 % 80 % 0 %

10 20 30 40 50 60 70 80 90

Percentage Correct Score

Confidence for Dichotomous Decision

(19)

Eksempel: MED4400 EKSAMEN

'Benefit of the doubt':

Alle består, som stryker ikke med en 90% sikkerhet hele

eksamen

95 % 90 % 80 % 0 %

10 20 30 40 50 60 70 80 90

Percentage Correct Score

Confidence for Dichotomous Decision

Presisjon eller «Reliabilitet»

19 / 33

(20)

Eksempel: MED4400 EKSAMEN

'Patient safety first':

Alle stryker som består ikke med en 90% sikkerhet hele

eksamen

95 % 90 % 80 % 0 %

10 20 30 40 50 60 70 80 90

Percentage Correct Score

Confidence for Dichotomous Decision

(21)

Eksempel: MED4400 EKSAMEN

'Kontinuasjon':

Vi trenger mer informasjon om disse studentene hele

eksamen

95 % 90 % 80 % 0 %

10 20 30 40 50 60 70 80 90

Percentage Correct Score

Confidence for Dichotomous Decision

Presisjon eller «Reliabilitet»

21 / 33

(22)

Presisjon og «indre skranker»

hele eksamen

60.2% − 70.1%

(90 % sikkerhet)

nevrologi

55.2% − 75%

(90 % sikkerhet)

ønh

54.6% − 77.8%

(90 % sikkerhet)

øye

56.9% − 74.1%

(90 % sikkerhet)

95 % 90 % 80 % 0 %

10 20 30 40 50 60 70 80 90 10 20 30 40 50 60 70 80 90 10 20 30 40 50 60 70 80 90 10 20 30 40 50 60 70 80 90 Percentage Correct Score

Confidence for Dichotomous Decision

(23)

Presisjon og «indre skranker»

hele eksamen

nevrologi ønh øye

95 % 90 % 80 % 0 %

10 20 30 40 50 60 70 80 90 10 20 30 40 50 60 70 80 90 10 20 30 40 50 60 70 80 90 10 20 30 40 50 60 70 80 90 Percentage Correct Score

Confidence for Dichotomous Decision

Klarte hele eksamen men stryker i (minst) et delfag

Presisjon eller «Reliabilitet»

23 / 33

(24)

Presisjon og «indre skranker»

90.7% correct 100% confidence

hele eksamen

83.3% correct 100% confidence

nevrologi

64.8% correct 11% confidence

ønh

94.3% correct 100% confidence

øye

95 % 90 % 80 % 0 %

10 20 30 40 50 60 70 80 90 10 20 30 40 50 60 70 80 90 10 20 30 40 50 60 70 80 90 10 20 30 40 50 60 70 80 90 Percentage Correct Score

Confidence for Dichotomous Decision

Beste som klarte hele eksamen og stryker i (minst) et delfag

(25)

Presisjon og «indre skranker»

70.4% correct 93% confidence

hele eksamen

90.6% correct 100% confidence

nevrologi

56.5% correct 83% confidence

ønh

75.9% correct 95% confidence

øye

95 % 90 % 80 % 0 %

10 20 30 40 50 60 70 80 90 10 20 30 40 50 60 70 80 90 10 20 30 40 50 60 70 80 90 10 20 30 40 50 60 70 80 90 Percentage Correct Score

Confidence for Dichotomous Decision

Lavest score i et delfag

Presisjon eller «Reliabilitet»

25 / 33

(26)

Nøyaktighet og presisjon

av en gradert karakterskala

(27)

Presisjon: Samme problemet som før, men fem ganger...

Indifferensområde (50 spørsmål)

95 % 90 % 80 % 0 %

10 20 30 40 50 60 70 80 90

Percentage Correct Score

Confidence for Dichotomous Decision

Nøyaktighet 27 / 33

(28)

Jo flere spørsmål, jo høyre presisjon

Indifferensområde (100 spørsmål)

95 % 90 % 80 % 0 %

10 20 30 40 50 60 70 80 90

Percentage Correct Score

Confidence for Dichotomous Decision

(29)

Jo flere spørsmål, desto høyre presisjon

Indifferensområde (500 spørsmål)

95 % 90 % 80 % 0 %

10 20 30 40 50 60 70 80 90

Percentage Correct Score

Confidence for Dichotomous Decision

Nøyaktighet 29 / 33

(30)

Nøyaktigheit: «Blueprint» for (3 * 4 * 3 =) 36 spørsmål

...

...

...

...

Dia d

Ter Års ...

...

...

...

A

B

C n=3

n=3 n=3

n=3

«Kompetanse»

Sykdom

(31)

Informasjon fra forskjellige nivåer

(F. eks. basiskunnskap - viderekommende - fremragende)

Dia d

Ter Års ...

...

...

...

...

...

...

...

A ...

...

...

B ...

...

...

C ...

...

...

Bas ...

...

...

Vid ...

...

...

Fre

«Kompetanse»

Sykdom

Nivå

Nøyaktighet 31 / 33

(32)

Sammendrag

Presisjon: Hvordan skal man omgå med usikkerhet?

Nøyaktighet: Tilsvarer informasjoner man få til følgene man

trekker av målinger?

(33)

«Takk for oppmerksomheten»

Nøyaktighet 33 / 33

Referanser

RELATERTE DOKUMENTER

Gitt den store utfordringen med å kutte utslipp av drivhusgasser i hele samfunnet kan det være aktuelt å undersøke hvordan forsvarssektoren kan bidra til å kutte utslipp... 16

Enveis simulering benyttes for håndvåpen og maskingevær, mens toveis benyttes for tyngre våpen der man også beregner ballistikk.. Toveis simuleringer gir best nøyaktighet og

Risikoforståelsen er avgjørende for hvordan man både vurderer, håndterer og styrer risiko, og formålet i denne oppgaven vil være å se hvordan ulike tilnærminger til risiko

Duis aute irure dolor in reprehenderit in voluptate velit esse cillum dolore eu fugiat nulla pariatur.. Excepteur sint occaecat cupidatat non proident, sunt in culpa qui officia

Denne utviklingen kan forklares med at de funksjonshemmede som ikke er sysselsatt, men ønsker jobb, allerede i stor grad blir registrert som yrkeshemmet i Arena, og at «potensialet

Nøyaktighet er i denne sammenheng definert ut fra avvik mellom måling med det analoge og det digitale kompasset. jo nærmere 0 avviket er, jo mer nøyaktig er den aktuelle

Statens vegvesen har tidligere gjennomført flere felt forsøk for å registrere aksellast eller totalvekt for de tunge kjøretøyene ved bruk av forskjellige «Weigh-in-motion

For det andre indikerer det at nytten ved kommunikasjonskontroll ofte er indirekte gjennom å fremskaffe informasjon som i seg selv ikke kvalifiserer som bevis, men som likevel