De kansen die comparatief beoordelen biedt...•Over jaren heen Centrale toetsing 30...

transcript

De kansen die comparatief beoordelen biedt

Maarten Goossens

Universiteit Antwerpen

112/11/2018

Comparatief beoordelen

Beoordelingsfamilies (Coertjens, 2017)

Holistisch beoordelen

“het geheel is meer dan de som van de delen”

Betrouwbaarheid

Gray scale Description

1 White

2 Slightly darker than white

3 Between white and gray

4 Almost gray

5 Gray

6 Slightly darker than gray

7 Dark gray

8 Slightly darker than dark gray

9 Almost black

10 Black

Analytisch beoordelen

Criterialijsten, rubrics

“opgedeeld staat netjes”

Betrouwbaarheid

Validiteit

Gray scale Description

1 White

2 Slightly darker than white

3 Between white and gray

4 Almost gray

5 Gray

6 Slightly darker than gray

7 Dark gray

8 Slightly darker than dark gray

9 Almost black

10 Black

Analytisch beoordelen

Criterialijsten, rubrics

“opgedeeld staat netjes”

Betrouwbaarheid

Validiteit

Holistisch beoordelen

“het geheel is meer dan de som van de delen”

Betrouwbaarheid

Vergelijkende methoden

Paarsgewijs vergelijken

“vergelijken is puur natuur”

Absoluut (per product)

Comparatief

Comparatief beoordelen

Welke papers is de beste?

Sterke punten Werkpunten

Beoordelaar A Zeer relevante onderzoeksvraag.Deze paper draagt echt nieuwe wetenschappelijke inzichten aan.

Volgens mij kan je nog verder gaan in je praktische implicaties. Denk bv aan…

Beoordelaar B Schitterend gebruik van mixed methode. Ik zou je vervolg onderzoek nog meer in de verf zetten. Kijk eens naar (hupeldepup, 2012)

Beoordelaar C Must read!

Feedback

• Rangorde• Kwaliteitsscores (in logits) met betrouwbaarheidsinterval

• Scale Separation Reliability• Geeft schatting van interbeoordelaars betrouwbaarheid (Verhavert, 2017)

• Misfit data voor beoordelaars • Welke beoordelaars hebben een ‘andere’ kijk (in vergelijking met de gedeelde

consensus van beoordelaars?)

• Misfit data voor representaties• Welke representatie(s) zijn moeilijk te beoordelen?

SSR= .80

Rangorde <-> punten

• 2 punten toekennen, en berekenen a.d.h.v. ability

• Voldoende meenemen (+ 1 extra punt)

6/2014/20

‘voldoende’ 15/20

Rangorde <-> punten

• Benchmarks

6/2014/2012/2010/208/20

Voorbeeld tool

- Maak enkele vergelijkingen:

URL: https://sandbox.d-pac.be

Ga naar ‘Beoordeel’

Voorbeeld competenties

o Schrijfvaardigheden:

Argumentatieve teksten

Synthese teksten

Creatieve teksten

Formele brieven

o Onderzoeksvaardigheden:

Wetenschappelijke rapporten

Papers

Bachelor-master proeven

Labo verslagen (tekst + grafieken)

Zelfreflecties

o Probleemoplossing

Wiskunde

Statistiek

ER diagrammen (schema)

o Beeldende vaardigheden

Schetsen (image)

Moodboards (image)

Personal branding (poster)

Animatiefilms (movie)

o Spreekvaardigheden

Presenteren (movie)

Interviewen (movie/audio)

o Combinaties

Porfolio’s

Stages (video)

Werkwijze

Praktijkvoorbeelden

Selectie/summatief beoordelen

• 50 studenten multimedia -> 50 animatics

• 9 beoordelaars• Docenten• Professionals: geluidshuis, software bedrijf, grafische vormgever/illustrator

• Werkbelasting: • 347 vergelijkingen

• 14 vergelijkingen per animatic• 38 vergelijkingen per beoordelaar

• 80 sec. per vergelijking = 50 min.

• Resultaat:• Betrouwbaarheid rangorde .72

Peer assessment

• Eenvoudig studenten beoordelen even betrouwbaar als docenten (SSR beide groepen = .77; correlatie = .65)

• Veilig want alles gaat anoniem

• Leerkansen:• Vergelijken• Feedback formuleren• Feedback krijgen

• Sterke en verbeterpunten• Positie in rangorde

• Voorbeelden • Mediërende rol docent

Peer assessment leercyclus

10 taken

Bespreking Versie 1

Bespreking

Summatief?

Combinatie peer assessment/summatief

Studenten:- Rangorde van minst goede tot beste paper via CJ- Gem. 10 min per vergelijking- Feedback = relevant, eerlijk en terecht, hoeveelheid is een

meerwaarde

meerwaardeTutoren:- 14 fails- Gelijkaardige FB

Laattijdig ingediend->fail ongeacht kwaliteit

Professionalisering

• Voorbeeld Ahovoks• 9 interne beoordelaars

• 16 externe beoordelaars

• 37 teksten

• Pre-test: 5 misfits

• Professionaliseringsdag

• Post-test: 1 misfit

Rangorde internen

Data externe 1

Data externe 2

Data externe …

Kwaliteitszorg / peilingsonderzoek

Welke uitspraak typeert onze school het beste?

Wij doen de nodige inspanningen opdat elke leerling zich goed voelt op school

Onze lessen sluiten aan bij de voorkennis van de leerlingen.

Welke uitspraak typeert jou het best op dit moment?

Ik vind ‘goed’ vaak niet goed genoeg

Ik doe het liefst alles zelf

Ik kan goed delegerenAls iets mislukt, voel ik me schuldig

Live assessment

• Beoordelen interactieve installaties (Avans)

• Beoordelen afstudeerprojecten architectuur (UA)

Live assessment

Procedure

A. Demo/presentatie

B. Beoordelen met D-PAC

C. Punten toekennen

Live assessment

• Bevindingen• ‘Doet recht’ aan werken

• Beoordelen snel en simpel

• Elk jury-lid kan zich vinden in punten

• Tijd voor feedback

Toekomstmogelijkheden

Kwaliteitszorg beoordelingen

• Bijvoorbeeld op departementen/academies• Groeien we over de jaren heen naar elkaar toe als beoordelaars?

• Hoe evolueert dit als er mensen de instelling verlaten/bijkomen?

• Is er genoeg diversiteit?

• Hoe verhouden we ons als docenten tot het werkveld?

• Benchmarks

Rangorde jaar 1/ klas A/…

Rangorde jaar 2/ Klas B/…

Leerwinstmonitoring

• Benchmarks/schalen hergebruiken• Over opdrachten heen

(zelfde competentie)

• Over jaren heen

Centrale toetsing

• Representatieve schalen, b.v. schrijfvaardigheid Vlaanderen, Nederland

• Individuen, klassen, jaren, scholen,… inschalen op representatieve schaal

bewaken standaard

tendensen en evoluties op ≠ niveaus

succesvolle interventies?

Conclusie

• Comparatief beoordelen genereert rijke data die leerkansen biedt op alle niveaus en zou daarom een plaats moeten krijgen in elk evaluatiebeleid

Referenties

• Bouwer, R., Goossens, M., Mortier, A., Lesterhuis, M., & De Maeyer, S. (2018). Een comparatieve aanpak voor peer assessment : leren door te vergelijken. In D. Sluijsmans & M. Segers (Eds.), Toetsrevolutie : naar een feedbackcultuur in het hoger onderwijs (pp. 92–106). Phronese.

• Coertjens, L., 2017: Key-note op D-PAC event. UAntwerpen

• Lundstrom, K., & Baker, W. (2009). To give is better than to receive: The benefits of peer review to the reviewer's own writing. Journal of second language writing, 18(1), 30-43.

• Rollinson, P. (2005). Using peer feedback in the ESL writing class. ELT journal, 59(1), 23-30.

Informatie

• www.d-pac.be

• maarten.goossens@uantwerpen.be

De kansen die comparatief beoordelen biedt...•Over jaren heen Centrale toetsing 30...

Documents