AI-antwoorden misleiden docenten: ChatGPT-scores hoger dan studenten in echt examen, blijkt uit onderzoek

Volgens een nieuw onderzoek worden antwoorden op toetsen gemaakt door AI in 94% van de gevallen niet gedetecteerd.

Leestijd: 2 minuten

Door Jan Vaart

- 6 juli 2024 om 18:22 in

Geautomatiseerd beoordelingssysteem mist door AI opgestelde testantwoorden.

AmsterdamOnderzoekers van de Universiteit van Reading in het Verenigd Koninkrijk hebben ontdekt dat examinatoren vaak AI-gegenereerde antwoorden niet herkennen. De studie werd geleid door Associate Professor Peter Scarfe en Professor Etienne Roesch van de School of Psychology and Clinical Language Sciences. Zij ontdekten dat antwoorden gegenereerd door ChatGPT in 94% van de gevallen onopgemerkt blijven.

Er is onderzoek gedaan naar psychologieklassen op universitair niveau. De door AI gegenereerde antwoorden vielen niet op en kregen zelfs hogere cijfers dan de antwoorden van echte studenten. Volgens de onderzoekers toont dit aan dat docenten snel moeten uitzoeken hoe AI het beoordelen van schoolwerk kan veranderen.

De studie onthulde een aantal belangrijke bevindingen:

In 94% van de gevallen werd AI-gegenereerde content niet herkend.
Antwoorden van AI kregen gemiddeld hogere cijfers.
Reading's onderzoek is het grootste en meest gedegen blinde onderzoek in zijn soort.

Wegens een recente studie herzien universiteitsleiders hun beleid. De Universiteit van Reading heeft nieuw advies verstrekt aan medewerkers en studenten over het gebruik van AI in het onderwijs. Professor Roesch benadrukt dat docenten moeten bepalen hoe studenten AI dienen te gebruiken en te vermelden. Dit vraagstuk is van groot belang voor het onderwijs en het behoud van vertrouwen in de samenleving.

Professor Roesch benadrukt dat de studie aantoont dat er actie nodig is. Slechts minder dan 10% van de scholen heeft richtlijnen voor generatieve AI, wat aangeeft dat er nog veel werk aan de winkel is. Een UNESCO-enquête onder 450 scholen en universiteiten wijst op deze gebrekkige voorbereidheid. Dr. Scarfe gaf aan dat veel scholen traditionele examens hebben vervangen door meer inclusieve vormen van toetsing. Toch is het cruciaal om de wereldwijde uitdagingen van AI te begrijpen.

Nvidia imponeert, maar Aziatische beurs reageert aarzelend op concurrentie.

De Universiteit van Reading geeft het goede voorbeeld door haar systemen te controleren en te verbeteren om de academische standaarden hoog te houden. Professor Elizabeth McCrum, de Pro-Vice-Chancellor voor Onderwijs en Studentenervaring, benadrukte dat kunstmatige intelligentie veel onderdelen van ons leven zal veranderen, inclusief de manier waarop we leren.

De universiteit werkt aan een groot project om te verbeteren. Ze maken meer gebruik van technologie om de studentenervaringen te verbeteren en studenten te helpen vaardigheden te ontwikkelen voor banen. Een onderdeel van dit plan is om traditionele testmethoden te vervangen door methoden die aansluiten bij beroepsvaardigheden, waaronder het gebruik van AI.

Het delen van nieuwe onderwijsmethoden is van groot belang voor het mondiale onderwijs. Het stelt studenten in staat om beter te laten zien wat ze weten en kunnen. Professor Roesch benadrukte dat het essentieel is om hoge academische en onderzoeksnormen te handhaven, vooral nu kunstmatige intelligentie in opkomst is.

De Universiteit van Reading roept het wereldwijde onderwijsveld op om hun voorbeeld te volgen. Scholen moeten nieuwe regels en richtlijnen opstellen voor het gebruik van AI. Dit is cruciaal om onderwijsbeoordelingen eerlijk te houden en het vertrouwen van het publiek te behouden. Onderzoekers dringen aan op onmiddellijke maatregelen om deze nieuwe uitdaging aan te pakken.

De studie is hier gepubliceerd:

http://dx.doi.org/10.1371/journal.pone.0305354

en de officiële citatie - inclusief auteurs en tijdschrift - is

Peter Scarfe, Kelly Watcham, Alasdair Clarke, Etienne Roesch. A real-world test of artificial intelligence infiltration of a university examinations system: A “Turing Test” case study. PLOS ONE, 2024; 19 (6): e0305354 DOI: 10.1371/journal.pone.0305354

Artificial Intelligence: Laatste nieuws