Détection de triche aux examens de chimie via ChatGPT grâce à la statistique
ParisDes chercheurs de l'Université d'État de Floride (FSU) ont mis au point une méthode pour détecter la tricherie lors des examens de chimie à choix multiples en utilisant ChatGPT. En appliquant des outils statistiques spéciaux pour analyser les réponses des tests, ils peuvent identifier l'utilisation de l'IA. Cette méthode comble une lacune dans les systèmes actuels de détection de la tricherie, qui se concentrent généralement sur les rédactions et les questions ouvertes plutôt que sur les tests à choix multiples.
Les points clés de cette recherche sont les suivants :
- Le modèle de Rasch a été utilisé pour évaluer la probabilité de réponses correctes en fonction de la difficulté des questions et des compétences des étudiants.
- Les chercheurs ont recueilli des données sur cinq semestres de réponses d'étudiants de la FSU et les ont comparées aux réponses générées par ChatGPT.
- ChatGPT a montré des schémas de réponse uniques, identifiables par des statistiques d'ajustement et une analyse comportementale.
Le modèle de Rasch démontre que la manière dont les élèves répondent de manière cohérente aux questions peut révéler leur niveau de connaissance. Les élèves performants réussissent généralement à répondre correctement aux questions difficiles comme faciles, tandis que les élèves moins performants réussissent principalement aux questions faciles. ChatGPT, en revanche, produit des réponses imprévisibles, parvenant parfois à répondre juste aux questions difficiles mais faisant des erreurs sur les simples, ce qui diffère du comportement humain. Cette incohérence permet de repérer les réponses générées par IA.
Cette recherche revêt une grande importance. Avec l'usage croissant d'outils d'IA tels que ChatGPT en éducation, il est essentiel de garantir l'intégrité des examens à choix multiples. Les méthodes traditionnelles comme la surveillance humaine et les logiciels anti-plagiat peuvent se révéler inefficaces face à la triche assistée par IA. L'utilisation de techniques statistiques avancées permet de détecter des schémas spécifiques propres aux IA, contribuant ainsi à maintenir des standards académiques élevés.
Les recherches indiquent que le contenu généré par l'IA peut sembler convaincant aux étudiants ou aux personnes peu familières avec le sujet, mais que l'IA ne comprend pas réellement la matière. Cela souligne l'importance de penser de manière critique et de bien comprendre ce que l'on apprend. Les étudiants qui utilisent des outils d'IA pour tricher passent à côté de véritables opportunités d'apprentissage et risquent de faire face à de graves conséquences académiques.
Ces découvertes pourraient s'appliquer à d'autres matières comportant des examens à choix multiple, pas seulement la chimie. Les enseignants pourraient utiliser ces méthodes statistiques pour garantir l'équité et l'intégrité des divers tests standardisés et examens d'entrée. La collaboration entre Hanson et Sorenson illustre comment le travail en commun à travers différents domaines peut aider à résoudre des problèmes éducatifs complexes.
Cette étude souligne l'importance pour les écoles d'évoluer continuellement afin de s'adapter aux nouvelles technologies. À mesure que l'intelligence artificielle progresse, il est crucial de garantir que nos méthodes d'intégration dans l'éducation préservent l'intégrité académique.
L'étude est publiée ici:
http://dx.doi.org/10.1021/acs.jchemed.4c00165et sa citation officielle - y compris les auteurs et la revue - est
Benjamin Sorenson, Kenneth Hanson. Identifying Generative Artificial Intelligence Chatbot Use on Multiple-Choice, General Chemistry Exams Using Rasch Analysis. Journal of Chemical Education, 2024; 101 (8): 3216 DOI: 10.1021/acs.jchemed.4c00165Partager cet article