Als tweede module van mijn AI-master aan de Open Universiteit volgde ik de Machine Learning module. In deze module is een van de opdrachten het uitvoeren van een machine learning project. Voor mijn project heb ik gewerkt met SHAP-analyses voor het komen tot concreet advies richting studenten voor het behalen van betere resultaten, op basis van een dataset van twee middelbare scholen uit Portugal.
Studentensucces is een veelbesproken onderwerp in het onderwijs. Iedereen wil weten: wat bepaalt of een student slaagt of niet? In de afgelopen jaren is er veel onderzoek gedaan met machine learning om dit te voorspellen. Maar de meeste studies stoppen bij het aanwijzen van belangrijke factoren, zonder dat studenten daar echt iets mee kunnen. Dit project gaat een stap verder: we gebruiken SHAP (SHapley Additive exPlanations) om niet alleen te begrijpen welke factoren invloed hebben, maar vooral hoe studenten hier zelf hun voordeel mee kunnen doen.
Dit onderzoek bouwt voort op de studie van Cortez & Silva (2008), waarin machine learning werd ingezet om de prestaties van middelbare scholieren in Portugal te voorspellen. Zij onderzochten welke algoritmen het beste werkten en bepaalden welke factoren de grootste impact hadden. Maar daar bleef het bij. Wij gaan een stap verder door SHAP-analyse toe te passen, waardoor we niet alleen zien wat belangrijk is, maar ook hoe studenten hier actief op kunnen inspelen.
Uit de analyse blijkt dat eerdere cijfers (G1 en G2), het aantal onvoldoende resultaten en leeftijd de grootste invloed hebben op studiesucces. Vooral de cijfers uit eerdere periodes zijn een sterke voorspeller voor het eindresultaat. Op basis hiervan kunnen we concrete adviezen geven: focus op goede prestaties in de eerste periodes en voorkom onvoldoendes, want deze hebben een langdurig effect.
Met deze aanpak willen we de kloof dichten tussen data-analyse en praktisch toepasbare inzichten. Het doel is niet alleen om te voorspellen of een student slaagt, maar vooral om studenten te helpen betere keuzes te maken op basis van data. Toekomstig onderzoek zou zich kunnen richten op de vraag waarom deze factoren zo’n grote rol spelen en hoe deze inzichten breder toepasbaar zijn in verschillende onderwijssystemen.
Door machine learning slim in te zetten, kunnen we niet alleen betere voorspellingen maken, maar ook echt impact hebben op hoe studenten leren en presteren. En dat is waar het uiteindelijk om draait.
Enkele bestanden die je kan downloaden.
Study Smarter, Not Harder: Using SHAP for Actionable Educational Insights