Samen met het Nova College heeft Kennisnet in een pilotproject onderzocht welke mogelijkheden 'ongestructureerde data' biedt voor het voorspellen van studiesucces. Dat is nieuw ten opzichte van een eerder project bij het Noorderpoort College, waarover je kunt lezen in onze brochure 'Big data, van hype naar actie'. Projectleider Willem-Jan Swiebel van het Nova College legt uit wat analyses van ongestructureerde data kan opleveren voor mbo-instellingen.

Op basis van tekstanalyse van ongestructureerde data kunnen mbo-instellingen in de toekomst mogelijk voorspellen of een student zijn diploma zal halen © Dirk-Jan Visser

Gestructureerde versus ongestructureerde data

Swiebel: "Gestructureerde informatie is alle informatie die in databases is opgeslagen. Het gaat meestal om opsommingen van kenmerken. Bijvoorbeeld: leeftijd, geslacht, geboorteplaats en resultaten. Het grootste deel van de informatie in de wereld is echter ongestructureerd, en bevindt zich niet in databases. Denk aan informatie die wordt gedeeld via sociale media, maar ook aan zoek- en browseresultaten op internet. Dit type informatie zegt veel over een persoon.

Binnen onderwijsinstellingen wordt in administratie- en leerlingvolgsystemen steeds meer ongestructureerde data vastgelegd over studenten. Denk aan stukken tekst, zoals een intakeverslag, verslagen van studieloopbaangesprekken, gegevens over telefoontjes bij ziekte of verzuim en andere correspondentie met de student. Zulke teksten en verslagen kunnen het beeld verrijken dat een mbo-instelling heeft van een student. Wat is de thuissituatie? Hoe is het gesteld met motivatie, voortgang en gezondheid? Die kennis kun je benutten om de student beter te begeleiden."

Ongestructureerde data bruikbaar maken

Swiebel: "Om ongestructureerde data bruikbaar te maken, wordt tekstanalyse ingezet. Dit is een combinatie van technieken uit bijvoorbeeld statistiek en taalkunde. Hiermee wordt een tekst geïnterpreteerd: uit welke woorden bestaat de tekst, hoe hangen woorden samen, welke patronen zijn er te herkennen? We hebben onderzocht of we op basis van deze analyses kunnen voorspellen of een student zijn diploma haalt. Daarvoor hebben we op basis van data uit de afgelopen 8 jaar onderzocht welke patronen er te herkennen zijn in de teksten.

Stappen van tekstanalyses

"Allereerst bepaalden we de 'scope'. Welke informatie is beschikbaar en mag je gebruiken?", zegt Swiebel. "We hebben vervolgens per student een tekstprofiel opgesteld. Dat bevat de eerstelijnsformulieren, waarin gegevens staan over het intakegesprek en gespreksverslagen tussen de studieloopbaanbegeleider en de student. Informatie uit tweedelijnsgesprekken, met bijvoorbeeld trajectbegeleiders of zorgverleners, is niet meegenomen omwille van de privacy van studenten."

Als bepaald is welke informatie gebruikt wordt om het tekstprofiel van een student te vullen, begint de daadwerkelijke analyse van het profiel. Daarbij wordt onderzocht of er trefwoorden in die teksten voorkomen die iets kunnen zeggen over de slagingskans van de student.

De voorspellende waarde van ongestructureerde data

"Of een student succesvol zal zijn, is in 72 procent van alle gevallen te voorspellen op basis van de teksten. We hebben hiermee een eerste stap gezet, maar de voorspellingen kunnen beter worden op basis van vervolgonderzoek, en door de combinatie van tekstanalyse met gestructureerde data."

Er zijn volgens Swiebel nog verbeteringen mogelijk, die kunnen helpen om het percentage te verhogen. "De gebruikte methode is gericht op het gebruik van trefwoorden en gaat niet in op de taal en zinsconstructie. Dat zou een goede vervolgstap zijn om nog beter te kunnen voorspellen.

Tekstanalyse kan een goede aanvulling zijn op bestaande voorspelmodellen. Het is al met al een beloftevolle ontwikkeling, en we denken dat het voor mbo-instellingen erg de moeite waard is om zich hier verder in te verdiepen."

Meer weten over ongestructureerde data?

Meer weten over ongestructureerde data als informatiebron voor het mbo? Download onderaan dit artikel de uitgebreide publicatie over het pilotproject.

Lees ook de brochure 'Big data, van hype naar actie', een handleiding van Kennisnet voor mbo-scholen die meer willen halen uit hun studentgegevens. En lees: 'Het teamperspectief, informatie voor teams in het mbo'; waarin de rol wordt belicht van teams bij interne sturing.

Downloads

Deel 'Met ongestructureerde data voorspellen we straks of de student zijn diploma haalt'

Delen
  • LinkedIn
  • Twitter
  • Facebook
  • Google+
  • E-mail
  • Terug