Wanneer en hoe mogen leerlingen gebruikmaken van ChatGPT bij toetsen en examens? Leg het helder vast in het examenreglement. Lees onze 11 tips voor de korte en lange termijn over generatieve AI bij toetsing.
Wat is ChatGPT?
ChatGPT is een voorbeeld van een large language model (LLM): een zogeheten groot taalmodel. Eigenlijk is ChatGPT een interface om met een groot taalmodel aan de slag te gaan. ChatGPT heeft de vorm van een chatbot. Iemand stelt vragen aan de chatbot en krijgt antwoord. Een groot taalmodel is een vorm van artificial intelligence (AI).
Een groot taalmodel wordt getraind op basis van enorme hoeveelheden data. In dit geval is dat geschreven taal. Op basis van de woorden die in een commando staan voor het taalmodel, genereert het tekst. Het algoritme van het taalmodel doet steeds voorspellingen over wat het volgende woord in de tekst zal zijn om zo tot een goede tekst te komen.
Taalmodellen zijn op zich niet nieuw, maar ze worden wel steeds krachtiger. Dankzij grote hoeveelheden data is het mogelijk om de modellen te trainen en te verbeteren. Los van de data zijn de taalmodellen zelf ook geavanceerder geworden. Daardoor produceren ze snellere en complexere resultaten die steeds beter overtuigen als bruikbare tekst.
Deze ontwikkeling zien we ook terug in ChatGPT. Toen ChatGPT werd gelanceerd in november 2022 maakte het gebruik van het GPT3.5-taalmodel. Ondertussen is er GPT4, dat getraind is met behulp van nog meer data en dat verder is gefinetuned. Volgens de makers van ChatGPT zouden de uitkomsten hierdoor accurater zijn en inzetbaar zijn voor meer vraagstukken en activiteiten. De nieuwe versie van het taalmodel zou bijvoorbeeld afbeeldingen kunnen analyseren en deze kunnen gebruiken als input.
Grote taalmodellen hebben geen idee of hun resultaten kloppen of niet. Ze zijn goed in het maken van taal die lijkt op de taal waarmee ze zijn getraind. ChatGPT heeft dus geen ‘kennis’, ook al lijkt dat soms wel zo. Wie experimenteert met ChatGPT zal zien dat de resultaten lang niet altijd correct zijn. ChatGPT kan ook overtuigende teksten produceren die complete onzin zijn.

ChatGPT heeft ons allemaal verrast. Of zat zoiets eraan te komen?
De toepassing van grote taalmodellen zoals in ChatGPT heeft gezorgd voor een ware hype die veel mensen in het onderwijs en daarbuiten bezighoudt. De combinatie van zeer bruikbare teksten, de vrije beschikbaarheid hiervan én het feit dat studenten en scholieren volop experimenten met de software, roept onmiddellijk vragen op bij leraren en schoolorganisaties.
Wie de ontwikkelingen rond zogenaamde generatieve AI volgt, is hier minder verrast over. Het was niet zozeer de vraag óf een dergelijk taalmodel belangrijk zou gaan worden, maar eerder wanneer en in welke vorm. Nu is het ChatGPT, over een paar maanden staat waarschijnlijk weer een andere vorm van generatieve AI in de spotlights.
Het algemene kenmerk van generatieve AI is dat een gebruiker op basis van een getraind model iets automatisch kan laten produceren. Er bestaat generatieve AI voor tekst, video, stemmen, muziek, programmeercode, enzovoort. In de creatieve wereld zorgen bijvoorbeeld DALL-E en Stable Diffusion voor reuring. Met deze tools is het mogelijk om geautomatiseerd afbeeldingen te genereren.
Deze tools maken gebruik van grote hoeveelheden data. De modellen achter deze tools vinden hier patronen in. Op basis van de input die gebruikers geven én de beschikbare dataset wordt dan iets unieks geproduceerd.
Er zijn meer grote taalmodellen (large language models – LLM), bijvoorbeeld LaMBDA (van Google), Galactica en OPT-66B (van Meta). De ontwikkeling van deze taalmodellen zal verder gaan en er verschijnen alweer nieuwere versies.
Wie zit er achter ChatGPT?
ChatGPT is eigendom van het bedrijf OpenAI. Achter het bedrijf zitten diverse investeerders. OpenAI begon als non-profitorganisatie, maar werd later een bedrijf om investeringen aan te kunnen trekken voor ontwikkeling. Microsoft heeft onlangs een flinke investering gedaan in het bedrijf om technologie van OpenAI ook te kunnen integreren in zijn eigen diensten.
De naam van het bedrijf kan de indruk wekken dat het gaat om opensourcesoftware, maar dat is ChatGPT niet. Open source wil namelijk zeggen dat de broncode en data publiek beschikbaar zijn en dat iemand daarmee zijn eigen versie kan maken. Dat is hier niet het geval.
Waarom is ChatGPT vrij beschikbaar?
OpenAI heeft het model ter beschikking gesteld in de vorm van een publieke testversie. Iedereen kan, na het aanmaken van een account, gebruikmaken van ChatGPT. Door het model ter beschikking te stellen, leert het bedrijf allerlei dingen:
- Hoe gebruiken mensen het taalmodel in de praktijk?
- Hoe kan OpenAI het taalmodel verder verfijnen, door te leren van alle interactie die mensen hebben met ChatGPT?
- Welke maatregelen kan het bedrijf nemen om ongewenst gebruik tegen te gaan?
- Hoe reageert de wereld op het bestaan van zo’n taalmodel?
- Op welke manieren kan het bedrijf geld verdienen aan dit model?
Wie ChatGPT uitprobeert en gebruikt, werkt dus mee aan deze (enorm grote) publieke test van OpenAI. Het kost aardig wat geld om ChatGPT beschikbaar te stellen, maar het levert het bedrijf ook ontzettend veel data op ter verbetering.
Het is de vraag of ChatGPT publiek beschikbaar zal blijven. Het bedrijf kan geld vragen om ChatGPT te verwerken in zakelijke toepassingen, zoals mailprogramma’s of in zoekmachines. Ook zijn er abonnementen voor individuele gebruikers.
Wat wordt de impact van ChatGPT op het onderwijs?
Het is moeilijk te voorspellen wat de precieze impact van taalmodellen zoals ChatGPT zal zijn. Daarvoor is de technologie nog te jong. We hebben hier te maken met een ware hype. Een hype krijgt veel media-aandacht en er zijn torenhoge verwachtingen. Ook al staat zij volop in de belangstelling, er is feitelijk nog maar weinig onderzoek gedaan naar de inzet in het onderwijs en de gevolgen hiervan. Zowel als het gaat om de kansen als de keerzijden.
Nu grote taalmodellen breder beschikbaar zijn geworden, leren we steeds meer over wat er wel en nog niet goed kan. Accuraatheid van informatie blijft bijvoorbeeld een hardnekkig issue. De ethische aspecten van de technologie krijgen ook steeds meer aandacht, zoals issues omtrent bias en het gebruik van andermans werk om taalmodellen te trainen.
In de vele discussies over ChatGPT zien we mensen die het compleet willen verbieden, mensen die vinden dat we het moeten omarmen, en alles wat ertussenin zit. Wat de één ziet als positief, ziet de ander als een mogelijk gevaar. Dat heeft ook te maken met de visie die iemand heeft op onderwijs en technologie. In ieder geval is het goed om ons te realiseren: grote taalmodellen verdwijnen niet meer. Het is een verschijnsel waar de maatschappij en het onderwijs zich toe moeten verhouden.
Wat zijn mogelijk positieve toepassingen van ChatGPT en dit soort taalmodellen voor het onderwijs?
Er zijn allerlei toepassingen denkbaar.
Voor leraren
- Het opstellen van lesplannen.
- Nieuwe werkvormen bedenken en opdrachten uitschrijven.
- Toetsopgaven genereren.
- Rubrics automatisch aanmaken.
- Kunnen chatten met een leermiddel over de voortgang van leerlingen in plaats van de uitkomsten op dashboard zelf compleet te doorgronden.
Voor leerlingen
- Een leerling of student kan zich oriënteren op een bepaald onderwerp.
- Leerlingen die moeite hebben met taal, kunnen worden geholpen om hun ideeën om te zetten in tekst.
- De software kan gepersonaliseerde teksten genereren op het niveau van een leerling, die gaat over een persoonlijke interesse van een leerling.
- ChatGPT-teksten kunnen als onderwijsmateriaal dienen, juist om te leren kritisch te kijken naar dit soort teksten, (on)waarheden en bronnen.
Anders
- Hulp bij het schrijven van het jaarplan of schoolplan.
- Teksten laten genereren voor op de website.
- Uitnodigingen voor schoolevenementen.
- Teksten voor in de nieuwsbrief enzovoort.
Wat zijn mogelijk negatieve kanten aan ChatGPT en dit soort taalmodellen voor het onderwijs?
- Het is een nieuwe, geavanceerde vorm van spieken of huiswerk overschrijven. Een leerling kan immers een volledige tekst invoeren in ChatGPT en vragen om deze iets anders te formuleren.
- Leerlingen kunnen teksten genereren voor opdrachten en werkstukken zonder zelf iets te hoeven schrijven.
- Het ondermijnt het belang van ‘zelf kennis opdoen’. Waarom zou ik iets moeten leren als ChatGPT het voor mij kan doen? Tegelijkertijd wordt kennis opdoen nu veel belangrijker om de uitkomsten te kunnen factchecken.
- Leraren kunnen niet (altijd) herkennen of een tekst is gemaakt met behulp van ChatGPT.
- Leerlingen vertrouwen mogelijk te veel op de chatbot en herkennen zelf niet of er fouten zitten in een ChatGPT-tekst. Ze kunnen de tekst kritiekloos voor waar aannemen.
- Het gebruik van deze software kan mogelijk een impact hebben op lees- en schrijfvaardigheid.
Hoe gaat ChatGPT om met privacybescherming?
ChatGPT is een webapplicatie. Alle vragen die iemand stelt, alle antwoorden die terugkomen en alle verdere interactie met de website worden bij het bedrijf OpenAI geregistreerd. Ook verzamelt het bedrijf gegevens over bezoekers, zoals bezoekersstatistieken, momenten waarop iemand inlogt, gegevens over de internetbrowser enzovoort. In de privacyvoorwaarden staat om welke gegevens het gaat.
In het geval van ChatGPT is het goed om te weten dat OpenAI de website presenteert als open test. Het kan alle ingevoerde gegevens gebruiken om het taalmodel achter ChatGPT te verbeteren. Het is dan ook niet verstandig om persoonlijke gegevens en details in te voeren. Wees u hier bewust van en laat dit ook weten aan leerlingen als ze kennis willen maken met ChatGPT.
Hoe weet ik of een tekst is gemaakt met behulp van ChatGPT?
Dit is lang niet altijd te achterhalen en dat is ook één van de redenen waarom ChatGPT de onderwijswereld zo bezighoudt. Wanneer de schrijfstijl in een verslag afwijkt van de gebruikelijke schrijfstijl van een leerling, kan dit duiden op een ChatGPT-tekst. Het is goed om op te merken dat ChatGPT niet zelf ‘nadenkt’: het kan alleen maar echt ogende teksten maken. In de teksten kunnen dus inhoudelijke fouten voorkomen en het taalmodel kan ook geen bronnen checken. Als u ChatGPT vraagt om bronnen, dan zal het in veel gevallen met bronnen komen die echt lijken, maar niet bestaan.
De uitingen van de software zijn uniek; de teksten zijn niet op internet terug te vinden. De standaard plagiaatcheckers werken dan ook niet. Als een leerling slim omgaat met de output van ChatGPT en hier en daar nog iets aanpast, of juist een paar fouten laat zitten voor de geloofwaardigheid, dan wordt het voor leraren lastig om het gebruik van de software op te sporen.
Bestaat er al speciale plagiaatdetectie die het gebruik van ChatGPT opspoort?
Diverse bedrijven ontwikkelen technologie om te detecteren of een tekst door een taalmodel is gemaakt. Er zijn verschillende ontwikkelaars die aan detectietools werken, sommigen daarvan zijn ook al op de markt. Waar voorheen het detecteren vooral mogelijk was met Engelse teksten, werken er nu ook partijen aan detectietools voor Nederlandstalige teksten.
Taalmodellen worden echter ook steeds beter, dus detectietools moeten zich blijven vernieuwen om de ontwikkelingen bij te benen. De vraag is waar dit eindigt; misschien wordt het op termijn onmogelijk om teksten van een taalmodel op te sporen.
Dan is er nog de vraag wat er met de uitkomsten van een detectietool wordt gedaan. De tools kunnen alleen een indicatie geven met een bepaalde mate van zekerheid. Het is geen daadwerkelijke 100%-detectie. De tool maakt een eerste check mogelijk en geeft een oordeel (real/fake) zodat de leerkracht snel kan zien of een leerling wellicht gebruik heeft gemaakt van ChatGPT om er vervolgens zelf nog een nadere analyse op los te laten. Er bestaat dus ook de mogelijkheid dat een echte tekst als gegenereerd kan worden aangewezen. Het is van belang om de inschatting van een detectietool nooit als enige graadmeter te gebruiken.
Hoe ga ik om met leerlingen die een verslag schrijven via ChatGPT?
Als een leerling of student een tekst inlevert die vermoedelijk via ChatGPT is geproduceerd, dan is dat in ieder geval aanleiding voor een gesprek. Klopt het dat ChatGPT eraan te pas kwam? Waarom? Is de software voor een specifiek onderdeel gebruikt? Kortom: het is goed om te checken of een leerling ChatGPT heeft gebruikt en zo ja waarvoor, en dus niet zomaar aan te nemen dat dat is gebeurd. Want dat doet de vertrouwensrelatie met de leraar natuurlijk geen goed.
De mogelijkheden van grote taalmodellen vragen hoe dan ook om een kritische en creatieve kijk op onderwijs en toetsing. Er zijn misschien andere manieren om te achterhalen wat een leerling weet en wat hij of zij van de stof heeft begrepen. Denk aan presentaties, mondelinge toetsvormen, enzovoort. Of overweeg om ChatGPT juist een prominentere plaats te geven in taalonderwijs en onderwijs in digitale vaardigheden. De chatbot kan dan een onderzoeksobject worden. Welke resultaten geeft ChatGPT en wat vinden we daarvan?
Bij digitaal toetsen is het mogelijk om devices zo in te stellen (kiosk-modus) dat een leerling tijdens een toets geen toegang heeft tot ChatGPT.
Waarom kan ChatGPT rekenen op aardig wat kritiek?
Hiervoor bespraken we al de voor- en nadelen van ChatGPT voor het onderwijs. Er zijn ook algemene kritische noten te kraken over het gebruik van dergelijke technologie. We geven ze mee ter overweging.
- Verborgen arbeid: alles lijkt vanzelf en geautomatiseerd te gaan bij ChatGPT. Maar in lagelonenlanden worden mensen aan het werk gezet voor een goede werking van het taalmodel. Ze krijgen bijvoorbeeld verschrikkelijke teksten te zien, die ze moeten ze filteren en classificeren, om zo te bepalen of het model wel of niet teksten moet gebruiken als trainingsdata. Het welzijn van mensen kan hieronder lijden.
- Geen toestemming voor tekstgebruik: taalmodellen gebruiken teksten van internet die door anderen zijn geschreven en die daar eigenaar van zijn, zonder dat hiervoor toestemming is gegeven. Dit ‘tekstkapitaal’ wordt ingezet om hier zelf aan te verdienen en om tekstverwerking te automatiseren.
- Alleen voor big tech: grote taalmodellen vragen om een grote portemonnee. Het maken en onderhouden van grote taalmodellen is een kostbare aangelegenheid en het is daarom vooral weggelegd voor grote techpartijen.
- Ecologische impact: streamingsdiensten, blockchaintechnologie, clouddiensten; we zijn ons er steeds meer van bewust hoeveel energie dergelijke dataservices vragen en hoe groot de ecologische gevolgen zijn. ChatGPT kost energie en zorgt voor CO₂-uitstoot. Om een beeld te geven van die uitstoot: het eenmalig trainen van een taalmodel is ooit vergeleken met de uitstoot van 5 auto’s inclusief brandstof gedurende hun hele levensduur. Grote taalmodellen worden tegenwoordig vaker dan eenmalig getraind. De rekenkracht die nodig is om deze modellen te trainen verdubbelt elke 3 tot 4 maanden. Dat betekent een toename in CO₂-uitstoot en dat staat haaks op de klimaatdoelen om CO₂-uitstoot te verminderen. Wat de precieze CO₂-footprint van het taalmodel is dat ChatGPT gebruikt is niet daadwerkelijk bekend en zou verder onderzocht moeten worden.
- De prijs van gratis: alle input die we geven aan grote taalmodellen kan gebruikt worden om het model te verbeteren. Gratis is in dit geval dus ook betalen met onze data.
ChatGPT gebruiken: welk advies geeft Kennisnet?
Hoewel we nog niet weten wat ChatGPT en grote taalmodellen uiteindelijk gaan betekenen voor het onderwijs, geven we hier toch enkele algemene adviezen en overwegingen.
- Taalmodellen zoals ChatGPT zijn een hype. Van hypes weten we nog niet precies welke impact de technologie zal hebben, hoe de technologie het beste kan worden toegepast en wat we hierbij echt bruikbaar en acceptabel vinden. Van ChatGPT weten we nog lang niet alles, zowel in positieve als in negatieve zin. In de praktijk zal moeten blijken of en op welke manier deze technologie impact maakt op het onderwijs.
- Tegelijkertijd zijn er nu al concrete vragen rond de chatbot. Mag hij worden gebruikt voor toetsen en examens, wanneer wel en wanneer zeker niet? In ieder geval is het belangrijk om hier helder over te zijn in het examenreglement.
- Grote taalmodellen zijn niet meer weg te denken: ze zullen niet verdwijnen. Het gaat om een vorm van artificial intelligence waar we iets van moeten vinden en waar we ‘iets mee moeten’, zelfs als we besluiten om de technologie (in sommige onderwijssituaties) niet in te zetten.
- Probeer deze technologie in ieder geval uit. Niet per se gelijk in een les, maar door bijvoorbeeld samen als team de tool uit te proberen in een sessie. Verken deze gezamenlijk in onderwijsteams en denk na over de gevolgen voor het onderwijsontwerp. Wat betekent het bestaan van deze technologie voor ons handelen? Voor de leerdoelen? Hoe gaan we hierover met de leerlingen in gesprek?
- Verken ook als onderwijsteam hoe tegen deze technologie wordt aangekeken. Moet deze technologie omarmd worden of niet? Moeten we hiermee experimenteren, moeten we deze al gebruiken in de lespraktijk? Organiseer ook het gesprek met leerlingen over deze technologie: wat kan deze technologie wel en niet? Welke mogelijkheden en bedreigingen zien zij? Wat kan het betekenen voor het onderwijs?
- In dit artikel wierpen we al enkele ethische vragen op over het gebruik van ChatGPT. Met behulp van ons Ethiekkompas kunt u met uw onderwijsteam dieper ingaan op deze ethische vragen.
Lees meer over ChatGPT
De onderwijswereld is vol van chatbot ChatGPT. Hoe kunnen scholen omgaan met deze vorm van artificial intelligence die in een paar tellen geloofwaardige teksten voor boekverslagen, essays en andere huiswerkopdrachten produceert?