Wat is ChatGPT?

ChatGPT is een voorbeeld van een large language model (LLM): een zogeheten groot taalmodel. Eigenlijk is ChatGPT een interface om met een groot taalmodel aan de slag te gaan. ChatGPT heeft de vorm van een chatbot. Iemand stelt vragen aan de chatbot en krijgt antwoord. Een groot taalmodel is een vorm van artificial intelligence (AI).

Een groot taalmodel wordt getraind op basis van enorme hoeveelheden data. In dit geval is dat geschreven taal. Op basis van de woorden die in een commando staan voor het taalmodel, genereert het tekst. Het algoritme van het taalmodel doet steeds voorspellingen over wat het volgende woord in de tekst zal zijn om zo tot een goede tekst te komen.

Taalmodellen zijn op zich niet nieuw, maar ze worden wel steeds krachtiger. Dankzij grote hoeveelheden data is het mogelijk om de modellen te trainen en te verbeteren. Los van de data zijn de taalmodellen zelf ook geavanceerder geworden. Daardoor produceren ze snellere en complexere resultaten die steeds beter overtuigen als bruikbare tekst.

Deze ontwikkeling zien we ook terug in ChatGPT. Toen ChatGPT werd gelanceerd in november 2022 maakte het gebruik van het GPT3.5-taalmodel. Ondertussen is er GPT4, dat getraind is met behulp van nog meer data en dat verder is gefinetuned. Volgens de makers van ChatGPT zouden de uitkomsten hierdoor accurater zijn en inzetbaar zijn voor meer vraagstukken en activiteiten. De nieuwe versie van het taalmodel zou bijvoorbeeld afbeeldingen kunnen analyseren en deze kunnen gebruiken als input.

Grote taalmodellen hebben geen idee of hun resultaten kloppen of niet. Ze zijn goed in het maken van taal die lijkt op de taal waarmee ze zijn getraind. ChatGPT heeft dus geen ‘kennis’, ook al lijkt dat soms wel zo. Wie experimenteert met ChatGPT zal zien dat de resultaten lang niet altijd correct zijn. ChatGPT kan ook overtuigende teksten produceren die complete onzin zijn.

© ISTOCK

ChatGPT heeft ons allemaal verrast. Of zat zoiets eraan te komen?

De toepassing van grote taalmodellen zoals in ChatGPT heeft gezorgd voor een ware hype die veel mensen in het onderwijs en daarbuiten bezighoudt. De combinatie van zeer bruikbare teksten, de vrije beschikbaarheid hiervan én het feit dat studenten en scholieren volop experimenten met de software, roept onmiddellijk vragen op bij leraren en schoolorganisaties.

Wie de ontwikkelingen rond zogenaamde generatieve AI volgt, is hier minder verrast over. Het was niet zozeer de vraag óf een dergelijk taalmodel belangrijk zou gaan worden, maar eerder wanneer en in welke vorm. Nu is het ChatGPT, over een paar maanden staat waarschijnlijk weer een andere vorm van generatieve AI in de spotlights.

Het algemene kenmerk van generatieve AI is dat een gebruiker op basis van een getraind model iets automatisch kan laten produceren. Er bestaat generatieve AI voor tekst, video, stemmen, muziek, programmeercode, enzovoort. In de creatieve wereld zorgen bijvoorbeeld DALL-E en Stable Diffusion voor reuring. Met deze tools is het mogelijk om geautomatiseerd afbeeldingen te genereren.

Deze tools maken gebruik van grote hoeveelheden data. De modellen achter deze tools vinden hier patronen in. Op basis van de input die gebruikers geven én de beschikbare dataset wordt dan iets unieks geproduceerd.

Er zijn meer grote taalmodellen (large language models – LLM), bijvoorbeeld LaMBDA (van Google), Galactica en OPT-66B (van Meta). De ontwikkeling van deze taalmodellen zal verder gaan en er verschijnen alweer nieuwere versies.

Wie zit er achter ChatGPT?

ChatGPT is eigendom van het bedrijf OpenAI. Achter het bedrijf zitten diverse investeerders. OpenAI begon als non-profitorganisatie, maar werd later een bedrijf om investeringen aan te kunnen trekken voor ontwikkeling. Microsoft heeft onlangs een flinke investering gedaan in het bedrijf om technologie van OpenAI ook te kunnen integreren in zijn eigen diensten.

De naam van het bedrijf kan de indruk wekken dat het gaat om opensourcesoftware, maar dat is ChatGPT niet. Open source wil namelijk zeggen dat de broncode en data publiek beschikbaar zijn en dat iemand daarmee zijn eigen versie kan maken. Dat is hier niet het geval.

Waarom is ChatGPT vrij beschikbaar?

OpenAI heeft het model ter beschikking gesteld in de vorm van een publieke testversie. Iedereen kan, na het aanmaken van een account, gebruikmaken van ChatGPT. Door het model ter beschikking te stellen, leert het bedrijf allerlei dingen:

Wie ChatGPT uitprobeert en gebruikt, werkt dus mee aan deze (enorm grote) publieke test van OpenAI. Het kost aardig wat geld om ChatGPT beschikbaar te stellen, maar het levert het bedrijf ook ontzettend veel data op ter verbetering.

Het is de vraag of ChatGPT publiek beschikbaar zal blijven. Het bedrijf kan geld vragen om ChatGPT te verwerken in zakelijke toepassingen, zoals mailprogramma’s of in zoekmachines. Ook zijn er abonnementen voor individuele gebruikers.

Wat wordt de impact van ChatGPT op het onderwijs?

Het is moeilijk te voorspellen wat de precieze impact van taalmodellen zoals ChatGPT zal zijn. Daarvoor is de technologie nog te jong. We hebben hier te maken met een ware hype. Een hype krijgt veel media-aandacht en er zijn torenhoge verwachtingen. Ook al staat zij volop in de belangstelling, er is feitelijk nog maar weinig onderzoek gedaan naar de inzet in het onderwijs en de gevolgen hiervan. Zowel als het gaat om de kansen als de keerzijden.

Nu grote taalmodellen breder beschikbaar zijn geworden, leren we steeds meer over wat er wel en nog niet goed kan. Accuraatheid van informatie blijft bijvoorbeeld een hardnekkig issue. De ethische aspecten van de technologie krijgen ook steeds meer aandacht, zoals issues omtrent bias en het gebruik van andermans werk om taalmodellen te trainen.

In de vele discussies over ChatGPT zien we mensen die het compleet willen verbieden, mensen die vinden dat we het moeten omarmen, en alles wat ertussenin zit. Wat de één ziet als positief, ziet de ander als een mogelijk gevaar. Dat heeft ook te maken met de visie die iemand heeft op onderwijs en technologie. In ieder geval is het goed om ons te realiseren: grote taalmodellen verdwijnen niet meer. Het is een verschijnsel waar de maatschappij en het onderwijs zich toe moeten verhouden.

Wat zijn mogelijk positieve toepassingen van ChatGPT en dit soort taalmodellen voor het onderwijs?

Er zijn allerlei toepassingen denkbaar.

Voor leraren

Voor leerlingen

Anders

Wat zijn mogelijk negatieve kanten aan ChatGPT en dit soort taalmodellen voor het onderwijs?

Hoe gaat ChatGPT om met privacybescherming?

ChatGPT is een webapplicatie. Alle vragen die iemand stelt, alle antwoorden die terugkomen en alle verdere interactie met de website worden bij het bedrijf OpenAI geregistreerd. Ook verzamelt het bedrijf gegevens over bezoekers, zoals bezoekersstatistieken, momenten waarop iemand inlogt, gegevens over de internetbrowser enzovoort. In de privacyvoorwaarden staat om welke gegevens het gaat.

In het geval van ChatGPT is het goed om te weten dat OpenAI de website presenteert als open test. Het kan alle ingevoerde gegevens gebruiken om het taalmodel achter ChatGPT te verbeteren. Het is dan ook niet verstandig om persoonlijke gegevens en details in te voeren. Wees u hier bewust van en laat dit ook weten aan leerlingen als ze kennis willen maken met ChatGPT.

Hoe weet ik of een tekst is gemaakt met behulp van ChatGPT?

Dit is lang niet altijd te achterhalen en dat is ook één van de redenen waarom ChatGPT de onderwijswereld zo bezighoudt. Wanneer de schrijfstijl in een verslag afwijkt van de gebruikelijke schrijfstijl van een leerling, kan dit duiden op een ChatGPT-tekst. Het is goed om op te merken dat ChatGPT niet zelf ‘nadenkt’: het kan alleen maar echt ogende teksten maken. In de teksten kunnen dus inhoudelijke fouten voorkomen en het taalmodel kan ook geen bronnen checken. Als u ChatGPT vraagt om bronnen, dan zal het in veel gevallen met bronnen komen die echt lijken, maar niet bestaan.

De uitingen van de software zijn uniek; de teksten zijn niet op internet terug te vinden. De standaard plagiaatcheckers werken dan ook niet. Als een leerling slim omgaat met de output van ChatGPT en hier en daar nog iets aanpast, of juist een paar fouten laat zitten voor de geloofwaardigheid, dan wordt het voor leraren lastig om het gebruik van de software op te sporen.

Bestaat er al speciale plagiaatdetectie die het gebruik van ChatGPT opspoort?

Diverse bedrijven ontwikkelen technologie om te detecteren of een tekst door een taalmodel is gemaakt. Er zijn verschillende ontwikkelaars die aan detectietools werken, sommigen daarvan zijn ook al op de markt. Waar voorheen het detecteren vooral mogelijk was met Engelse teksten, werken er nu ook partijen aan detectietools voor Nederlandstalige teksten.

Taalmodellen worden echter ook steeds beter, dus detectietools moeten zich blijven vernieuwen om de ontwikkelingen bij te benen. De vraag is waar dit eindigt; misschien wordt het op termijn onmogelijk om teksten van een taalmodel op te sporen.

Dan is er nog de vraag wat er met de uitkomsten van een detectietool wordt gedaan. De tools kunnen alleen een indicatie geven met een bepaalde mate van zekerheid. Het is geen daadwerkelijke 100%-detectie. De tool maakt een eerste check mogelijk en geeft een oordeel (real/fake) zodat de leerkracht snel kan zien of een leerling wellicht gebruik heeft gemaakt van ChatGPT om er vervolgens zelf nog een nadere analyse op los te laten. Er bestaat dus ook de mogelijkheid dat een echte tekst als gegenereerd kan worden aangewezen. Het is van belang om de inschatting van een detectietool nooit als enige graadmeter te gebruiken.

Hoe ga ik om met leerlingen die een verslag schrijven via ChatGPT?

Als een leerling of student een tekst inlevert die vermoedelijk via ChatGPT is geproduceerd, dan is dat in ieder geval aanleiding voor een gesprek. Klopt het dat ChatGPT eraan te pas kwam? Waarom? Is de software voor een specifiek onderdeel gebruikt? Kortom: het is goed om te checken of een leerling ChatGPT heeft gebruikt en zo ja waarvoor, en dus niet zomaar aan te nemen dat dat is gebeurd. Want dat doet de vertrouwensrelatie met de leraar natuurlijk geen goed.

De mogelijkheden van grote taalmodellen vragen hoe dan ook om een kritische en creatieve kijk op onderwijs en toetsing. Er zijn misschien andere manieren om te achterhalen wat een leerling weet en wat hij of zij van de stof heeft begrepen. Denk aan presentaties, mondelinge toetsvormen, enzovoort. Of overweeg om ChatGPT juist een prominentere plaats te geven in taalonderwijs en onderwijs in digitale vaardigheden. De chatbot kan dan een onderzoeksobject worden. Welke resultaten geeft ChatGPT en wat vinden we daarvan?

Bij digitaal toetsen is het mogelijk om devices zo in te stellen (kiosk-modus) dat een leerling tijdens een toets geen toegang heeft tot ChatGPT.

Waarom kan ChatGPT rekenen op aardig wat kritiek?

Hiervoor bespraken we al de voor- en nadelen van ChatGPT voor het onderwijs. Er zijn ook algemene kritische noten te kraken over het gebruik van dergelijke technologie. We geven ze mee ter overweging.

ChatGPT gebruiken: welk advies geeft Kennisnet?

Hoewel we nog niet weten wat ChatGPT en grote taalmodellen uiteindelijk gaan betekenen voor het onderwijs, geven we hier toch enkele algemene adviezen en overwegingen.

Deel deze pagina: FAQ ChatGPT: veelgestelde vragen over ChatGPT in het onderwijs

Delen
  • LinkedIn
  • Facebook
  • Twitter
  • E-mail