I. Ongeloof, protest en boosheid
‘Als ik op de universiteit lezingen geef over AI kan ik vaak mijn verhaal niet afmaken omdat er boze docenten in de zaal zitten die in opstand komen’, zegt Marc Cleiren. ‘Volgens hen is AI crap.’ Maar Cleiren betoogt juist dat het onderwijs nooit meer zal worden zoals het was. ‘Dat proces is onomkeerbaar.’
Behalve AI-adviseur van de faculteit Sociale Wetenschappen is hij ook universitair hoofddocent gespecialiseerd in rouw. En als het over de toekomst van het onderwijs gaat, komen die twee samen, betoogt hij. ‘Bij een deel van de docenten wiens identiteit met onderwijs is verweven veroorzaakt dat gevoelens die lijken op die van rouwende mensen: ongeloof, protest en boosheid.’
De universiteit ontkomt er niet aan om een strategie en regels te ontwikkelen om met AI om te gaan. Studenten grijpen massaal naar steeds nieuwere versies van ChatGPT, Claude en Gemini: taalmodellen die steeds sterker worden en waarvan het gebruik steeds moeilijker is te detecteren. Daarom zullen docenten op zoek moeten naar andere manieren om kennis en vaardigheden aan te leren én te testen. Tegelijkertijd biedt AI ook kansen voor beter onderwijs, gerichter onderzoek en kan het allerlei tijdrovende klusjes overnemen.
Hoe radicaal AI de academie gaat veranderen, daarover zijn de meningen verdeeld. De universiteit moet in ieder geval accepteren dat het niet zal verdwijnen, stelt Alexander Djurrema, bachelorstudent Data Science and AI. ‘We moeten samen leren hoe we ermee kunnen werken en niet ertegen.’
Om ‘het juiste gebruik van AI te promoten’ richtte hij samen met Nicolás Rodríguez en twee andere medestudenten het Leiden Universal Network for Innovation and AI Exploration (LUNIX) op. ‘Het gaat erom dat we moeten weten hoe we met chatbots moeten praten en begrijpen wat hun beperkingen zijn’, legt Rodríguez uit.
‘Je kan het prima gebruiken voor het verkennen van mogelijke titels voor literatuurreviews, het checken van spelling en een bepaalde mate van analyse’, stelt Christine Moser, hoogleraar Sustainable Organizing, die onlangs in Leiden sprak over de toepassing van AI in het hoger onderwijs. Maar menselijke interventie zal volgens haar altijd essentieel blijven. ‘Dat AI hallucineert zal niet verdwijnen.’
Cleiren heeft wel vertrouwen: ‘Als ik een degelijke app goed instrueer, krijg ik een rapport dat echt niet onderdoet voor een stuk waarmee een deskundige op de proppen komt. AI is een hulpje dat tegenwoordig slimmer kan zijn dan de student én de docent.’
II. Stoppen met grote colleges en tentamens
Het werk van de docent gaat hoe dan ook fundamenteel veranderen door de technologie, stelt Cleiren. ‘Onze rol wordt het orkestreren en regisseren van zowel studenten als AI. De docent moet daarvoor op een hoger didactisch niveau gaan werken: visie hebben op hoe studenten optimaal leren en welke problemen zij tegenkomen om tot kennis te komen.’
De universiteit is volgens hem niet voldoende voorbereid op die rol. ‘Helaas wordt de staf voornamelijk opgeleid in onderzoek. In het nieuwe Spuigebouw zie je bijna alleen maar collegezalen. Al het onderwijs lijkt nog te zijn gericht op doceren aan grote groepen studenten. Dat gaat juist verdwijnen door AI.’
En dat geldt wat hem betreft ook voor tentamens. ‘In het onderwijs bestaat het onzalige idee dat we studenten vaak tussentijds moeten toetsen voor cijfers. We moeten ons daar juist minder op richten en meer de nadruk leggen op het vormen van de student. Veel studenten starten met het idee dat ze iets willen leren, maar door veel te tentamineren krijgen ze geen tijd en ruimte om dat goed te doen, dus grijpen ze onder stress snel naar de apps.’
Een scriptie schrijven is geen valide test van kennis meer, vindt hij. ‘Je moet er komen door een socratisch gesprek, lijkend op de verdediging van een proefschrift. Dat kan als AI taken van docenten overneemt, of als de apps voor individuele kennisbegeleiding zorgen, waarvoor de docenten zelf nooit tijd hebben.’
De prioriteit van veel docenten ligt vooralsnog bij het AI-proof maken van de toetsing. ‘Veel docenten experimenteren met het heel ouderwets afnemen van tentamens met pen en papier’, zegt Moser. ‘Ook mondelinge toetsing speelt een belangrijke rol.’
‘Dat is echter problematisch als het gaat om eerlijk toetsen’, vindt universitair docent bestuurskunde Andrei Poama. ‘Sommige studenten zijn heel goed in mondelinge examens, bluffen zich daar doorheen. Anderen zijn juist verbaal minder sterk. Je kunt ook schriftelijk vervolgvragen stellen, dan ben je minder afhankelijk van de verbale vaardigheden van de student.’
III. Wantrouwen voorkomen
Poama is een van de initiatiefnemers van het project Fair Educational Assessment in the Age of AI (FAIR-ASSESS) waarin medewerkers en studenten van de zeven Leidse faculteiten de uitdagingen rondom AI onderzochten. ‘Het gaat ons vooral om de vraag: wat zijn eerlijke vormen van toetsing nu AI op grote schaal beschikbaar is?’
Hij vindt het bijvoorbeeld heel spijtig dat zijn opleiding vanwege de fraudegevoeligheid minder gebruik wordt gemaakt van take-home-essays. ‘Een essay schrijf je bij voorkeur niet in twee à drie uur in een tentamenzaal. Je wilt wat rondwandelen, even kauwen op de opdracht en een tijdje goed kunnen nadenken. We zouden iets van een assessment bootcamp kunnen opzetten. Dat je een dag krijgt om een essay te schrijven op de universiteit, maar dat je ook tussendoor kunt gaan lunchen. We moeten in ieder geval voorkomen dat we naar een academisch klimaat gaan waarin we studenten gaan wantrouwen.’
Om toetsing eerlijk en valide te houden is er sowieso meer tijd per student nodig, zegt collega en mede-organisator Josette Daemen. ‘Daar is geen financiering voor en het ziet er niet naar uit dat dat gaat veranderen. Juist tijdgebrek zal de negatieve kanten van AI-gebruik versterken. Dat geldt voor studenten en docenten. Als we niet meer tijd krijgen, rijst er bij mij toch wel een dystopisch beeld op van de ontwikkeling van AI-gebruik in het hoger onderwijs.’
Deze maand verscheen het FAIR-ASSESS-rapport met aanbevelingen voor regulering van AI. ‘Je kunt concrete regels invoeren’, zegt Daemen. ‘Aan de Universiteit van Amsterdam is er bijvoorbeeld een instituut dat de regel heeft dat vijftig procent van de beoordelingen van studenten met een AI-proof methode moet gebeuren.’ Dat zou bijvoorbeeld een ‘ouderwets’ tentamen kunnen zijn.
Verder is van belang dat studenten ‘AI-geletterd’ zijn, aldus Daemen: ze moeten niet alleen weten hoe het werkt, maar ook wat de tekortkomingen en de ethische implicaties van het gebruik zijn. Tijdens bijeenkomsten van het project kwam naar voren dat het essentieel is dat er veel ruimte moet blijven voor eigen invulling door faculteiten, instituten en docenten.
‘Het is aan de docenten zelf om te bepalen wat de impact van AI is op hun veld. Een wetenschapper die bij computer science werkt, vertelde bijvoorbeeld dat het heel raar is om AI niet te gebruiken voor coderen. Maar bij Geesteswetenschappen waar de focus op schrijven ligt, is het redelijk dat je heel terughoudend bent in het gebruik toestaan.’
IV. Pedagogische assistenten
AI kan het onderwijs wel degelijk verbeteren, ondervonden studenten bij Data Science & AI. ‘Bij het vak calculus kregen wij een op maat gemaakt large language model dat was getraind op al het lesmateriaal’, vertelt Rodríguez. ‘Het geeft nooit direct het antwoord, maar fungeert als assistent zodat de student uiteindelijk zelf tot het juiste antwoord kan komen.’
Leiden loopt voor bij de ontwikkeling van zogenoemde Pedagogical AI Assistants (PAIA’s), legt Cleiren uit. ‘Bij bepaalde vakken gebruiken we bijvoorbeeld de Research Refiner. Als een student onderzoek wil uitvoeren, gaat deze het gesprek aan met de app, maar wel pas na zelf het thema en de richting te hebben bepaald. De Refiner zet hen vervolgens aan het denken: “Hoe wil je dat onderzoek opzetten? Wie wil je benaderen?”’
Liesbet Winkelmolen, universitair docent bij Dutch Studies, ontwikkelde voor haar studenten de chatbot Lela Groen. ‘Mijn studenten vinden het moeilijk om met Nederlanders te praten, omdat hun taal nog gebrekkig is’, legt ze uit. ‘Hoe ideaal is het dat ik mijn studenten kan laten chatten op hun eigen niveau met een bot die ook hun soms gebrekkige zinsconstructies herkent?’
Aanvankelijk was Winkelmolen enthousiast, maar toch zag ze ook nadelen. ‘Studenten vonden het leuk, maar praatten er alleen mee als ik het ze vroeg; thuis gingen ze er niet mee aan de slag.’ Ook zegt ze dat het invoeren van nieuwe woorden ‘klereveel werk’ is en dat ze haar studenten liever met echte mensen ziet praten.
Of haar studenten dankzij Lela Groen de taal sneller leren, kan ze niet zeggen. ‘Daar zijn onze groepen te klein voor. We moeten echt nog uitproberen wat wel en niet werkt. Iets leren kost tijd en moeite, ook met AI. We moeten niet denken dat dit de oplossing is voor alles.’
Toch is hoogleraar technologie en privaatrecht Tycho de Graaf, tevens lid van het AI-kernteam bij de faculteit Rechten, positief. ‘Voor het vak verbintenissenrecht heb ik AI gevraagd bepaalde arresten op rechtspraak.nl samen te vatten, en ze in een illustratie te laten zien in de huisstijl van de universiteit, toegespitst op tweedejaars.’ Het achterliggende idee – één beeld zegt meer dan duizend woorden – werkte, merkte hij. ‘Voorheen plukte ik stockfoto’s van internet, nu zijn de illustraties veel meer toegespitst op de inhoud. Daardoor onthouden studenten de arresten ook beter.’
Kernteamvoorzitter en docent arbeidsrecht Marije Schneider laat studenten AI gebruiken om feedback te geven op hun eigen essays. ‘Vervolgens leveren ze hun essay in samen met de door AI gegenereerde feedback. Daarna geef ik feedback op de essays, waarna we klassikaal mijn feedback met die van AI vergelijken.’
‘Ik vraag ook metafeedback aan AI. Met toestemming van de studenten upload ik hun essays en vraag ik AI om de top twintig gebruikte bronnen op te halen, waar het misgaat in de argumentatie, in hoeverre ze zich aan de opdracht hebben gehouden en hoe ik mijn didactiek kan verbeteren zodat de resultaten van de essays de volgende keer dichter bij de opdracht liggen. Ik bespreek de AI-feedback ook klassikaal.’
De feedback van AI komt vaak overeen met die van haarzelf, oordeelt ze. ‘Maar ik ben niet overbodig. De studenten zeggen zelf ook dat ze mijn feedback doorgaans fijner vinden omdat die duidelijker en concreter is.’
‘Het leuke is dat je ook de “temperatuur” van die feedback kunt bepalen’, weet bestuurskundige Poama. ‘Je kunt de reacties humoristisch of een beetje passief-agressief en kritisch maken. AI moet geen hielenlikker zijn, en dat zijn de commerciële apps wel. Die vinden zelfs de domste vraag die je stelt nog geweldig.’
V. Zelf apps bouwen of zelf nadenken?
Verschillende toepassingen kunnen onderzoek doen aanzienlijke vergemakkelijken, vertelt De Graaf. ‘Agentic AI neemt je browser over en zoekt op basis van je opdracht zelf bronnen op. Door AI drie bronnen tegelijk te laten opzoeken of voetnoten op de juiste wijze te laten noteren in de bibliografielijst boek ik tijdwinst. In plaats van dat ik me moet bezighouden met dit soort suffe taken kan ik me concentreren op lezen, ideeën genereren en schrijven.’
‘Ik heb zelf een demo-app AcademiCheck gebouwd waarmee je de kwaliteit van rapporten, scripties en papers op verschillende niveaus kunt beoordelen’, zegt Cleiren. ‘Het bouwen kostte me een uur. Als Capgemini en Deloitte een rapport doorlichten, rolt er echt geen betere analyse uit.’
Niet iedereen deelt dat enthousiasme. ‘Ik gebruik AI heel weinig voor inhoudelijk onderzoek’, zegt bestuurskundige Poama. ‘Soms voer ik een prompt in om te kijken of er wellicht vakliteratuur is die ik heb gemist. Voor het creatieve proces pas ik het niet toe. De apps zijn in de politieke filosofie niet erg bruikbaar. Het maakt je ook dommer en dat wil ik niet.’
Hij ziet het gebruik van AI wel opduiken in zijn vakgebied. ‘Ik ben redacteur van het vakblad Ethical Theory and Moral Practice en we kunnen te maken krijgen met ingezonden stukken die wellicht met AI zijn geschreven. Het is verdacht als de artikelen inhoudelijk heel vlak zijn en veel vakjargon bevatten: daar is AI sterk in. Maar die ontwikkeling kan ook goed zijn voor ons veld. Het kan betekenen dat we al die clichés leren vermijden en creatiever gaan schrijven.’
‘AI heeft veel informatie ontsloten voor iedereen en zorgt tegelijkertijd voor de productie van veel troep’, concludeert bestuurskundige Daemen. ‘Het is juist nu voor mij nog duidelijker geworden hoe waardevol origineel, transparant en verifieerbaar onderzoek is. We moeten het belang daarvan verdedigen.’
Dit is het slot van een tweeluik over AI aan de universiteit. Lees het vorige deel ‘De fraudeur zit in je broekzak’ terug op mareonline.nl