Wetenschap
Google Translate gebruiken in een talenstudie: valsspelen, of niet?
Studenten gebruiken vaak online vertaaldiensten, maar weten vaak niet of dat wel mag, ontdekte docent Aletta Dorst tijdens haar onderzoek. Niet erg, maar het is wel belangrijk om te weten hoe machinevertalingen werken: ‘Zonder context doet het algoritme maar wat.’
Mark Reid
donderdag 22 september 2022

Stel: je bent als talenstudent bezig een moeilijke tekst te schrijven. Het lukt aardig, maar net dat ene woordje dat je wil gebruiken is lastig te vertalen. Mag je dan Google Translate gebruiken? Of is dat eigenlijk een soort valsspelen?

Dat is het zeker niet, zegt Aletta Dorst, universitair docent bij het Leiden University Centre for Linguistics. Volgens haar zijn machinevertalingen een handig hulpmiddel, maar het is wel noodzakelijk om ze te doorgronden. ‘We leren studenten hoe de catalogus van de Universiteitsbibliotheek werkt. We leren ze hoe Wikipedia werkt. Waarom leren we ze dan niet hoe machinevertalingen werken?’
Dorst, die zelf college geeft over vertalen, zette een onderzoek op en ondervroeg studenten van de faculteit Geesteswetenschappen naar hoe zij met Google Translate en andere online vertalingsdiensten omgaan in hun studie. ‘Ik hoor vaak dat ze het liever niet aan hun docent vertellen. Ze hebben het idee dat ze valsspelen en dat je het zelf moet kunnen.’

Dat beeld wordt bevestigd door het onderzoek. Zo bleek dat het overgrote deel van studenten vertaaldiensten als Google Translate gebruikt bij studieopdrachten, maar dat bijna niemand wist of het wel mocht.

Slecht woordenboek

Jammer, vindt Dorst. ‘Ik vind dat docenten een stuk explicieter moeten zijn over wanneer studenten gebruik mogen maken van machinevertalingen. Bijvoorbeeld als je huiswerk doet, mag het wel, maar bij het tentamen niet. Zet dat eens duidelijk in de syllabus of in de studiegids. Studenten moeten nu gokken wat er wel en niet mag.’

Volgens haar biedt het ook juist kansen voor onderwijs. ‘Je kunt studenten machinevertalingen laten analyseren en toetsen of ze in staat zijn om fouten te vinden en te verbeteren. Daarmee verbeteren ze ook hun eigen taalvaardigheid.’

Uit het onderzoek bleek wel dat studenten Google Translate voornamelijk als woordenboek gebruiken, terwijl dat volgens Dorst precies is wat je niet moet doen. ‘Dat leer ik ze meteen af, want dat is niet waarvoor de dienst is gemaakt (zie kader). Je krijgt een synoniem in een andere taal, maar dat legt niets uit. Machinevertaling werkt op basis van context, dus zonder context doet het ding maar wat. Zo’n algoritme heeft geen kennis van de wereld: een zinnetje als “hij zit in de put” zal het altijd letterlijk interpreteren. Wij als mensen snappen natuurlijk dat iemand dan depressief is, maar een machine niet.’

Vertaalbaan van de toekomst

Ook moet de gebruiker ervan bewust zijn dat het algoritme seksistische of racistische vooroordelen heeft. ‘Ik heb wel eens een stukje over mezelf geschreven en naar het Fins vertaald, een taal zonder verschil tussen mannelijke en vrouwelijke voornaamwoorden. Toen ik het weer terugvertaalde naar Nederlands was ik in de tekst opeens een man geworden omdat ik dokter had gebruikt. En als je dat doet bij een tekst over koken of schoonmaken word je automatisch vrouwelijk.’

Maar omdat machinevertalingen steeds meer zullen worden gebruikt, moeten studenten er goed op voorbereid zijn, vindt Dorst. ‘Er zijn mensen die teksten herschrijven zodat ze daarna met een machine vertaald kunnen worden. Die weten precies hoe je een tekst zo duidelijk opstelt dat een machine ermee aan de slag kan. Korte, duidelijke zinnen zonder beeldspraak. Ik zeg ook tegen mijn vertaalstudenten dat ze zulke banen moeten overwegen. Dat is de vertaalbaan van de toekomst.’

Pas op met persoonsgegevens

Hoewel uit haar onderzoek blijkt dat Google Translate veruit de populairste vertaaldienst is, zet Dorst een flinke kanttekening bij het gebruik van de online tool. Wie een tekst door Google laat vertalen loopt namelijk een flink risico. ‘Zodra je iets door Google Translate haalt mag Google alles doen met de tekst. Je hebt nog wel het intellectueel eigendom, maar Google krijgt alle gebruiksrechten. Ze mogen het opslaan, hergebruiken, delen met derden, publiceren. In feite alles.

‘Als je een brief van de Belastingdienst of je huisarts wil vertalen, verwijder dan al je persoonlijke gegevens. Haal je studentnummer, je naam, je adres en vooral je BSN weg.’

Wie dat niet doet, loopt het risico dat vertrouwelijke of persoonlijke stukken opeens terug te vinden zijn. Zo was een Noorse journalist in staat interne stukken van een groot bedrijf terug te vinden die via Google Translate waren vertaald.

Dorst: ‘Ik kreeg laatst een vertrouwelijk stuk van een collega en daar stond boven dat het met een machine was vertaald. Dat had ‘ie dus niet moeten doen.’

In plaats van Google zijn er een aantal andere vertaaldiensten die je beter kan gebruiken. Zo heeft vertaaldienst DeepL een licentie die volgens Dorst een stuk veiliger is, maar waar je wel voor moet betalen. Een andere optie is eTranslate, de online tool van de Europese Unie. Alle studenten van Europese universiteiten kunnen daar gratis gebruik van maken.