Mare Nummer 13     03 december 2009

13
Boeven voorspellen
Informatici graven zich een weg door politiegegevens

Door slim te spitten in een database met misdadigers, is het mogelijk om uitspraken te doen over iemands toekomstige carričre. ‘Het is de vraag of dat juridisch mogelijk en ethisch wenselijk is.’

DOOR BART BRAUN Stel dat je bij de maffia wilt, hoe pak je dat dan aan? Op startersdagen kom je nooit eens recruiters tegen van de georganiseerde misdaad. Toch werken daar mensen. Het zou zomaar kunnen dat een universitaire opleiding in deze branche minder goed op je CV staat dan een criminele carričre. Dat misdadigers pas na een aantal overvallen en wat tijd in de gevangenis de overstap maken, bijvoorbeeld.

Als een bepaald soort misdadigers een sterk verhoogd risico loopt om zich aan te sluiten bij de maffia, dan willen criminologen en beleidsmakers dat heel graag weten. Daar kan dan bij de reclassering extra aandacht aan besteed worden, bijvoorbeeld. Het grote probleem is: hoe weet je dat? Je kunt veroordeelde topcriminelen ondervragen, maar die staan niet bekend om hun spraakzaamheid.

Je kunt ook aan de slag gaan met de gegevens die je al hebt. De politie heeft een database met alle Nederlanders die sinds 1986 zijn veroordeeld voor een misdrijf, of in de afgelopen zes maanden verdacht zijn van een misdrijf. Ongeveer een miljoen mensen, samen met hun demografische gegevens en criminele verleden. Een gigantische berg data, waarin een gewone sterveling door de bomen het bos niet meer kan zien.

Een computergestuurde techniek om wegwijs te worden in een oerwoud van gegevens heet data mining. Verzekeraars doen het met hun klantenbestand, om makkelijker fraudeurs te kunnen vinden. Supermarkten doen het met boodschappen, Bol.com geeft u boekentips door aankopen te vergelijken met die van andere mensen die dezelfde boeken kopen. De politie zou het ook kunnen doen.

Informaticus Tim Cocx promoveerde woensdag op zulke technieken voor criminaliteitsbestrijding. ‘Een programma dat zoekt naar onverwachte verbanden die vaak voorkomen’, zo licht hij toe: ‘Wordt iemand die graffiti spuit later een verkrachter, of juist niet?’

In zijn proefschrift staat maar een handjevol van zulke relaties. Mensen die opgepakt worden voor doodslag, zijn opvallend vaak al eerder in aanraking gekomen met de politie vanwege racisme. De vrouwen in de database zijn significant vaker verslaafd aan drugs dan mannen. Joyriders worden vaker veroordeeld voor het overtreden van de arbeidswet. ‘Ik vond dat opvallend’, zeg Cocx. ‘Of het voor criminologen ook interessant is, weet ik niet.’

Hij vervolgt: ‘Er staan bewust weinig van zulke verbanden in, omdat wij de gegevens op vertrouwelijke basis kregen, en de gegevens ook nog eens vertrouwelijk zijn. Ons doel is ook niet om zulke dingen bekend te maken, want wij zijn geen criminologen. Op congressen hebben wij informatici het juist over de beperkingen van data over law enforcement, en hoe je daarmee omgaat bij het ontwikkelen van je methodieken.’

Cocx paste bekende algoritmes aan. Het probleem is namelijk dat de programma’s kijken naar verbanden die vaak voorkomen. ‘Maar 85% van de mensen in de database is man, dus elke combinatie met een vrouw is per definitie zeldzaam. Als echter tachtig procent van die vijftien procent drugsverslaafd zou zijn, is het wel interessant.’ Daarnaast levert de standaardmethode een hoop standaardverbanden op: ‘Mensen met een Surinaamse achtergrond zijn bijvoorbeeld significant vaker geboren in Suriname. Maar als er een groot verschil in criminaliteit is tussen Surinamers uit Amsterdam en uit Paramaribo, wil je dat weer wel weten.’

Cocx is terughoudend om over zijn onderzoek te praten. ‘Dat heeft ermee te maken dat het niet onze gegevens zijn. Maar ook met het activistische karakter van mensen die hier moeite mee hebben. Het is Minority report, zeggen ze dan.’ The Minority Report is een kort sciencefictionverhaal van Philip K. Dick over een toekomst waarin misdaden worden voorkomen met behulp van een team van helderzienden.

Cocx: ‘We hebben zelfs overwogen om een namaak-database op te zetten. Voor mij is het vooral interessant om uit te zoeken of de bestaande algoritmes hiervoor toepasbaar zijn. Gebruik is niet het doel. De politie heeft ons ook niet gevraagd om zo’n programma. Gelukkig maar, want anders moet ik me zorgen gaan maken of ik wel goed genoeg adviseer. In mijn vak is 88% procent nauwkeurigheid heel goed, maar 12% mis is hier heel erg. Als een supermarkt op grond van data mining van de boodschappen een reclamecampagne start met 88% kans op succes is dat prima, ook als het mislukt. De supermarkt neemt zelf ook aan dat het af en toe mislukt. Daar hoef ik ze niet met de neus op te drukken.’

En het monitoren van verdachten? ‘Het is de vraag of dat juridisch mogelijk en ethisch wenselijk is. In Nederland mag data alleen gebruikt worden voor het doel waarvoor het verzameld is, tenzij er sprake is van een zware verdenking. Dat is bij data mining per definitie niet het geval.’

‘Het is niet zo dat we mooie dingen voor de politie hebben ontdekt’, benadrukt Cocx. ‘Er wordt nu niemand opgepakt.’


Deel op Facebook

Tweet
Deel op Facebook