'Gedrag komt in big data naar ons toe'

15 augustus 2017

Juriste Gineke Wiggers wil de verwachte impact van juridische artikelen voorspellen. Carel Stolker, rector van de universiteit én vakgenoot van Wiggers, is enthousiast over het onderzoek. ‘Met zo’n big data project kunnen we er beter achter komen wat ons werk doet voor de maatschappij.’

Waar gaat dit onderzoek over?

Gineke Wiggers (GW): ‘Ik wil voorspellen welke publicaties de grootste impact gaan hebben op het werk van juristen. Dat wil ik doen met gebruiksgegevens van publicaties uit een juridische zoekmachine. Op dit moment wordt de relevantie vastgesteld met gegevens als ‘hoe vaak komt de zoekterm voor’, ‘waar in de tekst staat de term’ en ‘hoe oud is het resultaat’. Maar dat zijn tekstuele kenmerken. Ik ga nu dus kijken welk kenmerk van het gebruik het sterkst verband houdt met latere citaties, en hoe je die informatie kunt gebruiken om de ranking te verbeteren. Dus bijvoorbeeld of het gaat om de absolute aantallen lezers, ofwel de hoogte van de piek, of om de breedte: over welke periode wordt het artikel gelezen’.

Carel Stolker (CS): ‘Dus stel je hebt een zoekmachine als Navigator of Legal Intelligence, en ik zoek op ‘verjaring’ van artikel 3:310 van het Burgerlijk Wetboek, dan maakt de zoekmachine voor mij automatisch een ranking in de resultaten?’

GW: ‘Klopt. Ik heb geanonimiseerde gegevens ter beschikking gekregen van Legal Intelligence. Daarvan maakt meer dan de helft van de hele beroepsgroep gebruik. Legal Intelligence houdt bij welke artikelen wanneer gelezen zijn en welke artikelen waar en hoe geciteerd zijn. En aan de hand daarvan kan ik – hoop ik – een model maken om die ranking te verbeteren. Dan kun je in een vroeger stadium juist die artikelen onder de aandacht van gebruikers brengen. Zo vinden zij sneller de informatie die ze nodig hebben.’

Dat is niet heel gebruikelijk onderzoek voor een jurist…

GW: ‘ Ik zit sinds 1 mei in het Data Science Research Programme van de Universiteit Leiden. Dat heeft ook een educatieve component. Dus ik volg nu een cursus statistical learning. Daarin leer ik grenzen afbakenen, het juiste model kiezen en vaststellen hoe betrouwbaar een model is. Zo ga ik uiteindelijk zelf een classifier bouwen, het model dat de ranking van de publicaties bepaalt.’

Gineke Wiggers maakt een model dat de verwachte impact van publicaties voorspelt voor een juridische zoekmachine.

Welke invloed zou zo’n model kunnen gaan hebben op het vakgebied?

CS: ‘Enorm. Een van de mooie dingen van het Recht vind ik dat het wetenschappelijk onderzoek en de rechtspraktijk zo met elkaar verweven zijn. Collega’s binnen onze faculteit zijn ook rechter-plaatsvervanger, wetgever of advocaat, of ze zitten in het bedrijfsleven. Dus alles wat wij publiceren, wordt gelezen door de praktijk. Maar voor de mensen die alléén in die praktijk zitten, is het wel belangrijk om te weten wat ze kunnen vertrouwen. Wat is goed wetenschappelijk onderzoek en wat is zwak. Nu weten we dat grosso modo door de reputatie van de tijdschriften, maar dat kan best wel eens gaan veranderen. Denk aan de alternatieve vormen van publiceren die aan het ontstaan zijn.’

Maar kun je dat wel beoordelen met het aantal keren dat een artikel wordt gelezen?

CS, glimlachend: ‘Dat is dan een belangrijk deel van Ginekes opdracht. Zij moet ervoor zorgen dat dat model betrouwbare resultaten geeft.’

GW: ‘Onderzoek in andere vakgebieden heeft al aangetoond dat er een verband bestaat tussen het gebruik van publicaties en het aantal citaties, ofwel wat eigenlijk het wetenschappelijk oordeel over een publicatie is. Mijn onderzoek zal vaststellen of dat verband ook bestaat in het juridisch domein, met die grote verwevenheid tussen wetenschap en praktijk. Een volgende vraag is dan of dat verband significant genoeg is om de ranking in zoekresultaten te verbeteren.’

CS: ‘Eigenlijk heb je het over een soort relatieve bruikbaarheid of valorisatie van de zoekresultaten. Een systeem dat mensen in de wetenschap en de praktijk helpt om hun weg te vinden in dat woud van publicaties.’

Wat zouden in de toekomst mooie toepassingen kunnen zijn van data science in de Rechtsgeleerdheid?

CS: ‘Met behulp van data science gaan wij juristen er achter komen welke invloed we nu echt hebben op de maatschappij. We hebben in de loop der eeuwen kathedralen gebouwd van wetgeving. Die wetgeving is bedoeld om het gedrag van mensen te beïnvloeden: wat willen we dat ze wel of niet gaan doen, of wat ze ánders gaan doen? Maar wat wij als juristen eigenlijk nooit hebben gedaan, is dat goed checken. In de VS gebeurt dat meer. Die meer sociaal-wetenschappelijke tak van het recht heet socio-legal studies. Wat doen bijvoorbeeld al die artikelen over burenrecht nu eigenlijk met mensen die daadwerkelijk naast elkaar wonen? Die kennis gaan we nu misschien beter krijgen, want gedrag komt in big data naar ons toe. Het Recht wordt daarmee compleet.’

Gineke Wiggers is aangesteld binnen het Data Science Research Programme. Hoe is dit onderzoeksprogramma eigenlijk tot stand gekomen?

CS: ‘Elk jaar gaan we als college van bestuur twee dagen op pad met faculteitsbesturen en wetenschappelijk directeuren. Twee jaar geleden kwam tijdens die dagen een paar decanen naar me toe. “We moeten meer doen met data science”, zeiden ze. “Als wij nou allemaal een promotieplek ter beschikking stellen, kan de universiteit dat centraal dan ook doen voor elke faculteit?” Tot diep in de nacht hebben we samen zitten nadenken hoe we dit konden aanpakken. Dat werd uiteindelijk het Data Science Research Programme. Met nu al meer dan 14 aio’s!’

Welke waarde heeft het programma voor onze universiteit?

CS: ‘Het is ontzettend mooi dat er collega’s uit alle faculteiten bij betrokken zijn. Onderzoekers vanuit allerlei vakgebieden, zoals Gineke en haar hoogleraren. Ik verwacht dat er tussen die wetenschappers samen een soort nieuw, noem het maar, onderzoeksschooltje gaat ontstaan. Ze kunnen van elkaar leren en hun onderzoek verbeteren. Maar meer nog hoop ik dat ze hun gedachten over het belang van big data kunnen zaaien binnen hun eigen faculteiten, door er met al hun collega’s over te spreken. Op deze manier kunnen we in Leiden en Den Haag mee in de nationale en internationale voorhoede op dit terrein, over de volle breedte van onze zeven faculteiten.’