CBDS en LCDS: samenwerking in data science verdiepen

/ Auteur: Masja de Ree
Jaap van den Herik is een Nederlands informaticus, en is hoogleraar aan de Universiteit Leiden. Hij houdt zich bezig met computerschaak en Kunstmatige Intelligentie.
© Sjoerd van der Hucht Fotografie
Het Center for Big Data Statistics (CBDS) van het CBS werkt samen met het Leiden Centre of Data Science (LCDS) van de Universiteit Leiden. Grondlegger van het LCDS prof. Jaap van den Herik legt uit waarom het belangrijk is om de krachten te bundelen. ‘Data science is een multidisciplinaire wetenschap.’

Wat is data science?

Data science, wat is dat eigenlijk? Prof. Jaap van den Herik: ‘Uit data kun je ontzettend veel kennis afleiden. Nu de hoeveelheden data steeds groter worden en politiek en maatschappij het belang ervan erkennen, ontstaat de behoefte aan nieuwe vormen van wetenschappelijk onderzoek naar het gebruik van data: data science.’ Data science richt zich op een breed spectrum van activiteiten. Van het verzamelen, passend maken en interpreteren van data tot het analyseren en visualiseren. Ook de vraag hoe we data inzetten om complexe vraagstukken op te lossen komt aan bod. Uiteindelijk mondt dat uit in een situatie waarbij vanuit het onderzoek naar data nieuwe verbanden ontstaan en concepten als deep learning. ‘De natuurkunde en de sterrenkunde maakten in feite al veel gebruik van data science, bij het oplossen van vragen over sterrenstelsels bijvoorbeeld. De ontdekking van het Higgs-deeltje is ook een resultaat van data science. De laatste jaren ontwikkelt het vakgebied zich in hoog tempo.’

Samenwerking

Van den Herik is sinds 1988 hoogleraar Recht en Informatica aan de Leidse faculteit der Rechtsgeleerdheid. In 2014 werd dat hoogleraarschap uitgebreid naar de faculteit Wiskunde en Natuurwetenschappen en kreeg hij de opdracht het LCDS op te richten. ‘Het CBS kende ik van mijn hoogleraarschap in Maastricht. In die tijd (de periode 1987-2008, red.) was er al een goede samenwerking en gaf ik bijvoorbeeld advies op het gebied van kunstmatige intelligentie. Toen het LCDS in 2014 van start ging, vroeg het CBS of we mee wilden denken over nieuwe ontwikkelingen.’ Dat deed Van den Herik graag.

‘Alleen door samenwerking, tussen faculteiten maar ook met ministeries en publieke en private instellingen, komen we verder’

Concrete projecten

Maar, zegt de grondlegger van het LCDS: praten is mooi, samen doen is beter. Daarom uit de samenwerking tussen het CBS en het LCDS zich in concrete projecten. Een talentvolle onderzoeker van het CBS voert zijn promotieonderzoek bijvoorbeeld uit bij de Leidse universiteit, in samenwerking met de UvA. Hij doet onderzoek naar de hoeveelheid geld die omgaat in cross border internet-verkopen. Daarnaast lopen studenten van de vakgroep statistiek uit Leiden stage bij het CBS. Het LCDS organiseert ook cursussen bij publieke organisaties en ministeries, die geconfronteerd worden met steeds grotere datasets. Onder meer bij het ministerie van Infrastructuur en Waterstaat (I&W). Ook hier werkt het LCDS samen met het CBS.

Groot netwerk

Het CBS is in de loop van de jaren diverse samenwerkingsverbanden met universiteiten en hogescholen aangegaan. CBS-innovatiemanager Barteld Braaksma: ‘We hebben al lange tijd een band met de Leidse universiteit en we zijn blij dat die steeds sterker wordt, nu ook met de samenwerking met het Leiden Centre of Data Science. Onderzoek naar big data doe je niet alleen. Je hebt er anderen bij nodig. Prof. Van den Herik heeft een enorm netwerk, dat helpt om goede partners te vinden. Bovendien heeft de Leidse universiteit veel kennis op het gebied van big data en andere terreinen die voor het CBS belangrijk zijn, zoals cybersecurity.’

Ondernemend zijn met data

Braaksma verzorgde een deel van de LCDS-cursus voor beleidsmedewerkers van het ministerie van I&W. Daar kijkt hij met plezier op terug. ‘Het thema was: ondernemend zijn met data. Hoe doe je dat als overheidsinstelling? Ik heb een aantal voorbeelden gegeven en vooral laten zien dat het belangrijk is om niet achter je bureau te blijven zitten, maar erop uit te trekken, buiten de gebaande paden te denken. En contacten aan te gaan met mensen en organisaties die relevante datasets, ideeën en kennis brengen. Wij doen dat als CBS graag en we zien dat daar direct weer nieuwe samenwerkingen uit voortkomen.’

Technologie versus maatschappij
Prof. Van den Herik wijst erop dat data science een multidisciplinaire wetenschap moet zijn, die zich uitstrekt over alle faculteiten van de universiteit. ‘Iedereen heeft immers met data te maken en het moet niet zo zijn dat de techneuten de wet voorschrijven aan andere disciplines. Er is een stroming die zegt dat de wereld ‘technology driven’ is. Anderen zeggen dat juist de maatschappij leidend is. Ik ben voor een gelijkwaardige inbreng van beide kanten. Alleen door samenwerking, tussen faculteiten maar ook met ministeries en publieke en private instellingen, komen we verder. Aan die samenwerking wil ik graag bijdragen.’