Data science op een hoger plan door EU-programma

/ Auteur: Miriam van der Sangen
Close-up printplaat
© Hollandse Hoogte / Westend61 GmbH
De Europese Unie stimuleert de internationale uitwisseling tussen data scientists uit de publieke, private en academische sector. In dat kader heeft het CBS een financiële bijdrage van de Europese Commissie ontvangen - een zogenaamde grant - waarmee data scientists tijdelijk bij een ander type organisatie kunnen werken om hun kennis en ervaring verder te ontwikkelen en omgekeerd. Dat levert concrete resultaten op.

Sofie De Broe, hoofd methodologie bij het CBS in Heerlen en wetenschappelijk directeur van het Center for Big Data Statistics (CBDS), maakt zich binnen en buiten het CBS sterk voor de uitwisseling van kennis en ervaring, onder andere door haar personeel te stimuleren tot mobiliteit. ‘Ik ben daar een groot voorstander van. Een periode bij een andere organisatie werken - in Nederland of daarbuiten - is steeds een verrijking en houdt je flexibel. Je krijgt nieuwe ideeën en ook de culturele aspecten zijn relevant. Werken in een nieuwe omgeving helpt je om zaken in perspectief te zien.’

Netwerk van data scientists

De Broe is dan ook blij met de toekenning van de grant in het kader van het NeEDS-programma. ‘Dat bestaat uit zes academische participanten en acht industriële partners uit vijf Europese landen, de Verenigde Staten en Latijns Amerika. Het heeft als doel om de data science in Europa en daarbuiten met multidisciplinair onderzoek op een academisch niveau te brengen. Ook wil het de mogelijkheden van data science binnen de industriële en publieke sector op een hoger plan tillen. Het project wordt gecoördineerd door professor Dolores Romero Morales, werkzaam bij de Business School in Kopenhagen. Het CBS neemt er actief aan deel.’

Luchtkwaliteit

Zo ging CBS’er Marc Ponsen naar de ‘Modeling Week on Data Driven Decision Making and Optimization’ van de Business School in Kopenhagen. ‘Het evenement startte met presentaties van internationale bedrijven en overheden’, vertelt Ponsen. ‘Die lieten zien hoe zij omgaan met verschillende datavraagstukken. Namens het CBS heb ik verteld hoe wij demografische data combineren met data over luchtkwaliteit. Dat is een relevant onderwerp voor het beleid met betrekking tot luchtvervuiling.’ Studenten vanuit heel Europa werkten gedurende een week aan de oplossing van de verschillende vraagstukken en presenteerden hun resultaten. ‘Dankzij de interdisciplinaire kennis en creativiteit van de studenten leverde dat waardevolle nieuwe inzichten op. Ook hebben we in Kopenhagen de basis gelegd voor nieuwe netwerken.’

Nieuwe prototypes

Ook Martijn Tennekes is één van de data scientists van het CBS die ervaring opdoet in het buitenland. Hij koos voor een onderzoeksafdeling van de universiteit van Oxford. Daar maakt hij deel uit van een multidisciplinair onderzoeksteam dat zich richt op technologisch onderzoek. ‘Ik bestudeer algoritmen voor de visualisatie van stromen op kaarten. Er zijn veel applicaties binnen de officiële statistiek waar de uitkomsten bestaan uit stromen, bijvoorbeeld over het woon-werkverkeer, transport van goederen en toerisme. Ik wil prototypes voor deze applicaties maken en de algoritmes in de open source software invoeren.’

Visualisaties

Tennekes werkt in Oxford onder begeleiding van professor Min Chen, die is gespecialiseerd in wetenschappelijke datavisualisaties en machine learning. Ook bij de universiteiten van Leeds en de City of Londen deelt Tennekes zijn kennis en ervaring. ‘Bij de universiteit van Leeds ga ik een lezing geven over mobiele telefoniedata en samenwerken op het gebied van visualisaties van forensenstromen. We zullen met name naar omgevingsvriendelijke manieren van transport kijken. Het doel is forensen te stimuleren om met de fiets naar hun werk te gaan in plaats van met de auto. Bij de universiteit van de City of London ga ik aan de slag met een onderzoeksteam dat gespecialiseerd is in visualisaties van ruimtelijke data’.

Waardevol advies

Jonas Klingwort, collega van Tennekes, bezocht onlangs de universiteit van Sevilla en wisselde daar kennis uit met studenten van de faculteit wiskunde, statistiek en onderzoek. ‘Ik had constructieve gesprekken met de studenten die postdoctoraal onderzoek doen bij professor Emilio Carrizosa op het gebied van machine learning-technieken voor big data. Professor Carrizosa heeft me waardevol advies gegeven over een cruciaal probleem dat ik tegenkwam bij mijn projecten. Door mijn bezoek aan Sevilla heb ik bovendien flinke stappen kunnen zetten met mijn promotieonderzoek.’

Active learning

De uitwisseling van kennis en ervaring gaat niet alleen uit van het CBS. Yu Zhang, een PhD-student van de universiteit van Oxford, verricht momenteel bij het CBS onderzoek naar Active Learning. De Broe: ‘Dat is een vorm van mens-computer interactie. Hierbij wordt eerst met een neuraal netwerk een voorzet gedaan om bijvoorbeeld een voorwerp (zonnepaneel/geen zonnepaneel) te detecteren op een beeld. Daarna wordt er door een persoon gekeken of die voorzet correct is. Op basis van de correctie van de mens wordt het model dan weer opnieuw getraind.’

‘Een periode bij een andere organisatie werken is steeds een verrijking en houdt je flexibel’