NPSO-dag toont hoe nieuwe generatie onderzoekers naar dataverzameling kijkt
Mooie kans
Barry Schouten, methodoloog bij het CBS, is al sinds de oprichting in 2008 betrokken bij het NPSO. ‘Met deze dag willen we een platform bieden aan jonge onderzoekers om tussentijdse resultaten te delen met geïnteresseerden,’ legt Schouten uit. ‘Het NPSO telt ongeveer 900 leden, waaronder gemeenten, provincies, hogescholen, universiteiten en commerciële partijen die marktonderzoek doen. Een mooie kans om contacten te leggen.’ Het CBS kijkt ook nauwlettend naar de bevindingen die tijdens de innovatiedag worden besproken. ‘Wij zijn altijd op zoek naar manieren om onze onderzoeksmethodes te verbeteren.’Toekomst
In totaal vertelden twaalf jonge methodologen over hun werk. Harm Hartman, hoofd van het datateam bij onderzoeksbureau Ipsos I&O, reflecteert op de presentaties en wat die zeggen over de toekomst van het vakgebied. ‘De geschiedenis van marktonderzoek is technologisch gedreven, met name op het gebied van dataverzameling,’ vertelt hij. ‘In de jaren 2000 maakte de opkomst van het internet het gebruik van access panels en websurveys mogelijk. Daarna kwamen de grootste vernieuwingsmogelijkheden door de mobiele telefoon.’ Zo kan bijvoorbeeld informatie over hoeveel mensen bewegen worden afgelezen van hun smartphone zonder dat zij daar vragen over hoeven te beantwoorden.Hartman ziet met de komst van cloud computing, data science en AI voor het eerst grote veranderingen aan de analytische kant van de onderzoeksmethode, zoals data fusie en synthetische data. ‘Met behulp van Machine Learning (ML) maken we synthetische datasets die niet bestaan uit echte respondenten,’ zegt Hartman. Deze datasets worden genereerd op basis van publieke data (van bijvoorbeeld het CBS), bestaande studies en eerdere reacties van personen. ‘Met behulp van Large Language Models (LLM’s) zijn we zelfs in staat om direct met deze synthetische respondenten te corresponderen.’
Synthetische data en respondenten
‘Een aantal van de PhD-onderzoekers probeert erachter te komen of deze methode nu al bruikbaar is’, vertelt Jim Achterberg, eveneens werkzaam als onderzoeker bij het CBS en promovendus bij de Universiteit van Leiden/UMCG (Universitair Medisch Centrum Groningen). Volgens Achterberg kan synthetische data een uitkomst bieden bij de beoordeling van nieuwe medische technologieën. ‘Deze onderzoeken lopen vaak tegen privacy-problemen aan, of tegen data die niet volledig is en dus niet bruikbaar,’ zegt Achterberg tijdens zijn presentatie. ‘Synthetische data is niet verbonden aan echte personen, dus privacy is dan geen issue, al moet je het altijd wel controleren of het beschermen van de privacy goed gelukt is. En waar data ontbreekt kun je die zelf aanvullen.’Charlotte Müller van de Universiteit Utrecht richt zich in haar onderzoek op de vraag of door AI gegenereerde ‘synthetische respondenten’ echte personen zouden kunnen vervangen. Een methode die vooral aantrekkelijk is voor commerciële partijen, aangezien het marktonderzoek goedkoper en sneller zou maken. Müller ziet echter dat werken met synthetische respondenten momenteel nog niet goed mogelijk is. Uit analyses blijkt dat LLM’s grote onnauwkeurigheden en vooringenomenheden vertonen. Alleen wanneer de synthetische respondenten nauwkeurig en gedetailleerd worden getraind met antwoorden van echte respondenten, is de methode bruikbaar. ‘Maar ook dan zijn er beperkingen,’ concludeert Müller.
Winnaar
Aan het einde van de middag stemt het publiek op het meest innovatieve project. De winnaar, Daria Dementeva van de KU Leuven, krijgt een door het CBS gesponsorde prijs voor haar studie naar omgevingsfactoren van respondenten. Volgens Schouten is dat een erg interessant project. ‘Dementeva probeert een manier te vinden om de invloed van iemands omgeving mee te nemen in verschillende soorten surveyonderzoek.’ De manier waarop mensen naar hun werk reizen, hoeveel groen zij in hun woonomgeving zien en of zij veel buren hebben: ‘Allemaal aspecten die invloed hebben op de antwoorden die mensen geven tijdens een onderzoek,’ zegt Schouten. De techniek van Dementeva om deze aspecten mee te nemen zou voor verschillende CBS-databases relevant kunnen zijn. ‘Denk bijvoorbeeld aan het onderzoek naar tijdbesteding of naar de mobiliteit van Nederlanders. Als al die gegevens aan elkaar gekoppeld zouden kunnen worden, levert ons dat veel nieuwe informatie op.’Relevante links
- Artikel - Jonge wetenschappers in de schijnwerpers met veelbelovende innovaties
- Privacyregels CBS - Privacy
- Website - NPSO - NPSO