VU-hoogleraar onderzoekt meetfouten en selectiviteit nieuwe databronnen

/ Auteur: Miriam van der Sangen
Reinoud Stoel is vanaf 1 september 2023 benoemd tot bijzonder hoogleraar aan de VU
© Sjoerd van der Hucht
Het CBS heeft een aantal senior-onderzoekers en methodologen in dienst die in deeltijd ook als bijzonder hoogleraar aan een Nederlandse universiteit werken. De reden: een brug slaan tussen de statistiek en de wetenschap. Reinoud Stoel is er één van. Onlangs werd hij benoemd tot bijzonder hoogleraar op de leerstoel ‘Meetmodellen voor de officiële statistiek: ontwikkeling, toepassing en communicatie’ bij de afdeling Sociologie van de Faculteit Sociale Wetenschappen van de Vrije Universiteit (VU) in Amsterdam. De hoogleraar licht toe wat hij de komende periode gaat doen.

Forensisch onderzoek

Stoel is van huis uit arbeids- en organisatiepsycholoog en gepromoveerd in de psychometrie. Na enkele jaren te hebben gewerkt als universitair docent aan de Universiteit van Amsterdam (UvA) wilde hij zijn wetenschappelijke kennis op een andere manier inzetten. ‘Onderzoek doen en lesgeven is interessant en leuk. Maar ik worstelde met de vraag: moet ik met mijn interesse, kennis en ervaring op het terrein van wetenschap en statistiek niet een andere kant op? Bij het Nederlands Forensisch Instituut (NFI) kon ik aan de slag en daar heb ik vanuit de forensische statistiek veel kunnen bijdragen aan de verbetering van methoden van forensisch onderzoek. Ik heb daar onder andere geleerd dat je goed na moet denken over hoe je complexe statistische informatie overbrengt om het begrijpelijk te maken voor de mensen in de praktijk.’

Belangrijk speerpunt

Na het NFI ging Stoel in 2019 als hoofd van het team methodologie bij het CBS in Den Haag werken. ‘Het CBS besteedt veel tijd en aandacht aan het ontwikkelen van zijn methoden en de kwaliteit van zijn statistieken. Het combineren van vragenlijsten en registers biedt daartoe veel mogelijkheden. Methodologie speelt hierin een belangrijke rol.’ Volgens Stoel heeft de kwaliteit die het CBS nastreeft ook een keerzijde. ‘Het produceren van statistieken van de hoogste kwaliteit kost veel tijd, terwijl het versnellen van de productie een belangrijk speerpunt voor het CBS is. De vraag is dan: is het mogelijk om te versnellen terwijl je de extra onzekerheid die dit tot gevolg heeft expliciet deelt met de gebruiker? Kan dit, waar doen we dit al en wat zijn de ervaringen? Een andere vraag is: hoeveel zekerheid heeft een gebruiker eigenlijk nodig en wordt zo’n boodschap nog wel begrepen of juist misverstaan? Dit soort vragen intrigeert mij. Het vraagt om onderzoek naar wat een gebruiker nodig heeft én hoe je zo’n boodschap dan overbrengt. Of dit kan zal blijken uit het onderzoek, maar áls het kan biedt dit mogelijkheden.’

Gebruikersonderzoek

Samen met collega’s van de afdeling Methodologie en de divisie Communicatie en Nieuws van het CBS plus academische partners wil Stoel gebruikersonderzoek doen dat antwoord kan geven op bovenstaande vragen. ‘Het past in het bredere vakgebied van wetenschapscommunicatie. Een relatief jong vakgebied dat volop in ontwikkeling is, zoals de recente oprichting van het Nationaal Expertise Centrum voor Wetenschap en Samenleving (NEWS) illustreert. We sluiten hier graag bij aan.’

Grip op meetonzekerheid

Stoel gaat zich met zijn leerstoel ook richten op het vergroten van de grip op meetonzekerheid. ‘Door tal van oorzaken is de geobserveerde waarde van een meting niet identiek aan de werkelijke waarde. We noemen dit meetfouten en zij leiden tot meetonzekerheid. Het CBS besteedt veel tijd aan het controleren en corrigeren van de data die het binnen krijgt. Veel meetfouten kunnen we op deze wijze opsporen en corrigeren, maar dat lukt niet voor alle meetfouten. Samen met het team van dr. Dimitris Pavlopoulos van de VU doen we onderzoek naar de mogelijkheid om data afkomstig van vragenlijsten en administratieve data met elkaar te combineren met behulp van statistische modellen die ontwikkeld zijn binnen de sociale wetenschappen. We gaan onderzoeken of dit kan én of de resultaten voldoende stabiel zijn om te kunnen implementeren in het productieproces van het CBS.’

Selectiviteit in nieuwe databronnen

Nieuwe databronnen – administratieve data van (semi)overheden en het bedrijfsleven, vrijelijk beschikbare (big) data van het internet, sensordata, etc. – kunnen een rijke bron zijn voor nieuwe statistieken. ‘Aan de data die het CBS zelf verzamelt, ligt een goed steekproefontwerp ten grondslag. Dit is vaak niet het geval bij dergelijke nieuwe databronnen. Hoe groot deze datasets ook zijn, een serieus probleem is dat ze vaak niet integraal en zeer selectief kunnen zijn. De grootte van de databron compenseert dat niet noodzakelijkerwijs. We kennen dit aspect van de kwaliteit van dergelijke data dus eigenlijk niet en het is in de praktijk nog best lastig om dat vast te stellen. Informatie over de selectiviteit is wel hard nodig om deze data te kunnen gebruiken in de statistieken die het CBS maakt. CBS/VU-promovendus Santiago Gómez-Echeverry voert dit onderzoek naar het meten van de selectiviteit van dergelijke data uit. Het onderzoek naar meetfouten, selectiviteit en communicatie van meetonzekerheid zijn de speerpunten van mijn leeropdracht. Ik zie er erg naar uit om hiermee aan de slag te gaan.’