Hoe datascouting statistieken verbetert, ook in coronatijd

/ Auteur: Redactie
Florian Henning van het CBS via Zoom in gesprek met Michel van Bommel van de Betaalvereniging
© Sjoerd van der Hucht Fotografie / My Eyes4u productions
Het datalandschap verandert. Op steeds meer plekken worden gegevens verzameld en opgeslagen. Denk aan verkeerslussen, scannerdata van winkels en betalingsgegevens. Hierdoor zijn meer data beschikbaar, soms ook tijdiger dan voorheen. Dat vergroot de mogelijkheden om bestaande statistieken te verbeteren en nieuwe statistieken te creëren. Het CBS zet zoveel mogelijk in op het gebruik van deze secundaire databronnen. Tijdens de coronacrisis dragen ze bij aan kwalitatief goede cijfers, die van belang zijn voor de actualiteit. Betaalvereniging Nederland is een van de samenwerkingspartners die daarvoor data aan het CBS leveren.

Data Officer

Bij het CBS vinden verschillende initiatieven plaats om secundaire databronnen binnen te halen en te gebruiken voor het maken van statistieken. Deze datascouting activiteiten bevorderen niet alleen de mogelijkheden en kwaliteit van de statistieken, ze zijn ook in lijn met het advies van de commissie van Straalen om de lastendruk op bedrijven door de overheid te beperken. Florian Henning, Data Officer bij het CBS, coördineert deze activiteiten. ‘Er komt veel kijken bij het gebruik van secundaire databronnen. Denk aan juridische, technische en methodologische aspecten. Wat kan er wel en niet met betrekking tot externe data? Hoe waarborg je de privacy? Hoe regelen we deze data in onze IT-systemen in? En welke methodologische aanpak is nodig om met deze data hoogwaardige cijfers te produceren? Deze zaken spelen niet alleen intern een rol, maar ook in het relatiebeheer met onze samenwerkingspartners. Omdat het CBS steeds meer gebruik maakt van datascouting is er daarom één centraal kennis- en coördinatiepunt ingesteld.’

Maatschappelijk belang

Externe bronhouders zien steeds vaker het maatschappelijke belang in van data delen met het CBS, vertelt Henning. ‘Bronhouders werken met ons samen omdat ze een maatschappelijke bijdrage willen leveren en verantwoord willen ondernemen. Binnen de samenwerking doet het CBS echter vaak ook onderzoek naar nieuwe methodieken en dat levert bronhouders dan ook ontwikkeling van hun kennis op. Soms werken ze tevens direct samen met het CBS in consortia aan innovatietrajecten.’ Tijdens de huidige coronacrisis maakt het CBS veel gebruik van secundaire databronnen. Henning: ‘Heel veel cijfers over corona zijn gebaseerd op een combinatie van CBS gegevens en externe databronnen, bijvoorbeeld uit administratieprocessen. Daarmee kun je snel nieuwe cijfers maken voor de ondersteuning van beleidsvorming. Van de gemeenten ontvangen we bijvoorbeeld data over ondernemers die zich melden voor financiële ondersteuning in het kader van de Tijdelijke Overbruggingsregeling Zelfstandig Ondernemers (Tozo). En verschillende partijen, waaronder Schiphol en ProRail, leveren op weekbasis gegevens voor een snelle indicator van de vervoersbewegingen en vervoerde goederen in coronatijd. Ook met de scannergegevens van supermarkten, bouwmarkten en overige detailhandel kunnen nu snel cijfers over de consumptie gemaakt worden. Onder andere het fenomeen ‘hamsteren’ kunnen we daarmee onderzoeken.’

Het inzetten van secundaire databronnen stelt het CBS in staat snel kwalitatieve goede, gedetailleerde en actuele statistieken te maken. Deze statistieken worden onder andere gebruikt door de overheid om haar beleid op te baseren. Door steeds meer gebruik te maken van al bestaande databronnen heeft het CBS in het verleden een grote lastendruk vermindering weten te realiseren voor het bedrijfsleven. Ook hoefden er daardoor minder vragenlijsten te worden ingevuld door personen en huishoudens. Wettelijk is dan ook geregeld dat het CBS voor het maken van statistieken deze data mag verzamelen en verwerken.

In dit proces is de privacy te allen tijde gewaarborgd. Het CBS publiceert alleen statistische informatie als natuurlijke personen en bedrijven niet herkenbaar of herleidbaar zijn. Ook hebben we maatregelen genomen tegen diefstal, verlies of misbruik van persoonsgegevens. Het CBS levert nooit herkenbare gegevens aan derden, ook niet aan andere overheidsinstellingen.

Betaalvereniging

Betaalvereniging Nederland, de branchevereniging van gereguleerde betaaldiensten in Nederland, levert sinds het begin van de coronacrisis op weekbasis gegevens aan het CBS: over aantallen of bedragen van pinnen aan de toonbank, online betalen met iDEAL, en geldopnames bij bancaire geldautomaten. Deze zijn geaggregeerd en geanonimiseerd. Het CBS kan daarmee snel cijfers maken over de consumptie en bestedingen. Michel van Bommel, Senior Policy Advisor Strategy & External Affairs bij de Betaalvereniging: ‘We zijn sinds 2018 met het CBS in gesprek over hoe we elkaar kunnen aanvullen bij het verzamelen en rapporteren van gegevens over het binnenlandse én grensoverschrijdende betalingsverkeer. Het CBS, de Nederlandse Vereniging van Banken en Betaalvereniging Nederland zoeken naar goede data over het zakelijke betalingsverkeer van Nederland met het buitenland, ook buiten de EU. Denk aan interregionale transacties naar bedrijfstak, zoals bijvoorbeeld de handel in bloembollen met Duitse ondernemingen. De samenwerking met het CBS heeft er alvast toe geleid dat de Betaalvereniging tijdens de coronacrisis op weekbasis cijfers aan het CBS verstrekt over het betalingsverkeer. Omgekeerd vullen wij onze eigen cijfers aan met inzichten van het CBS over zaken als het gebruik van het internet en online bank- en betaaldiensten, en bezoek aan webwinkels.’

Aanvulling

Het CBS gebruikt secundaire data voor verscheidene doeleinden. ‘Door de hoeveelheid data die verzameld wordt, is er veel mogelijk’, vertelt Henning. Steeds meer secundaire data kan gebruikt worden om statistieken mee te maken. Een deel komt uit registers, een ander deel uit andere bronnen. We gebruiken scannerdata om de consumentenprijzen vast te stellen en informatie van verkeerslussen voor de verkeersintensiteit. Het CBS is constant bezig nieuwe mogelijkheden te onderzoeken. Denk bijvoorbeeld aan het in kaart brengen van zonnepanelen op basis van beeldherkenning, of het gebruik van zogenoemde floating car data op basis van GPS.’ Betekenen deze ontwikkelingen dat de traditionele manier van data verzamelen zal verdwijnen? ‘Nee’, stelt Henning, ‘primaire waarneming blijft heel belangrijk. Er zullen altijd vragenlijsten nodig zijn om bepaalde gegevens te verzamelen. Secundaire bronnen zijn een aanvulling en kunnen een bijdrage leveren aan de uitbreiding, versnelling en kwaliteitsverbetering van statistiek. Ook omdat ze reeds gebruikte bronnen kunnen valideren of meer detail kunnen toevoegen, bijvoorbeeld geografisch of in de tijd. Maar elk type data heeft z’n eigen bijdrage: soms heb je voldoende aan secundaire data, in andere gevallen krijg je het beeld alleen compleet met primaire data, en daarom heb je beide nodig.’

Datascouting community

Henning faciliteert en geeft advies bij de datascouting trajecten. Dat doet hij samen met een multidisciplinaire datascouting community. ‘Daarin zitten mensen van verschillende specialismes, zoals juristen, accountmanagers, statistisch onderzoekers, projectleiders, technisch experts en methodologen. Zij hebben allen uitgebreide ervaring met datascouting. De insteek van de community is om het datascouting proces verder te harmoniseren. Datascouting is iets nieuws, dus we blijven onze kennis steeds verder ontwikkelen. Om nieuwe projecten optimaal te kunnen ondersteunen hebben we procesbeschrijvingen, handleidingen en aanbevelingen opgesteld. Maar omdat datascouting veel om relatiebeheer draait is er geen dichtgetimmerd proces mogelijk; het is vaak maatwerk. We maken dus niet zozeer beleid, maar ondersteunen en coördineren. We hebben een bronnencatalogus opgesteld met een overzicht van alle secundaire databronnen en leveranciers waar we mee werken, en een datascouting monitor: een lijst van alle lopende trajecten. Zo houden we integraal overzicht en kunnen we onze data gap in kaart brengen: welke data hebben we wel en welke niet, en waar ligt de prioriteit voor verdere samenwerking met bronhouders.’