Zoektocht naar nieuwe databronnen

/ Auteur: Meindert Kappe
© Hollandse Hoogte / Berlinda van Dam
Door allerlei maatschappelijke ontwikkelingen zijn de traditionele databronnen voor het maken van statistiek steeds minder toereikend. Daarom is het CBS voortdurend op zoek naar nieuwe databronnen.


Traditionele databronnen

In de samenleving is grote behoefte aan objectieve en kwalitatief hoogwaardige statistische informatie. Statistieken moeten betrouwbaar zijn en onafhankelijk tot stand komen. Dat is de taak van het CBS. Het CBS maakt deze statistieken op basis van data die afkomstig zijn van enquêtes of dataregisters (bijvoorbeeld bevolkingsregister), grote digitale bestanden met veel data. Als registerinformatie niet beschikbaar is of niet alle data bevat die nodig zijn, mag het CBS nieuwe informatie uitvragen met enquêtes.

Aanvullende informatie nodig

Door alle maatschappelijke ontwikkelingen, waaronder de opkomst van de interneteconomie, digitale gegevensstromen en een teruglopende respons op enquêtes, zijn traditionele databronnen steeds minder toereikend. Data zijn niet volledig en niet altijd actueel. Dat heeft gevolgen voor de kwaliteit van de statistiek. Deze veranderingen en nieuwe Europese verplichtingen vragen om aanvullende informatie, in de vorm van andere (big) databronnen. Veel van die bronnen zijn in handen van private partijen.

Wettelijk regelen

Private partijen zijn niet wettelijk verplicht deze gegevens aan het CBS te leveren. Het CBS kan daardoor niet altijd beschikken over deze informatie en is dan ook afhankelijk van vrijwillige medewerking. Dat biedt onvoldoende waarborgen voor de continuïteit en geen zekerheid dat het CBS van alle partijen de informatie krijgt. Door de toegang tot deze databronnen wettelijk te regelen, kan het CBS formeel de beschikking krijgen over deze databronnen en kan de continuïteit van de datavoorziening worden gegarandeerd.

Het samenvoegen van traditionele databronnen en big data kan complexe maatschappelijke problemen beter in kaart brengen en begrijpelijk maken

Maken van statistiek

Het is nadrukkelijk niet de bedoeling dat het CBS ongelimiteerde toegang krijgt tot de gegevens. Het gaat alleen over die data die noodzakelijk zijn voor het maken van statistieken. Dat noemen we proportionaliteit. Om data veilig te delen worden altijd betrouwbare maatregelen genomen. In de CBS-wet zijn bovendien bepalingen opgenomen over het gebruik van gegevens. Zo worden gegevens uitsluitend voor statistische doelen gebruikt en worden individuele gegevens nooit aan andere (overheids)organisaties verstrekt. De gegevens worden zo gepubliceerd dat de informatie niet tot individuele personen of organisaties te herleiden is.

Gegevensbescherming

Het CBS voldoet aan de hoogste eisen voor gegevensbescherming en is ISO-gecertificeerd. De Algemene Verordening Gegevensbescherming (AVG) bevat bovendien geen aanvullende voorwaarden ten opzichte van de CBS-wet voor het verzamelen en verwerken van (persoons)gegevens. Nieuw te verzamelen gegevens verschillen naar hun aard niet van andere, vaak zeer privacy-gevoelige, gegevens die het CBS reeds verwerkt.

Center for Big Data Statistics
Het CBS houdt zich al een aantal jaren bezig met onderzoek naar de toepassingsmogelijkheden van big data voor statistiek en de methodieken om big data te verkrijgen en verwerken. Het voordeel van de big data methodieken is dat big data vaak ‘real time’ cijfers opleveren en dus snel beschikbaar zijn. Zo kan er nog meer ingespeeld worden op de actualiteit, hebben de cijfers een hoger detailniveau en neemt de betrouwbaarheid toe. Maar wat betekent de term big data nu precies en hoe gebruikt het CBS big data