Data Service Centrum CBS maakt hergebruik van data eenvoudig

/ Auteur: Miriam van der Sangen
CBS herbergt een schat aan gegevens. Die schat bestaat niet alleen uit statistische publicaties, maar ook uit microdatabestanden die de bron vormen van de publicaties. Om deze microdata goed omschreven en toekomstbestendig op te slaan heeft CBS een Data Service Centrum (DSC) ingericht. Met het DSC beschikt CBS over een centrale plek voor de opslag en interne uitwisseling van data. Daarmee is niet alleen de kwaliteit van de data geborgd, maar wordt ook het inzicht in de statistische processen vergroot. Dankzij het DSC kunnen onderzoekers van CBS de data veel sneller vinden en hergebruiken. Daarnaast kunnen onderzoekers van buiten CBS onder voorwaarden  gebruik maken van een groot deel van de inhoud van het DSC.

Schatkamer steeds voller

Na de afronding van de ontwikkelfase van het DSC ligt de focus van CBS nu op het gebruik en de productie van het centrale verzamelpunt. De dataschatkamer raakt ook steeds voller, vertelt projectcoördinator Harold Kroeze. ‘In januari 2015 telde het DSC ongeveer duizend datasets.  Eind april 2016 was dit aantal opgelopen tot 6.600 datasets van ruim 500 statistieken. Ook het gebruik van de centrale catalogus neemt flink toe. In januari 2015 werd veertig keer per maand een dataset opgehaald voor intern gebruik. Nu gebeurt dit al ruim duizend keer per maand.’

Groeiende behoefte

De kracht van het DSC zit hem niet alleen in de centrale opslag, die meteen een overzicht geeft van de beschikbaarheid van data. Ook de uniforme manier van opslaan biedt enorme voordelen. ‘Hierdoor kunnen de statistici de data sneller combineren’, vertelt programmamanager John Kartopawiro. ‘Sneller dan bij decentraal opgeslagen data. Daar moet je eerst naar op zoek en uitzoeken hoe het bestand is samengesteld. Zo speelt CBS in op de steeds grotere behoefte van de samenleving aan snelle levering van steeds meer gecombineerde data.’

Via het Centrum voor Beleidsstatistiek kunnen externe onderzoekers onder voorwaarden gebruik maken van een groot deel van de microdata van CBS

Kwaliteitseisen

Het DSC is een belangrijke schakel in het borgen van de statistische processen. Door tijdens het proces tussenbestanden op te slaan, kunnen gebruikers later altijd terug naar de bron van de uitkomsten. Die reproduceerbaarheid heeft alles te maken met kwaliteitseisen. ‘Tegelijkertijd bouwen we zo een archief op’, aldus Kroeze. ‘Toekomstige historici zullen daar blij mee zijn. Wat ook belangrijk is: de informatie in het DSC is altijd actueel. Je weet dus dat je altijd te maken hebt met de juiste bestanden. Het DSC is het single point of truth voor de interne processen van CBS.’ 

Meer weten over mogelijkheden voor externe onderzoekers?

Via het Centrum voor Beleidsstatistiek van CBS kunnen externe onderzoekers onder voorwaarden gebruik maken van een groot deel van de microdata waar CBS over beschikt. Veel van de datasets zijn afkomstig uit het DSC, inclusief de bijbehorende metadata. Externe onderzoekers kunnen hierdoor met dezelfde gegevens werken als waar CBS zijn statistieken op baseert. Uiteraard is er ook nog de mogelijkheid onderzoek op maat te laten uitvoeren door onderzoekers van CBS zelf. Meer informatie over de faciliteiten van het Centrum voor Beleidsstatistiek is te vinden op www.cbs.nl/microdata.