Statistisch proces

cbs-live gefotografeerd vanaf buitenzijde CBS-gebouw

Meeliftend op de digitale revolutie vanaf de jaren zestig is het CBS gegevens elektronisch gaan verwerken met behulp van computers. De rekencapaciteit groeide snel, databestanden konden gekoppeld worden, er vond standaardisatie plaats en het Internet kwam op. Binnen de Nederlandse overheid ontstond het stelsel van basisregistraties: overheidsorganisaties verzamelden digitaal gegevens voor administratieve doeleinden.

In 1996 werd in de CBS-wet vastgelegd dat het CBS de administratieve lasten (veroorzaakt door enquêtes) zo laag mogelijk moet houden en voor statistische doeleinden overheidsregistraties mag inzetten. Waar mogelijk is het CBS zo geleidelijk overgestapt van steekproefsgewijze enquêtering van personen en bedrijven naar het verzamelen van data uit administratieve bronnen van andere overheidsinstellingen. Naast registraties van de overheid is het CBS de laatste jaren ook registraties gaan gebruiken van bedrijven, bijvoorbeeld kassascangegevens van supermarkten voor het berekenen van prijsontwikkelingen, en informatie van energiebedrijven over het energieverbruik van huishoudens en bedrijven.

Daarnaast biedt het combineren van verschillende registraties nieuwe statistische mogelijkheden. Deze mogelijkheden nemen exponentieel toe met de toename van het aantal bij het CBS beschikbare databronnen. Toegang tot nieuwe databronnen is dan ook essentieel om de kwaliteit van de statistieken te waarborgen. Er ontstaan de laatste jaren ook steeds meer nieuwe databronnen (zoals big data) en worden deze in toenemende mate ook op andere wijzen verzameld.

Het maken van statistische informatie op basis van deze nieuwe bronnen kan conceptueel en methodologisch wel een uitdaging zijn. De keuze van data die worden verzameld, wordt daarmee meer en meer bepaald door de mogelijkheden die de techniek biedt. De moderne ontwikkelingen bieden vooral ook veel kansen. Door op innovatieve en betrouwbare wijze al deze databronnen te combineren, groeien de mogelijkheden om nieuwe, zeer actuele, maatschappijgerichte en meer gedetailleerde statistieken te maken. Met een scherp oog voor privacy en betrouwbaarheid.

Het statistisch proces in stappen

  1. Het statistisch proces begint met de vraag. Dat kan een vraag zijn die voort komt uit een wettelijke nationale of Europese verplichting of een vraag vanuit bijvoorbeeld een ministerie.
  2. Daarna begint de voorbereiding. De stappen die daarin te onderscheiden zijn, zijn om eerst te bepalen welke data nodig zijn en welke data al in huis zijn*. Daarna wordt gekeken welke data aanvullend nodig zijn en uit welke bronnen deze kunnen komen. Denk daarbij aan registraties, enquêtes en big data. Als bestaande bronnen niet toereikend zijn, wordt een eventuele aanvullende enquêtering voorbereid. Daarbij wordt bijvoorbeeld gekeken naar steekproefontwerp en -trekking.
  3. De stap daarna is het verzamelen van data. Daarbij worden de benodigde bronnen binnengehaald en worden er technische controles gedaan. Ook wordt er, indien nodig, geënquêteerd, de respons wordt verzameld en ingevoerd. Daarbij wordt de respons zo snel mogelijk na ontvangst van de direct identificerende persoonskenmerken ontdaan. Kijk daarbij ook naar onze informatie over privacy.
  4. In de vierde stap wordt de data geanalyseerd en bewerkt. Daarbij signaleert het CBS evidente fouten en corrigeert deze. Daarnaast wordt data die ontbreekt, met behulp van diverse methoden, ingeschat op basis van informatie die wel bekend is. Dit wordt toegevoegd aan de bestaande bronnen. Als er, in het geval van een enquête, een steekproef is getrokken, wordt de data opgehoogd naar het populatieniveau dat gevraagd wordt.
  5. De vijfde stap is de statistische beveiliging. In deze stap wordt er een nauwgezette controle gedaan op de mogelijkheid van onthulling van individuele gegevens in publicatiecellen. Er mag geen risico ontstaan dat data van individuele bedrijven en/of personen uit de data kunnen worden afgeleid. Indien dit risico bestaat, worden door middel van door het CBS ontwikkelde software automatisch publicatiecellen samengevoegd (aggregeren) of de waarde uit de cel verwijderd. Het CBS zal nooit statistische informatie over individuele personen en/of bedrijven publiceren of verstrekken aan derden.
  6. De laatste stap in het proces is het publiceren. In deze belangrijke stap wordt betrouwbare en samenhangende statistische informatie verspreid naar een zo groot mogelijk publiek. Zowel via media, als rechtstreeks, via verschillende kanalen (onder andere StatLine, website en social media) en in verschillende vormen (onder andere animatie, persconferentie, artikel, filmpje of rapport)– Zie ook ons publicatiebeleid

*) De belangrijkste overheidsregisters waar het CBS gebruikt van maakt zijn:

  • BAG
    De BAG (Basisregistraties Adressen en Gebouwen) bevat gemeentelijke basisgegevens van alle adressen en gebouwen in een gemeente.
  • BRK
    Het Kadaster is bronhouder van de Basisregistratie Kadaster (BRK).
  • BRP
    De Basisregistratie Personen (BRP) is de basisregistratie voor persoonsgegevens binnen het stelsel van basisregistraties.
  • HR
    Het Handelsregister is de basisregistratie waarin alle bedrijven en rechtspersonen ingeschreven staan. 
  • WOZ
    De gegevensverzameling voor de Basisregistratie WOZ bestaat uit diverse gegevens die nodig zijn om deze waarde aan zowel een onroerende zaak te relateren als aan een belanghebbende. "Vastgestelde waarde" (WOZ-waarde), een BAG-adres en de koppeling aan kadastrale percelen en/of adressen en aan BAG verblijfsobjecten, standplaatsen, ligplaatsen en/of panden.