CBS Jaarverslag 2021

5. Innoveren & verbeteren

5.1 Inleiding

Het CBS ontwikkelt doorlopend nieuwe methoden en technieken om op basis van nieuwe en bestaande databronnen statistieken te verbeteren, efficiënter te produceren of maatschappelijke fenomenen op nieuwe manieren inzichtelijk te maken. 

Dit kan zowel door grootschalige innovatie-trajecten als incrementele verbeteringen van bestaande statistische processen. Bovendien vinden verbeteringen en innovatie plaats door het hele statistische proces heen, zowel bij de dataverzameling, de statistiekproductie als de output.

De innovaties en verbeteringen zijn er op gericht om nu en in de toekomst kwalitatief hoogwaardige statistische informatie te blijven leveren binnen het beschikbare budget, met oog voor de regeldruk
Binnen het CBS is het innovatieproces in 2021 geoptimaliseerd, waarbij innovatieve en experimentele producten gestructureerder naar het reguliere statistiekproces worden toegeleid. De volgende paragrafen gaan in op enkele innovaties en verbeteringen in 2021.

5.2 Innovaties

Gebruik van apps en sensoren 
De app-ontwikkeling voor de verzameling van sensordata is zodanig gevorderd dat het CBS kan onderzoeken of en hoe structurele inbedding in de organisatie haalbaar is. Er ligt een plan van aanpak om te komen tot een lange termijn business case. Dataverzameling via apptoepassingen zal de regeldruk gaan reduceren. Het zal vooral een uitkomst bieden voor personen die voor deelname aan het budgetonderzoek nog een dagboek invullen. Het gebruik van apps kan het invullen van de gevraagde gegevens prettiger en gemakkelijker maken voor de burger. In 2021 zijn experimenten en veldtests met apps voor de onderzoeken Household Budget Survey (HBS) en Onderweg in Nederland (ODIN) afgerond met de verwachting dat deze in 2022 kunnen worden ingezet. Voor het experiment voor beweegmeters vindt in 2022 nog een tweede veldtest plaats. Dit betreft sensortools, zoals ActivPAL en Hexoskin, die een bepaald soort bewegingen vastleggen zoals smart watches dat ook doen en die zonder dat mensen dat zelf bij moeten houden informatie opleveren die in statistieken gebruikt kunnen worden.

Privacy preserving techniques
Het CBS doet al een aantal jaren onderzoek naar Privacy Preserving Techniques (PPTs). Deze Privacy Preserving Techniques spelen een belangrijke rol bij het geautomatiseerd waarborgen van de privacy bij de analyse van zeer gevoelige data. Daarmee kan de juiste informatie boven tafel komen, waarbij het verplaatsen van de data wordt beperkt tot alleen die gevallen waar dat voor de analyse essentieel is. Dergelijke nieuwe technologie draagt bij aan innovatie op het gebied van veilig data uitwisselen. Dat biedt externe onderzoekers nieuwe kansen om onderzoek te kunnen doen op gegevens van het CBS, aanvullend op de bestaande microdatadienstverlening (remote access) die het CBS reeds aanbiedt. Dit onderzoek gebeurt in samenwerking met onder meer TNO, Brightlands Smart Services Campus, de Universiteit Maastricht en de Rijksuniversiteit Groningen. Het CBS zet de opgedane kennis en kunde in om een data-infrastructuur te helpen realiseren die bestaat uit een stelsel van afspraken en technische voorzieningen. In 2021 zijn verschillende pilots gerealiseerd die de uitvoerbaarheid van een dergelijke infrastructuur aantonen.

5.3 Verbeteringen

5.3.1 Verbeteren van processen

Verwerking van registers 
In 2019 is het CBS met een programma gestart om tot een efficiëntere verwerking van registers te komen en het sneller beschikbaar krijgen van informatie uit registers voor het samenstellen van statistische output. Dit wordt gerealiseerd door processen te standaardiseren en meer IT-componenten te hergebruiken. In 2021 zijn stappen gezet om het proces van het pseudonimiseren van bestanden met persoonsgegevens geautomatiseerd te laten plaatsvinden. Daarnaast is bij diverse processen, zoals bij de verwerking van de WOZ-gegevens en bij de statistiek over de Algemene nabestaandenwet, gestart met het aanpassen van de processen en applicaties. 

Phoenix +
In de afgelopen vijf jaar zijn het applicatielandschap en bijbehorende processen van data verzamelen vanuit het omvangrijke Phoenix-programma herontworpen. Het bouwtraject is in het eerste kwartaal van 2021 afgerond. Daarna zijn in de loop van 2021 nog aanvullende verbeteringen doorgevoerd in de processen van telefonisch uitvragen en persoonlijk interviewen. 

Met de transitie van alle onderzoeken naar de nieuwe systemen en het actualiseren van de bedrijfsprocessen is het Phoenix-programma in 2021 succesvol afgesloten. Daardoor beschikt het CBS over een sneller, effectiever en efficiënter dataverzamelproces, waarmee flexibeler wordt ingespeeld op externe en interne ontwikkelingen. De bedrijfscontinuïteit van dataverzameling is daarmee gegarandeerd. Ook de flexibiliteit en gebruikersvriendelijkheid voor deelnemers aan enquêtes verbetert hiermee. Het verder reduceren van de belasting voor bedrijven blijft een aandachtspunt. 
Meer stabiliteit binnen de nieuwe dataverzamelprocessen betekent dat er meer ruimte ontstaat voor verdere innovatie van de voorzieningen voor het verzamelen van data in de toekomst (zie paragraaf 5.1). Dit omvat onder andere dataverzameling via internet of via mobiele telefoons. De innovatieve bewegingen zijn in 2021 door de grote impact van COVID-19 op het verzamelen van data maar beperkt van de grond gekomen. Vanaf 2022 worden meer vernieuwingen verwacht vanuit het waarneeminnovatieprogramma. Hiermee wordt beter aangesloten bij de technische mogelijkheden en kan de belasting van deelnemers aan enquêtes verder worden verminderd.

Dataverzameling en COVID-19
De impact van COVID-19 op de verschillende vormen van dataverzameling was ook in 2021 aanzienlijk. Enquêtering aan huis, het zogeheten veldwerk (computer assisted personal interviewing (CAPI), kon in 2021 in bepaalde periodes niet of maar beperkt plaatsvinden. Dat vergde extra aandacht bij het managen van het interviewcorps op inzetbaarheid en speciale voorzieningen. Net als in 2020 vertaalde het CBS aanvullende maatregelen van het kabinet binnen vierentwintig uur en in samenwerking met gebruikers in protocollen en voorwaarden waarbinnen de interviews toch konden plaatsvinden. Zo zijn procedures voor ‘buiten interviewen’ en ‘telefonisch interviewen van de CAPI vragenlijst’ ook in 2021 gebruikt, gericht op het blijven behalen van responsnormen. Daarnaast ging ook veel aandacht naar de continue afstemming met gebruikers over consequenties en eventuele mogelijkheden om onderzoeken door te schuiven en in te halen. Designs van onderzoeken en de benaderstrategieën zijn waar nodig (als respons te ver terugliep) in afstemming met gebruikers aangepast door meer gebruik te maken van andere manieren van enquêtering. Het CBS heeft daarbij ook methodologisch onderzocht hoe het wegvallen van CAPI-respons kan worden opgevangen. Bovengenoemde inspanningen naar aanleiding van COVID-19 betekenden wel minder voortgang in kennisontwikkeling, experimenten en innovatieve vernieuwingen binnen het domein van dataverzameling.

Efficiëntiewinst binnen het interviewcorps
Vanaf 2022 zijn de interviewers voorzien van een nieuwe faciliteit voor het nagenoeg geautomatiseerd registeren en verwerken van uren en reiskostendeclaraties. Hiermee wordt veel administratietijd uitgespaard die ten goede komt aan de interviewtijd.

Toegang tot nieuwe databronnen
Traditionele databronnen zijn niet altijd volledig en actueel. Daardoor zijn ze niet toereikend voor de kwaliteit van statistieken in een wereld gedomineerd door de interneteconomie, digitale gegevensstromen en de behoefte aan datagedreven werken. Nieuwe Europese verplichtingen en de vraag naar een vollediger en actueler beeld van maatschappelijke ontwikkelingen vragen om aanvullende informatie, waaraan andere (big) databronnen, vaak in handen van private partijen, een belangrijke bijdrage kunnen leveren. 

Zo werkt het CBS samen met Tekstkernel, een bedrijf op het gebied van op AI-gebaseerde technologie om mensen en vacatures beter en efficiënter aan elkaar te verbinden. Daarnaast is voor informatie over het personenvervoer per spoor en de consumenten- en dienstenprijzenindex toegang tot de OV-data nodig. Met deze data kan het CBS een bijdrage leveren aan het monitoren van ontwikkelingen op het gebied van auto- en OV-gebruik in relatie tot veranderende omstandigheden, zoals gedurende de coronacrisis. Sinds 2020 gebruik het CBS geaggregeerde gegevens over betalingstransacties. Het slim combineren van dergelijke data met andere data die het CBS ter beschikking heeft, leidt tot nieuwe informatie of tilt bestaande statistieken naar een hoger kwalitatief niveau. De meerwaarde van gegevens voor zowel nationale als regionale overheden neemt hiermee toe. Het onderzoek Onderweg in Nederland, bekostigd door Rijkswaterstaat, is hier een voorbeeld van. Op basis van GGD-testdata biedt het CBS cijfermatig inzicht in de gevolgen van de pandemie voor de samenleving. E-commerce invoeraangiften vanuit het zogeheten DECO-system van de Douane dragen vanaf 2021 bij aan de raming van het omzetniveau van internetverkopen van buitenlandse bedrijven aan Nederlandse consumenten.

Omdat private partijen hier niet wettelijk toe verplicht zijn, kan het CBS niet standaard beschikken over nieuwe bronnen en is het CBS afhankelijk van vrijwillige medewerking. De continuïteit van deze datavoorziening wordt gegarandeerd door de toegang tot deze databronnen wettelijk te regelen. Het gaat dan alleen over die data die noodzakelijk zijn voor het maken van statistieken, binnen het zogenaamde proportionaliteitsbeginsel. En mits dat gebeurt conform de bepalingen van de Wet op het CBS: dus uitsluitend voor statistische doelen (doelbinding), zonder individuele gegevens aan andere (overheids)organisaties te verstrekken en zonder dat gegevens zijn terug te herleiden tot individuele personen, bedrijven of organisaties. Dat betekent ook dat het CBS strikte beveiligingsmaatregelen neemt, ook bij het delen van informatie. Elders in dit hoofdstuk zijn meer ontwikkelingen op dat gebied toegelicht.
In 2021 is de verkenning naar de (wettelijke) toegang tot nieuwe databronnen voortgezet. 

Voor de verwerking van bronnen door een datagedreven instelling als het CBS zijn het automatiseren van gegevensstromen en directe communicatie tussen systemen, opslag en verwerking in de cloud van groot belang. Het nieuwe Apache Nifi platform voorziet inmiddels in een toekomstbestendige voorziening voor het uitwisselen van brongegevens binnen de strenge kaders van privacy en informatiebeveiliging.

De algemene bronnencatalogus biedt een CBS-breed actueel en compleet overzicht van alle in gebruik zijnde en nog gewenste externe brondata, en is in 2021 verder uitgebreid met nieuwe bronnen die vanuit datascouting trajecten beschikbaar komen. Deze aanpak bevordert het delen van data en een maximaal hergebruik. Deze aanpak geeft ook invulling aan AVG-kaders, waarbij inzicht wordt gegeven in welke gegevens het CBS beschikbaar heeft.

De toegang tot meer secundaire bronnen vraagt ook om meer faciliteiten voor het delen en hergebruik van data. Ontwikkelingen in degelijke faciliteiten, zoals remote access zijn elders toegelicht. 

Innovatieprogramma dataverzameling (voorheen Advanced Data Collection)
Het CBS heeft een meerjarenplan voor innovatie van dataverzameling voor personenstatistieken. Hierin wordt met nieuwe technieken en slimme vormen van dataverzameling gebouwd aan het dataverzamelen van de toekomst. Voor bedrijven is dit in ontwikkeling. 

Interviewen, zowel persoonlijk als telefonisch, blijft essentieel bij moeilijk benaderbare doelgroepen en voor thema’s waarover beperkt gegevens beschikbaar zijn in beschikbare databronnen of registraties. Door verschillende modes flexibel in te zetten binnen de opzet van onderzoeken kan het CBS tijdig inspelen op de wijzigende vraag en het gewijzigde aanbod van data. Dat gebeurt op basis van een methodologisch verantwoorde benaderstrategie. Innovatiecapaciteit wordt in proeftuinen gericht ingezet, bijvoorbeeld voor het combineren van meerdere privacygevoelige databronnen met waarborg van de privacy, of om bestaande statistieken opnieuw vorm te geven door gebruik te maken van alle nieuwe inzichten en technieken, de inzet van nieuwe bronnen en nieuwe vormen van dataverzameling. Binnen het schoolverlatersonderzoek heeft het CBS bijvoorbeeld onderzocht of het gebruik van aanschrijfkaartjes in plaats van brieven bij jongeren respons verhogend werkt. De toename van digitale vaardigheden biedt nieuwe mogelijkheden, ook bij de specifieke doelgroepen. Een lagere drempel om vragenlijsten via smartphones in te vullen, betekent dat het CBS geïnvesteerd heeft in het voor smartphone geschikter maken van vragenlijsten. Daarbij kijkt het CBS naar wat het oplevert in de doelgroepen en wat de bijbehorende kosten zijn. 

Onderzoek naar de mogelijkheden van andere vormen van enquêtering van personen en huishoudens, zoals beeldbellen of de inzet van panels waarin personen gedurende een langere periode meerdere malen aan eenzelfde onderzoek deelnemen, is door COVID-19 afgeremd en wordt vanaf 2022 weer geïntensiveerd.

Textmining, machine learning en webscraping
Textmining is een machine learning methode om gegevens uit tekstbestanden te kunnen verwerken, waar het CBS doorlopend onderzoek naar doet met verschillende databronnen en toepassingen. In 2021 zijn twee projecten afgerond. Gefinancierd door het ministerie van EZK is een pilot onderzoek uitgevoerd om op basis van websites informatie vast te stellen of een bedrijf AI-diensten of –producten ontwikkelt. Onder meer gegevens van marktpartij Dataprovider worden gebruikt om vast te stellen welke website bij welk bedrijf hoort. Het tweede project dat is afgerond betreft een onderzoek met Europese subsidie in samenwerking met UWV naar het herkennen van vaardigheden in online vacatureteksten. Dit project krijgt in 2022 en verder een vervolg met financiering vanuit het groeifonds. 

Er is in 2021 geïnvesteerd in het ontwikkelen van een webscrapeproces  om textmining van website-informatie structureel en consistent mogelijk te maken voor officiële statistieken. Er is een prototype opgeleverd, gebruikmakend van NiFi en Greenplum, technologieën die binnen het CBS reeds gebruikt worden. 

Een andere toepassing van machine learning is het schatten van populatiekenmerken op basis van registerdata. In 2021 is hiervoor een project uitgevoerd bekostigd door het ministerie van BZK om op basis van geregistreerde levenslopen en met behulp van machine learning de risicofactoren te identificeren voor de transities in en uit armoede. Met het model kan vrij goed geschat worden welke kenmerken samenhangen met de kans om in, dan wel uit, armoede te geraken. Armoede is in het project afgebakend als een inkomen onder de lage-inkomensgrens en weinig liquide vermogen. Hierdoor zijn de modellen uit het project geschikt om in kaart te brengen hoe potentiële risicofactoren de armoedekans beïnvloeden.

Ook in webscraping blijft het CBS investeren, om (aanvullende) gegevens te verkrijgen die bestaande statistieken versterken of om nieuwe statistieken mogelijk te maken zonder daarbij extra regeldruk voor het bedrijfsleven te veroorzaken. Sinds geruime tijd gebruikt het CBS voor de consumentenprijsindex (CPI) prijsinformatie van websites van internetwinkels. Deze internetdata worden ook gebruikt om onderzoek te doen, bijvoorbeeld naar de mate waarin consumenten duurzame producten kopen. 

Nieuwe interessante inzichten met betrekking tot de banenmarkt ontstaan door gegevens over beroepen vanuit de dataverzameling voor statistieken over vacatures en ziekteverzuim te combineren met webscraping data van Textkernel, een bedrijf gespecialiseerd in AI en webscrapingtechnieken in de banenmarkt. Of dit wordt verwerkt in het maken van arbeidsmarktstatistieken hangt af van verder onderzoek in 2022 naar de betrouwbaarheid van de resultaten.

In 2021 onderzocht het CBS bekostigd door een EU-subsidie (grant) mogelijkheden voor het inzetten van webscraping voor het samenstellen van de producentenprijsindex (PPI). Daarbij is bekeken is welke (typen) PPI-prijsposten beschikbaar zijn op het internet. Gebleken is dat de webscrapingtechnieken die worden toegepast bij de CPI ook inzetbaar zijn voor de PPI. 

Verder onderzocht het CBS welke mogelijkheden er zijn om (prijs)databases van bedrijven direct te benaderen met behulp van webservices. Een webservice zorgt er dan voor dat data op de juiste manier uit de databases van bedrijven wordt opgehaald. 

De infrastructuur voor het succesvol scrapen van websites van bedrijven is in 2021 verder vormgegeven. Verder onderzocht het CBS of data van webscrapingbedrijven bruikbaar zijn voor toepassing in de statistiek. 

Daarnaast werkt het CBS ook aan het gebruik van webscrapedata voor het identificeren van bepaalde bedrijfsgroepen (zoals internetplatforms en innovatie bedrijven) en voor het bepalen of controleren van achtergrondkenmerken van bedrijven (zoals de hoofdactiviteit). Deels gaat het hierbij nog om onderzoek, deels ook al om toepassing in de praktijk. Samen met DataProvider en de universitaire wereld onderzocht het CBS het vaststellen van klantleverancierrelaties met behulp van webscraping ten behoeve van het afleiden van het Nederlandse bedrijvennetwerk.

Artificiële intelligentie
Het gebruik van algoritmes of fundamenteel onderzoek naar deep learning moet gebeuren binnen de grondrechten en privacyregels. Een verantwoorde toepassing van Artificiële Intelligentie (AI) in nieuwe dienstverlening en producten vereist onderzoek en kennisopbouw op verschillende gebieden. De ontwikkeling en toepassing van uitlegbare, transparante en eerlijke algoritmen heeft in voorbije jaren geresulteerd in kennis en ervaring binnen het CBS op dit gebied. 

In 2021 publiceerde het CBS de ‘starterskit voor eerlijke algoritmen’ op de CBS-website, in samenwerking met Code for NL, Universiteit van Amsterdam (UvA), Utrecht Data School (Universiteit Utrecht), TU Delft, de VNG en de gemeente Amsterdam. Verder onderzoek is nodig, vooral in samenwerking met andere partijen. Binnen de Nederlandse AI-coalitie gebeurt dit onder andere in projecten in de ELSA-labs (Ethical Legal Societal Aspects Labs), waarbij rekening wordt gehouden met de ethische, juridische en maatschappelijke componenten van de toepassing van AI, en de verbetering daarvan. Het CBS is onder andere betrokken bij het ELSA Lab van AI-hub Brightlands Heerlen bij de bestrijding van armoede en schulden met behulp van AI. Het nationale investeringsfonds financiert ontwikkelingen binnen de Nederlandse AI-coalitie. In samenwerking met onder andere universiteiten en TNO is het CBS gestart met de ontwikkeling van de AI-Monitor. Die geeft informatie over de staat van toepassing en ontwikkeling van AI binnen de Nederlandse samenleving.

Om inzicht te krijgen in hoeverre de Omgevingswet, die nog in werking moet treden, leidt tot veranderingen in het aantal escalaties naar de rechter en in de complexiteit van de onderlinge conflicten, was het CBS eerder door het ministerie van BZK en de ICT Uitvoeringsorganisatie (ICTU) gevraagd te onderzoeken of het mogelijk is gestructureerde statistische informatie te herleiden uit teksten van rechterlijke uitspraken. In de eerste helft van 2020 is gestart met de uitvoering van een nulmeting voor een herhaaldelijk uit te voeren onderzoek, op basis van door de Raad voor de rechtspraak en de Raad van State beschikbaar gestelde gedigitaliseerde teksten van rechterlijke uitspraken in het omgevingsrecht in de periode 2007-2019. Eind 2020 heeft de minister van BZK aan de Kamer gemeld dat een kwantitatief onderzoek niet nodig is voor een goede analyse van de rechtsontwikkeling op dit punt. Hierdoor heeft de beoogde tweede fase van het onderzoek in 2021 niet plaatsgevonden.

Woningbehoefteonderzoek (WoOn) 
Het project innovatie WoON is een aantal jaren geleden gestart en in 2021 is een eerste versie van een WoON-register opgeleverd, met registerdata in plaats van enquêtedata. Het CBS heeft de eerste output op basis van dit register in 2021 samengesteld. Dit register wordt in de komende jaren uitgebreid en regelmatig bijgewerkt. Dit zal leiden tot een aanpassing van de vragenlijst voor het woningbehoefteonderzoek. De informatie die uit het register te halen is, wordt dan niet meer uitgevraagd via enquêtes. 

Mobiliteitsonderzoek 
In het innovatieproject Onderweg in Nederland is in 2021 verder samengewerkt met het ministerie van IenW. In 2021 onderzocht het CBS of het bestaande onderzoek Onderweg in Nederland verder verbeterd kan worden. Er is onderzoek gedaan naar de kansen en mogelijkheden van het verzamelen van gegevens met een verplaatsingsapp, verbeteringen in de respondentbenadering en vragenlijst en naar het ontwikkelen van methoden ten behoeve van lange tijdreeksen. De tijdreeksen van 1999 tot en met 2020 zijn op StatLine gepubliceerd. 

Herontwerp proces inkomensstatistiek
Om de continuïteit van het Integrale inkomens en vermogens statistiek (IIVS)-proces op lange termijn efficiënter te maken en te kunnen borgen, is in 2019 een herontwerp van dit proces gestart. Daarnaast is in 2020 duidelijk geworden dat de gebruikte software binnen dit proces niet leverbaar blijft met de huidige functionaliteiten. Aan het inhoudelijke herontwerp is ook een proces voor toolkeuze toegevoegd. In 2021 is het CBS een proof of concept gestart met een leverancier voor nieuwe tooling. Deze proof of concept zal begin 2022 nog doorlopen, waarbij vooral gekeken wordt naar de performance issues. 

Agile transitie
Agile werken en continu verbeteren gaan hand in hand. Het CBS heeft enkele jaren geleden werkenderwijs Agile werken geïntroduceerd bij IT en softwareontwikkeling. Dit houdt in dat gewerkt wordt met vaste teams, waarin medewerkers van de statistische afdeling (‘business’) en IT nauw samenwerken. Deze teams doen zowel het beheer als de ontwikkeling van maatwerksoftware. De teams werken in sprints van enkele weken om ervoor te zorgen dat resultaten eerder zichtbaar zijn voor de gebruiker en ingezet kunnen worden in de praktijk. Teams pakken de zaken met de grootste meerwaarde voor de organisatie op. Dit alles gebeurt op basis van gezamenlijke doelen en met een mentaliteit die draait om experimenteren en leren. Door deze werkwijze kunnen medewerkers beter omgaan met hoge werkdruk en is er openheid over waar de teams mee bezig zijn. Het in teams werken op een agile manier heeft zich met name in coronatijd bewezen. Het werk is niet toebedeeld aan medewerkers, maar aan een team. Hierdoor is het eigenaarschap beter georganiseerd en heeft de bedrijfsvoering van CBS weinig hinder ondervonden van de thuiswerksituatie. 

Datastrategie
In 2021 heeft het CBS op verschillende manieren bijgedragen aan overheidsbrede datastrategieën. 
De Interbestuurlijke Datastrategie is een initiatief van de rijksoverheid, provincies, gemeenten en waterschappen. Deze strategie is in november 2021 aangeboden aan de Tweede Kamer. De Interbestuurlijke Datastrategie heeft de ambitie om door verantwoord datagebruik bij te dragen aan maatschappelijke opgaven. Alhoewel de datastrategie de focus heeft op het delen van data voor het oplossen van maatschappelijke vraagstukken raakt dit ook aan het statistisch domein en de rol die het CBS daarin speelt. In 2021 heeft het CBS een bijdrage geleverd aan het uitvoeringsplan van deze datastrategie.

De datastrategie biedt een context voor het CBS om de dienstverlening als geheel verder te optimaliseren door statistische processen nog veiliger, transparanter, wendbaarder en beter beheersbaar in te richten. Het CBS beschikt over een data service center, dat de opslag en vindbaarheid van CBS-data verzorgt en tevens de beschikbaarstelling van data aan interne statistische gebruikers. Soortgelijke diensten worden ook geleverd voor externe gebruikers, zoals studenten en onderzoekers. Deze dienst past binnen de datastrategie en het datamanagement in Nederland.

Samen met het Kennis- en Exploitatiecentrum Officiële Overheidspublicaties (KOOP) heeft het CBS een voorstel uitgewerkt om een ‘Beschermde Data Catalogus’ (BDC) in te richten die een centrale vindplaats vormt voor de beschermde data van Nederlandse overheidsorganisaties. Beschermde data zijn de data die de overheid zelf gebruikt en die afkomstig zijn van de overheid zelf, uit haar operationele processen, of van private partijen. De beschermde data spelen een centrale rol in het Europese wetvoorstel voor de Data Governance Act en de Interbestuurlijke Datastrategie om datagedreven werken te organiseren. 

De BDC heeft als doel om overheidsorganisaties te ondersteunen om hun beschermde data vindbaar te maken en om te profiteren van beschikbare data in de eigen organisatie en in andere overheidsorganisaties. De BDC bevat zelf geen data, maar beschrijft de data en verwijst naar de broneigenaar waar de feitelijke data kan worden opgevraagd. Hierdoor draagt de BDC bij aan het ‘FAIR (findable, accessible, interoperable, reusable) data’ principe door beschikbare data van organisaties goed vindbaar te maken.

Eenvoudig data delen 
Het CBS is voortdurend bezig om veilig en eenvoudiger data te delen binnen de eigen organisatie. Dit komt het maken van statistiek ten goede. In 2021 is een begin gemaakt met het doorvoeren van een aantal verbeteringen hiervoor, zoals extra rekenkracht en een systeem voor codelijsten en classificaties. 

Innovatieproces
Binnen het CBS is in 2021 een innovatieproces ingericht, waarbij op verschillende momenten wordt bekeken of het zinvol is om de innovatie door te zetten. De chief methodology officer borgt de methodologische onafhankelijkheid en ziet actief toe dat kwaliteitsstandaarden gehandhaafd blijven. Het product innovatie portfolio bevat innovatieve projecten waarbij onderscheid wordt gemaakt in een verkenning -, ontwikkeling- en implementatiefase. Dit borgt een uniforme(re) werkwijze met heldere verwachtingen over het product per fase. Er is specifieke aandacht voor de overdracht van ontwikkeling naar de statistiekproductie.

5.3.2 Verbeteren van statistieken

Programma Adequaat Meten van de Economie
Globalisering, verdienstelijking en digitalisering maken dat het adequaat blijven meten van de economie niet voor zich spreekt. Daarom is het CBS in 2017 gestart met het programma 'Adequaat meten van de economie'. Hierin onderzoekt het CBS de manier waarop nieuwe economische fenomenen beschreven kunnen worden. Binnen dit programma heeft het CBS in 2021 onderzoek afgerond naar onder andere het effect van online retail op de arbeidsmarkt, omvang van de digitale economie, de impact van digitalisering op de consumentenprijsindex, de waarde van data, en de stagnerende groei van de productiviteit, de zogeheten productiviteitpuzzel. De gegevens en rapporten die het CBS hiervoor heeft, worden actief beschikbaar gesteld aan de samenleving voor het maatschappelijk debat, onderzoek, beleidsontwikkeling en besluitvorming. 

Het programma heeft in 2021 bepaald dat in de toekomst vooral aandacht geschonken wordt aan de thema’s globalisering en waardeketens, digitalisering, kennis en economie, en klimaatverandering en duurzaamheid. Een expertgroep met deelnemers van ministeries, onderzoekbureaus en universiteiten geeft advies en denkt mee over de invulling. In dit kader is ook een perspectief op het meten van de economie vormgegeven: wat is belangrijk om te blijven en gaan meten, en hoe kan daar concreet invulling aan gegeven worden. Het CBS werkt op het gebied van adequaat meten van de economie ook samen met andere statistiekbureaus en internationale organisaties. Voor de ontwikkeling van digitale aanbod- en gebruiktabellen werd bijvoorbeeld intensief kennis uitgewisseld met andere landen tijdens bijeenkomsten van de Organisatie voor Economische Samenwerking en Ontwikkeling (OESO).

Fenomeengerichte thema-overstijgende analyses
Ook in 2021 richtte het CBS zich op innovatieve, nieuwe verdiepende fenomeengerichte- thema-overstijgende analyses. Deze innovaties en analyses, vaak met sterk wetenschappelijke insteek, worden in (nieuwe) samenwerkingsverbanden met universiteiten en andere (wetenschappelijke) instellingen zoals NIDI opgepakt door, al dan niet in een consortium, in te schrijven voor onderzoeksprojecten (calls). Zo is in 2021 een project voor het opzetten van een nieuwe historische data-infrastructuur (HISDAT) gestart. Er is een koppeling gemaakt tussen de (klein)kinderen van de onderzoekspersonen uit de Historische Steekproef Nederland (HSN) (0,5% steekproef uit de bevolkingsregisters van alle kinderen geboren 1850–1922) en vanaf 2022 komen deze gegevens beschikbaar voor externe onderzoekers via de remote access-faciliteit van het CBS. Inhoudelijke experts vanuit het Internationaal Instituut voor Sociale Geschiedenis van de Koninklijke Nederlandse Akademie van Wetenschappen (IISG/KNAW) werken mee aan het project. Eind 2021 is gebleken dat het overgrote deel van de (klein)kinderen van onderzoekpersonen van de HSN konden worden gelinkt.

Zorg 
Bekostigd door het ministerie van VWS heeft het CBS in 2021 uitkomsten over keuzegedrag met betrekking tot de zorgverzekering, de samenvattende gezondheidsmaat en zingeving gepubliceerd. Ook heeft het CBS de gevolgen van doelgroepgerichte dataverzameling bepaald, waarbij huis-aan-huis-enquêtering enkel wordt ingezet voor moeilijk bereikbare groepen. Dit heeft geresulteerd in een nota waarin de methode wordt uitgelegd die in 2022 op de CBS-website gepubliceerd wordt.

Beloningsverschillen Mannen en Vrouwen 
Voor de monitor Beloningsverschillen Mannen en Vrouwen is in 2021 een ontwikkelproject uitgevoerd. In dit ontwikkelproject is de robuustheid van de monitor verbeterd door de nieuwste methodologische inzichten toe te passen. Daarnaast is gekeken hoe de resultaten van de monitor meer actueel gemaakt kunnen worden. Verder is onderzocht of er nieuwe (aanvullende) databronnen ingezet kunnen worden. Beide leiden tot een kwaliteitsverhoging van de monitor. Dit ontwikkelproject is bekostigd door het ministerie van SZW.

Vacatures 
In 2017 is het CBS gestart met een onderzoek naar de mogelijkheden om CBS-cijfers over vacatures uit te splitsen naar meer achtergrondkenmerken op basis van big data. In 2020 is op de innovatiepagina van de website van het CBS een nieuwe experimentele tabel over vacatures naar beroepsniveau gepubliceerd. Vanaf 2022 zal het CBS gaan publiceren over het kenmerk beroep op StatLine. 

In 2021 is verder onderzoek gedaan naar publicatiemogelijkheden van andere achtergrondvariabelen zoals regio en vaardigheden. Daarnaast is in het innovatiedeel van het Arbeidsmarkt, Zorg en Welzijn project (AZW-project, zie 2.4.2) gewerkt aan het onderzoek naar nieuwe databronnen voor vacatures.

Data security 
Binnen het thema data security heeft het CBS nieuwe informatie gepubliceerd over het regionaal op kaarten zichtbaar maken van statistische informatie. Dat houdt in dat statistische gegevens in Nederland op regionaal niveau worden gepubliceerd waarbij met kleuren wordt aangegeven hoe iets over Nederland verdeeld is. Door diep in te zoomen op een kaart zou gevoelige bedrijfsinformatie van een enkel bedrijf op een bedrijventerrein onthuld kunnen worden. Om dat te voorkomen heeft het CBS technieken ontwikkeld om privacy te borgen. 

Complexiteit 
Binnen het thema complexiteit wordt het sociale netwerk van heel Nederland benut om vanuit de invalshoek van netwerken te kijken naar een fenomeen als mantelzorg bij ouderen. Het CBS onderzocht in hoeverre mogelijk kwetsbare ouderen een kring van potentiële mantelzorgers hebben en of die mantelzorgers dan ook voldoende dichtbij wonen om die mantelzorg te kunnen geven. 

Netwerken van bedrijven 
Netwerken van bedrijven zijn van belang voor waardeketens in de economie. Welke andere bedrijven worden geraakt als een bedrijf plotseling ophoudt te bestaan of als het bepaalde goederen of diensten niet meer kan leveren? Wanneer een bepaald bedrijf een belangrijke innovatie doorvoert, hoe snel hebben andere bedrijven daar dan ook profijt of juist sterkere concurrentie van? Hoe werken de energietransitie en de duurzaamheidsdoelen (SDG’s) door de hele economie als bepaalde bedrijven een voortrekkersrol nemen? Met de op dit moment beschikbare data is een groot deel van dat netwerk onbekend en moet dus bijgeschat worden. Deze informatie wordt bijvoorbeeld gebruikt door het ministerie van EZK en het Centraal Planbureau (CPB). Het CBS heeft ook gewerkt aan verbetering van de beveiliging van netwerkdata, zodat deze gegevens binnen een beveiligde remote access omgeving kunnen worden aangeboden voor wetenschappelijke doeleinden.