Makkelijk en snel met CBS open data aan de slag

/ Auteur: Miriam van der Sangen
© Sjoerd van der Hucht Fotografie
Het CBS startte in 2014 met een portal voor het beschikbaar stellen van open data. Sindsdien is het gebruik daarvan sterk toegenomen. Zowel overheden, bedrijven als burgers weten de ruim 4500 datasets van het CBS steeds vaker te vinden. Om het gebruik van open data verder te stimuleren heeft het CBS een aantal gebruiksvriendelijke handleidingen op zijn website geplaatst, zodat gebruikers met behulp van de programmeertalen Python en R makkelijk en snel aan de slag kunnen.

Meer transparantie

Het open data portal is in juni 2014 gelanceerd. ‘De introductie sloot aan bij de behoefte in de maatschappij om meer transparantie. De statistische informatie van het CBS wordt door het beschikbaar stellen van de open data beter bereikbaar en is gemakkelijker te hergebruiken’, vertelt Erwin van Mierlo. Hij is coördinator open data bij het CBS. ‘We zorgen er voor dat ook via ons open data portal altijd de meest recente informatie beschikbaar is. Dat is een groot voordeel.’ Gemiddeld maken maandelijks 450.000 unieke klanten gebruik van de datasets in het open data portal van het CBS. ‘Gebruikers binnen de overheid en het bedrijfsleven ontwikkelen steeds meer toepassingen waarbij onze open data van toegevoegde waarde zijn’, aldus Van Mierlo.

 ‘We zien dat steeds meer mensen datagedreven willen werken. Hopelijk worden op deze manier de CBS-data nóg toegankelijker’

Gemakkelijk en snel aan de slag

Voor het gebruik van de openbare datasets van het CBS in de software van de gebruikers is een zogenaamde application programming interface (API) nodig. Momenteel wordt gewerkt aan een nieuwe versie van deze API, gebaseerd op het nieuwe OData 4-protocol. Dat was de aanleiding voor Jolien Oomens, ICT-onderzoeker bij het CBS, om een aantal handleidingen te schrijven. ‘Die zorgen er voor dat nieuwe gebruikers gemakkelijk en snel met open data aan de slag kunnen in Python en R en zelf mooie kaarten en tijdreeksen kunnen maken. Het package voor R dat in de handleidingen gebruikt wordt, is ontwikkeld door methodoloog Edwin de Jonge van het CBS. Jonathan de Bruin, Research Data Engineer aan de Universiteit van Utrecht, heeft het package voor Python ontwikkeld.

Drempel verlagen

Oomens verzorgt binnen het CBS cursussen over open data, deep learning, visualisaties en R en ontwikkelt daarvoor ook het lesmateriaal. ‘De handleidingen voor het gebruik van OData 4 met Python en R hebben we laten testen door docenten en studenten van een aantal hogescholen en universiteiten. Hun feedback hebben we verwerkt. Omdat enkele docenten aangaven dat ze de handleidingen al in het volgende collegejaar wilden gebruiken, hebben we ervoor gekozen om ze ook aan te passen aan het reeds bestaande OData 3-protocol en ze zo snel mogelijk op onze website te publiceren.’ Oomens hoopt dat de handleidingen in het Nederlands en Engels voor gebruikers de drempel verlagen om met open data aan de slag te gaan. ‘We zien dat steeds meer mensen - bijvoorbeeld data-analisten, data-journalisten en studenten - datagedreven willen werken. Hopelijk worden op deze manier de CBS-data nóg toegankelijker’.

Relevante links