CBS verkent potentie van privacy preserving techniques met universiteiten

/ Auteur: Miriam van der Sangen
Databeveiliging
© Hollandse Hoogte / Westend61 GmbH
Het CBS is continu op zoek naar nieuwe methoden en technieken om te kunnen voldoen aan de sterk groeiende vraag naar statistische informatie. Uitgangspunt hierbij is dat de privacy voor alle betrokken partijen altijd gewaarborgd is. Samen met externe partners onderzoekt het CBS daarom de potentie van privacy preserving techniques. In 2020 is het CBS een samenwerkingsproject gestart met de Maastricht University (UM) en de Rijksuniversiteit Groningen (RUG). Streven van dit project is een generieke data-infrastructuur te realiseren die gebruikt kan worden voor het uitvoeren van wetenschappelijk of statistisch onderzoek. Daarbij blijven de data bij de leverende partij.

Data blijven beveiligd bij de bronhouders

Privacy preserving techniques zijn nieuwe cryptografische technieken waarmee analyses op privacygevoelige data worden uitgevoerd, zonder dat partijen inzicht hebben in die data zelf en zonder dat die data de eigen organisatie verlaten. ‘De rode draad bij toepassing van deze technologie is dat de data beveiligd bij de bronhouders blijven en analyse op afstand plaatsvindt, waarbij de privacy gewaarborgd blijft’, licht Paul Grooten van het CBS toe. Als Enterprise Data Architect is Grooten namens het CBS betrokken bij de samenwerking met de twee vooraanstaande Nederlandse universiteiten.

Voordelen

Het toepassen van privacy preserving techniques heeft een aantal voordelen. ‘Het voordeel is dat de gegevens bij de primaire bronhouder - eigenaar van data - blijven en dat hieruit slechts die informatie wordt gehaald die nodig is voor het statistisch onderzoek. Dit past goed in het doel van de AVG om zo min mogelijk gegevens te delen. Voorts zijn wij als CBS verplicht om veilig om te gaan met informatie, die personen en bedrijven aan het CBS aanleveren.’ De toepassing van privacy preserving techniques kan dan uitkomst bieden en is volgens Grooten nog om andere belangrijke redenen noodzakelijk. ‘De hoeveelheid bronnen en data nemen hand over hand toe. Het wordt steeds moeilijker om al die data op één plek te verzamelen en te beveiligen. Daarnaast zorgt het analyseren van data bij de bron ervoor dat je altijd gebruik maakt van de meest actuele data’.

Wetenschappelijk onderzoek

Wetenschappelijke onderzoeksinstellingen zoals de RUG en UM verzamelen ook steeds gedetailleerdere informatie bij de uitvoering van wetenschappelijke onderzoeksprojecten. Denk bijvoorbeeld aan longitudinale onderzoeken zoals Lifelines van de RUG en het Maastrichtse CARRIER-project om hartziekten voor een langere periode te volgen op basis van een groot aantal medische indicatoren. Voor het beantwoorden van sommige vragen is het hierbij noodzakelijk om de verzamelde onderzoeksgegevens te combineren met andere datasets, bijvoorbeeld die van het CBS. Daarom doet het CBS samen met de RUG en UM onderzoek naar een nieuwe werkwijze om data op een verantwoorde manier te delen met behulp van privacy preserving techniques.

‘De data van het CBS zijn vooral sociaaleconomisch van aard. Daarbij is de privacy van personen volledig gewaarborgd’

Whitepaper

Grooten: ‘Het vertrekpunt voor de samenwerking met de UM, de RUG en het CBS vormt een whitepaper, dat is geschreven door dr. Jaap-Henk Hoepman, die als universitair hoofddocent is verbonden aan de vakgroep IT Recht van de RUG. In dit whitepaper wordt het doel van de samenwerking tussen het CBS, de UM en de RUG beschreven. Verder wordt ingegaan op de vragen ‘wat willen we bereiken’, ‘waarom willen we dit’ en ‘hoe bereiken we dit’. Ook worden in het whitepaper vijf verschillende privacy preserving techniques beschreven. Denk bijvoorbeeld aan rekenen met versleutelde gegevens of het delen van gepseudonimiseerde data.’

Innovatieve benaderingen

Doel van de samenwerking met de UM en de RUG is om innovatieve benaderingen – zowel technisch, organisatorisch, juridisch als anderszins – te ontwikkelen om data die zich bij verschillende bronnen bevinden te ontsluiten, te koppelen en te aggregeren tot informatie die niet op een andere wijze verkregen kan worden. Leen Roosendaal, directeur beleids- en managementondersteuning bij het CBS: ‘Uitgangspunt hierbij is dat de brondata bij de leverende partij blijven. Tevens moeten de gebruikte data antwoord geven op de onderzoeksvraag en plaatsvinden binnen de privacywetgeving, zoals opgenomen in de CBS-wet en de Algemene Verordening Gegevensbescherming (AVG).’

Pilot gestart

Een voorbeeld van een PPT-pilot tussen het CBS en de UM is het CARRIER-project. Onderzoekers van de UM en het Maastricht UMC hebben een zelflerende eHealth-toepassing ontwikkeld ter preventie van coronaire hartziekten. De digitale toepassing maakt daarbij onder meer gebruik van grote hoeveelheden data van ziekenhuizen, huisartsen en het CBS die met behulp van PPT worden ontsloten. Roosendaal: ‘De data van het CBS zijn vooral sociaaleconomisch van aard. Zo kunnen bijvoorbeeld gegevens van patiënten met een geschiedenis van coronaire hartziekten worden gecombineerd met gegevens over leefstijltrends onder de bevolking en de fysieke omgeving van een persoon. Daarbij is de privacy van personen volledig gegarandeerd.’

Interventie

Op basis van de bovengenoemde gecombineerde data kunnen door de onderzoekers van het CARRIER-project risico-inschattingen worden gemaakt voor het ontwikkelen van een coronaire hartziekte. Die kennis wordt gebundeld in een voorspellend model, waarbij uiteraard rekening wordt gehouden met de transparantie en ethische aspecten van voorspellende modellen. Met behulp daarvan kan door de behandelend arts nauwkeurig worden ingeschat wie er risico loopt op basis van zijn of haar individuele kenmerken. Vervolgens kan dan gezocht worden naar aanknopingspunten voor interventie. ‘Een mooi voorbeeld van hoe de toepassing van privacy preserving techniques de maatschappij verder kan helpen’, aldus Grooten.