Beveiliging statistische data hoog op agenda

/ Auteur: Miriam van der Sangen
UNECE congres bij het CBS, Den Haag
© Sjoerd van der Hucht Fotografie
Van 29 tot en met 31 oktober 2019 vond bij het CBS in Den Haag de ‘Work Session on Statistical Data Confidentiality’ plaats. Het programma van de werksessie was intensief met een groot aantal lezingen en discussies op het gebied van beveiliging van statistische data. Met de toename van de hoeveelheid data, nemen de risico’s op het gebied van privacy toe.

De beveiliging van statistische data is internationaal een belangrijk en actueel onderwerp. In opdracht van de UNECE, de economische commissie voor Europa van de Verenigde Naties, wordt één keer per twee jaar een werksessie over dit onderwerp georganiseerd. Dit keer waren Eric Schulte Nordholt en Peter-Paul de Wolf namens het CBS de drijvende krachten achter het driedaagse evenement. Vier onderwerpen stonden centraal: toegang tot microdata, outputcontrole bij remote access, tabelbeveiliging en softwareontwikkelingen op het gebied van beveiliging van gegevens voor de volkstelling 2021. Er waren ruim 80 deelnemers uit alle delen van de wereld en er werden in totaal ongeveer 40 presentaties gegeven.

Trends signaleren

Bij de driedaagse werksessie zijn volgens Taeke Gjaltema, die namens de UNECE nauw betrokken was, mooie concrete resultaten behaald. ‘Tijdens de werksessie signaleren we trends en geven statistische organisaties samen richting aan hun werk op het gebied van vertrouwelijke data. Met de toename van de hoeveelheid data en de beschikbaarheid van nieuwe databronnen – denk aan big data en administratieve registers – neemt het risico op onthulling van individuele personen en bedrijven en het beschikbaar komen van privacygevoelige informatie toe. Verder is steeds vaker informatie over de locatie van personen beschikbaar en ook dat brengt risico’s met zich mee.’ Reinoud Stoel, hoofd van het methodologieteam van het CBS in Den Haag: ‘De verandering in de hoeveelheid en het type gegevens waarmee statistiek wordt gemaakt, is precies de reden waarom de methoden op het gebied van statistische beveiliging continu in ontwikkeling zijn. Deze terugkerend internationale werksessie is een uitgelezen kans om kennis en ervaring te delen en samen vooruit te kijken naar de uitdagingen die er aan komen.’

UNECE congres bij het CBS, Den Haag
© Sjoerd van der Hucht Fotografie

Toegang tot microdata

Microdata zijn data op persoons-, bedrijfs- en adresniveau die onderling gekoppeld kunnen worden. Onderzoekers kunnen hiermee onder strikte voorwaarden zelf statistisch onderzoek doen. Aanvankelijk waren de statistische bureaus van Denemarken en Nederland de eerste statistiekbureaus waar onderzoekers toegang tot microdata hebben. Schulte Nordholt: ‘Inmiddels kan dit ook bij andere statistische bureaus. Je ziet dat zij voor dezelfde vraagstukken staan als wij in het begin. Wie kan toegang tot de microdata krijgen, onder welke voorwaarden, hoe luiden de contracten, hoe controleren we de resultaten, et cetera? Tijdens de werksessie hebben we deze vragen besproken.’ Controle van de resultaten van onderzoek dat met behulp van microdata is uitgevoerd, is hieraan gerelateerd. ‘Steeds meer onderzoekers maken er gebruik van’, aldus De Wolf. ‘Daardoor moeten de statistische bureaus meer controle op de uitkomsten uitvoeren. Dat kan op basis van steekproeven, maar je kunt ook een deel van de controles automatiseren. Daarnaast moet er aandacht zijn voor het trainen van degenen die de controle uitvoeren. Tijdens de werksessie zagen we dat de aanpak per Europees land erg verschilt.’

Tabelbeveiliging

Een ander belangrijk onderwerp tijdens de werksessie was tabelbeveiliging. ‘Allerlei vernieuwingen op het gebied van de publicatie van tabellen passeerden hierbij de revue’, zegt De Wolf. ‘Er zijn veel tools beschikbaar om tabellen te publiceren, maar de problematiek wordt steeds complexer. Het gevaar van onthulling van gevoelige gegevens neemt toe.’

Volkstelling 2021

Daarnaast was er veel aandacht voor de nieuwste softwareontwikkelingen op het gebied van beveiliging van gegevens voor de volkstelling 2021. Schulte Nordholt: ‘Alle Europese landen voeren in 2021 een volkstelling uit. We hebben met name gediscussieerd over hoe we daarbij omgaan met privacy. Zowel het Europese statistiekbureau als de overheden van de Europese landen willen steeds gedetailleerdere uitkomsten. De klassieke beveiligingsmethoden voor tabellen leveren bij een grote set gedetailleerde tabellen echter te veel informatieverlies op voor gebruikers. Als de celwaarden enigszins worden aangepast, zijn de conclusies van het onderzoek niet echt anders maar is het heel moeilijk individuele persoonsinformatie te onthullen. Dat is de reden waarom verschillende statistiekbureaus – waaronder het CBS – onderzoek doen naar het toevoegen van zogenaamde ruis.’

Samenwerking

Gjaltema is enthousiast over het feit dat tijdens de werksessie veel innovatieve benaderingen zijn gedeeld. ‘Zowel van statistiekbureaus als van academische instellingen en andere onderzoeksinstellingen. Ook zijn afspraken voor samenwerking gemaakt. Daarnaast hebben deelnemers aangegeven bijvoorbeeld mee te willen werken aan een roadmap voor toegang tot microdata.’ Ook Schulte Nordholt en De Wolf spreken van een geslaagde bijeenkomst, niet alleen qua inhoud maar ook qua organisatie. ‘Er was veel te regelen voor 80 deelnemers – van de visa tot het gezamenlijk diner ‘s avonds – maar alles is voorspoedig verlopen. We kregen na afloop veel complimenten van de deelnemers, Eurostat en de UNECE en willen iedereen bedanken die er aan heeft bijgedragen van dit evenement een succes te maken.’

Onlangs vond in Genève een conferentie plaats van de High-Level Group for the Modernisation of Official Statistics (HLG-MOS). Daar werd in vervolg op de bovenstaande werksessie een project geselecteerd voor 2020 over input privacy-preserving techniques met work packages over Secure Multiparty Computation en Homomorphic Encryption methods.