Sociale wetenschap profiteert van dataplatform ODISSEI

/ Auteur: Miriam van der Sangen
CBS-er John Kartopawiro toont de proof of concept challenges
© Sjoerd van der Hucht Fotografie
Gemakkelijker data delen, analyseren en combineren: dataplatform ODISSEI maakt het mogelijk. Sociale wetenschappers krijgen via ODISSEI toegang tot grootschalige en longitudinale dataverzamelingen die gekoppeld zijn aan CBS-registraties. Daarmee kunnen zij nieuwe discipline-overstijgende onderzoeksvragen beantwoorden en bestaande vragen op een nieuwe manier onderzoeken. Onlangs is een geslaagde proef afgerond.

Wereldtop

Eind 2016 werd dataplatform ODISSEI gelanceerd als gezamenlijk initiatief van het CBS, de Nederlandse Organisatie voor Wetenschappelijk Onderzoek (NWO) en een aantal universitaire partners. Professor Pearl Dykstra, hoogleraar Empirische Sociologie aan de Erasmus Universiteit Rotterdam, leidt de realisatie. ‘Nederland behoort tot de wereldtop in de sociale wetenschappen’, zegt zij. ‘Maar er zijn allerlei factoren die die koppositie bedreigen. Denk aan beperkte middelen om datacollecties te onderhouden en beperkte computercapaciteit om verrijkte databestanden te analyseren. ODISSEI moet ervoor zorgen dat Nederland koploper in dit vakgebied blijft.’ ODISSEI is opgenomen op de Nationale Roadmap Grootschalige Wetenschappelijke Infrastructuur 2016-2020 van de Nederlandse Organisatie voor Wetenschappelijk Onderzoek (NWO).

groepsfoto ODISSEI
© Sjoerd van der Hucht Fotografie

Data delen

Met ODISSEI is een wetenschappelijke infrastructuur voor de sociale wetenschappen in Nederland gerealiseerd. Wim Schaasberg, hoofd Micro Data Services van het CBS: ‘Deze infrastructuur maakt het mogelijk om meer gepseudonimiseerde data te delen en ook het analyseren en combineren van data wordt hierdoor makkelijker. Onderzoekers kunnen via remote access - onder strikte voorwaarden - nu al gebruik maken van de gegevens van het CBS, maar de gekoppelde survey- en registerdata willen we ook binnen ODISSEI op een gebruiksvriendelijke en zeer veilige manier beschikbaar stellen.’ Voor de benodigde dataveiligheid en rekenkracht werkt het CBS intensief samen met SURFsara, een organisatie die de academische wereld ondersteunt op het gebied van IT en data science. Ook beheert ze een nationale supercomputerfaciliteit.

Data veilig koppelen

Het afgelopen jaar hebben het CBS en SURFsara een virtuele IT-omgeving ingericht waar onderzoekers gekoppelde data kunnen analyseren in een high performance computing-omgeving. Daarvoor startten zij samen met de onderzoeksgroep van hoogleraar en biologisch psycholoog Dorret Boomsma (VU) een proof of concept. Hier is onderzocht of de virtuele IT-omgeving voldoet aan de eisen van het CBS op juridisch, technisch en beveiligingsgebied. De onderzoekers bekeken specifiek of op dataplatform ODISSEI een veilige koppeling mogelijk is tussen CBS-microdata en de bij SURFsara opgeslagen zeer omvangrijke dataset van het Nederlands Tweelingenregister. De koppeling van deze gegevens is inmiddels tot stand gekomen.

Sociale wetenschappers krijgen via ODISSEI toegang tot grootschalige en longitudinale dataverzamelingen die gekoppeld zijn aan CBS-registraties

Open voor meer onderzoekers

Schaasberg: ‘Nu de proof of concept succesvol is afgerond, doet een extern bureau eerst nog een beveiligingstest. Als die geslaagd is, wordt met drie pilots onderzocht hoe we dataplatform ODISSEI kunnen opschalen en vervolgens openstellen voor meer onderzoekers. Die staan namelijk al te dringen. We verwachten in april 2019 de eerste resultaten van deze pilots te presenteren.’

ODISSEI heeft inmiddels 29 deelnemers, waaronder alle universiteiten en verschillende kennisinstellingen. Zij krijgen via een abonnement allerlei voordelen, zoals reductie op de kosten voor het gebruik van CBS-data en mogelijkheden voor dataverzameling. Meer weten? Raadpleeg dan: www.odissei-data.nl