CBS en VU: vooruitgang boeken door samenwerking

/ Auteur: Miriam van der Sangen
De Vrije Universiteit van Amsterdam (VU) en het CBS gaan onderzoeken hoe zij de bestaande samenwerking kunnen intensiveren. Daartoe vond op 29 mei jl. bij de VU een expertmeeting plaats tussen de onderzoekers van beide instituten. Er werd gediscussieerd over bestaande en nieuwe samenwerkingsmogelijkheden. Ook bespraken zij nieuwe technieken zoals ‘distributed analytics’ om meerdere databronnen die op verschillende plaatsen opgeslagen zijn - zonder deze te verplaatsen - gezamenlijk te analyseren. Directeur-Generaal Tjark Tjin-A-Tsoi en rector Vinod Subramaniam van de VU ondertekenden aan het eind van de meeting een raamovereenkomst om de samenwerking te bekrachtigen.

Raamovereenkomst

Het CBS en de VU werken al jarenlang op verschillende gebieden samen. Om die samenwerking te intensiveren werd besloten een raamovereenkomst af te sluiten. Professor Dorret Boomsma, biologisch psychologe aan de VU en bekend door haar onderzoek op het gebied van gedragsgenetica en haar Tweelingenonderzoek: ‘Door die raamovereenkomst wordt alles wat nu al mogelijk is makkelijker, denk bijvoorbeeld aan directe samenwerking tussen de onderzoekers van het CBS en de VU. Nu we elkaar ontmoet hebben en face-to-face hebben gesproken, kunnen we dat continueren met een aantal projecten.’ De expertmeeting noemt Boomsma zeer waardevol: ‘Vijf van onze VU-onderzoekers verzorgden een presentatie, waarop de CBS-onderzoekers direct feedback hebben gegeven.’

Nederlands Tweelingen Register

Boomsma begon in 1987 met het Nederlands Tweelingen Register. Dertig jaar later bevat het meer dan 100.000 meerlingen en is het een van de belangrijkste internationale databanken voor humane genetica. Met haar onderzoeksgroep zoekt Boomsma naar antwoorden op vragen zoals: in hoeverre zijn menselijke eigenschappen en ziekten genetisch bepaald en in hoeverre zijn zij het gevolg van de omgeving waarin en de manier waarop iemand is opgevoed. Wat verwacht Boomsma in het kader van haar Tweelingenonderzoek van de nauwere samenwerking met het CBS? ‘Wij zouden een aantal basale vragen graag beantwoord willen zien. Het CBS heeft bijvoorbeeld interessante informatie om omgevingskarakteristieken van mensen in kaart te brengen. Het Tweelingen Register bevat informatie over genetische verwantschappen en over eigenschappen van mensen, die je alleen maar kunt verzamelen door rechtstreeks naar mensen toe te gaan. Denk bijvoorbeeld aan attitudes en persoonlijkheid. De combinatie van die verschillende typen informatie levert nieuwe inzichten op’.

Veel mogelijkheden

Wat Boomsma duidelijk is geworden in de afgelopen 2 jaar in haar contacten met het CBS is dat er tegenwoordig heel veel onderzoek mogelijk is op basis van informatie uit databases. ‘We kijken vaak naar Scandinavië als het om populatieregisters gaat, maar er is in Nederland in dit opzicht ook heel veel mogelijk. Er moet wel nog veel gebeuren aan de ontsluiting ervan. Een belangrijke volgende stap is de NWO-roadmap, die grootschalige onderzoeksfaciliteiten biedt.’ Behalve veel mogelijkheden ziet Boomsma ook nog wel enkele hobbels bij de samenwerking. 'Zo heeft het CBS in de raamovereenkomst de eis gesteld dat we de statistische analyses binnen de omgeving van het CBS moeten doen (uit privacy-overwegingen, red.). Dan lopen we tegen barrières op, bijvoorbeeld omdat je functionele MRI-data vanwege de omvang van de datasets niet zo maar kunt koppelen aan CBS-data op het gebied van opleidingen.’

‘Voor het CBS is het van groot belang om vooruitgang te boeken met textmining op het gebied van big data’

Textdatamining

Bart Bakker is hoofd methodologie bij het CBS in Den Haag. Tevens is hij bijzonder hoogleraar aan de VU, waar hij zich bezig houdt met de methodologie van registerdata voor sociaal wetenschappelijk onderzoek. Net als Boomsma is ook hij van mening dat de expertmeeting op 29 mei jl. veel informatie heeft opgeleverd. ‘We hebben een aantal workshops gehad, waarin we gesproken hebben over data en textmining (met diverse ICT-technieken waardevolle informatie halen uit grote hoeveelheden tekstmateriaal, red.), werken met elkaars bestanden en het koppelen van bestanden. Voor het CBS is het van groot belang om vooruitgang te boeken met textmining op het gebied van big data, bijvoorbeeld om producten in winkels te kunnen classificeren voor de bepaling van het consumentenprijsindexcijfer. Begin juli hebben we met de VU hier de eerste bespreking over om te bekijken of we op dit punt kunnen samenwerken.’ Een ander voor het CBS interessant onderzoeksgebied is volgens Bakker ‘distributed analytics’. Dat is een techniek waarbij meerdere databronnen, die bij verschillende instituten zijn opgeslagen, gezamenlijk worden geanalyseerd zonder dat deze verplaatst worden. De VU verricht proeven met dit soort onderzoek, maar ook bij andere Nederlandse universiteiten (Eindhoven, Maastricht) is men met dit onderwerp bezig.

Pionieren

Terugkijkend op de expertmeeting ziet Bakker volop mogelijkheden voor samenwerking. ‘Tijdens de meeting waren drie soorten onderzoekers aanwezig. Allereerst de onderzoekers die al met het CBS samenwerken. Daarnaast was er een groep die met CBS-data werkt, maar geen contacten met CBS’ers heeft over de data. De derde groep waren personen die nog niet met CBS-data werken en ook geen contacten hebben met onze onderzoekers. Vooral met de laatste twee groepen willen wij de contacten uitbreiden en onderling kennis uitwisselen.’ Het laatste deel van de expertmeeting was de ondertekening van de raamovereenkomst door Directeur-Generaal Tjark Tjin-A-Tsoi van het CBS en rector Vinod Subramaniam van de VU. Beiden onderstreepten het belang van gezamenlijk investeren om verder te komen. Tjin-A-Tsoi benadrukte dat het gebruik van big data zoals sensordata grote kansen biedt voor universitair onderzoek en officiële statistiek. ‘Er valt een wereld te winnen als we die data goed zouden kunnen gebruiken. Vanwege het feit dat we aan het pionieren zijn, is de kans dat projecten niet direct tot het gewenste resultaat leiden groot. Juist bij dat soort onderzoek kan gezamenlijk investeren het risico voor beide instituten verkleinen.’