Big data en deep data

© CBS

Het CBS heeft de laatste jaren de samenwerking gezocht met de universiteiten. Gezamenlijk wordt onderzoek gedaan en kennis en expertise uitgewisseld. Jaarlijks doen tientallen studenten scriptie-onderzoeken met CBS-data. Het CBS biedt stageplekken en organiseert datacamps. In zomercursussen zoeken studenten, onderzoekers en CBS-medewerkers naar oplossingen voor complexe (statistische) vraagstukken.

Het CBS financiert ook een aantal bijzondere leerstoelen. Dr. Ruben van Gaalen is een van de CBS-hoogleraren. Hij onderzoekt in Amsterdam de dynamiek van levenslopen. Daarvoor gebruikt hij de registergegevens van het Stelsel van Sociaal-statistische Bestanden (SSB).
Van Gaalen onderzoekt wat de effecten zijn van gebeurtenissen en omstandigheden in de vroege jeugd op de kansen – op een diploma, op werk, op een relatie – op latere leeftijd, en wat daarbij de rol is van het gezin. Door de levenslopen van mensen nauwkeurig te volgen, kunnen sociale verschillen binnen één generatie, maar ook over diverse generaties, worden vastgesteld. Hij hoopt met zijn onderzoek ‘het complexe verhaal achter maatschappelijke fenomenen en veranderingen’ te ontrafelen.

Sociaal milieu doet ertoe

Meer in het bijzonder gaat hij op zoek naar het antwoord op de vraag of de levenslopen van laag- en hoogopgeleiden en hun kinderen steeds meer uiteen gaan lopen, vooral waar het gaat om het verzilveren van maatschappelijke kansen. Van Gaalen: ‘Het maakt nog steeds uit in welk sociaal milieu kinderen opgroeien. Kinderen lijken in veel opzichten erg op hun ouders. We weten bijvoorbeeld al dat scheiden en hertrouwen in de lagere sociale klassen vaker voorkomt. De vervolgvraag is of en hoe de levenslopen van de betrokken kinderen door dergelijke familiedrama’s beïnvloed worden. Kinderen van ouders met een hoge opleiding, een goedbetaalde baan, een grote vriendenkring en een gevulde boekenkast – veel sociaal kapitaal – hebben bijvoorbeeld meer succes op school en op de arbeidsmarkt dan kinderen van andere ouders.’
Dat succes hangt samen met het feit dat naast materiele zaken (geld, spullen) ook normen, waarden, gevoelens en gedragingen van ouder op kind worden overgedragen. Van Gaalen: ‘Dat heeft in de eerste plaats ermee te maken dat intelligentie en gezondheid sterk genetisch bepaald zijn. Kinderen zien hun ouders bovendien vaak als rolmodel. Ze doen hun ouders bewust of onbewust na. Kinderen kiezen bijvoorbeeld nogal eens dezelfde studie en hetzelfde beroep als hun ouders.’
Ouders kunnen het gedrag van hun kinderen actief bijsturen door toezicht, belonen en corrigeren, zodat kinderen zich de gedragsnormen en -waarden van hun ouders toe-eigenen. ‘Het leesgedrag van ouders, gezamenlijk museumbezoek en verre vakanties, en discussies over politiek en filosofie bij het avondeten verrijken het leven van kinderen. Goed opgeleide ouders kunnen hun kinderen, als die minder goed presteren op school, beter helpen.’

Opvattingen en houdingen

Met registers als basis heeft Van Gaalen aan data geen gebrek. Het lukt ook steeds beter om daar op een slimme manier steekproeven uit af te bakenen. Dat heet smart sampling. Van Gaalen heeft er al ervaring mee in een onderzoek naar de effecten van co-ouderschap na een scheiding en de inhoud van het ouderschapsplan, onderzoek dat hij heeft gedaan met sociologen en juristen van de Universiteit Utrecht. Op basis van de registers kon de groep personen worden benaderd die in een bepaald jaar uit elkaar was gegaan en die minimaal één minderjarig kind hadden. Van Gaalen: ‘Vroeger zouden we een zeer grote steekproef hebben moeten trekken. Dit is goedkoper en efficiënter. En toch ontbreken veel kwalitatieve gegevens in registers, zoals over opvattingen, houdingen, tevredenheid, geluk. Voor het volledige verhaal blijven enquêtes nodig.’

Deep data

Nóg verder inzoomen en nóg dieper de data induiken levert informatie op over (zeer) kleine groepen, zoals over kinderen die in sterk gedepriveerde gezinnen moeten opgroeien. Gebruikmakend van een veelheid aan registraties, zoals ziekenhuis-, jeugdzorg- en politiedossiers, die op individueel of op gezinsniveau kunnen worden gecombineerd, zijn deze gezinnen in beeld te krijgen.
Geen big data dus, maar deep data. Het SSB biedt de mogelijkheid om kenmerken te combineren om de relatief kleine groep zwaar gedepriveerde gezinnen in kaart te brengen en te volgen. Het is van belang te weten hoe groot deze groepen zijn, maar ook waardoor ze in de problemen zijn gekomen en hoe lang ze in die situatie blijven. Het is zelfs mogelijk de uiterst kleine groep kinderen af te bakenen die vóór het vijfde levensjaar met letsel in het ziekenhuis zijn opgenomen of zelfs door moord of doodslag zijn omgekomen. ‘Dat zijn gelukkig marginale groepen. Maar het is wel belangrijk vat te krijgen op de leefsituatie van kinderen aan de onderkant van de maatschappelijke ladder.’

1980 - heden 1999: feestjaar wordt actiejaar