Vooronderzoek AI-model intergenerationele armoede

4. Conclusie vooronderzoek

In deze notitie is nagegaan of bovenop bestaande (CBS-)publicaties naar intergenerationele inkomensoverdracht aanvullend onderzoek mogelijk is en meerwaarde zou hebben, door (1) gebruik van AI, (2) een bredere populatie of (3) meer achtergrondkenmerken. Uitgangspunt hierbij is het onderzoeken van de samenhang van het inkomen (i.h.b. armoede) van ouders en kinderen in vrijwel dezelfde levensfase: hoe groot is het verband tussen de inkomenssituatie waarin je opgroeit en je eigen inkomen later?

Om tot gedetailleerde schattingen van de samenhang te komen door middel van de XGBoost techniek is een dataset van voldoende omvang en met voldoende (variatie in) relevante achtergrondkenmerken nodig. Het verbreden van de doelgroep t.o.v. het eerder uitgevoerde onderzoek naar intergenerationele armoede ligt niet voor de hand, omdat naarmate personen in het cohort ouder zijn, de ouders zich in een andere levensfase (opgroeiende kinderen) bevinden dan de volwassen kinderen zelf. Dat kan tot een overschatting van de inkomensmobiliteit leiden. Het destilleren en koppelen van de benodigde datasets is bij een dergelijke opzet bovendien nogal bewerkelijk. De beoogde onderzoekspopulatie zou daarom, net als in het reeds gepubliceerde onderzoek, personen van 25 tot en met 42 jaar in 2021 omvatten, en hun ouders in 1996. Voor de personen in 2021 zijn voldoende aanvullende achtergrondkenmerken beschikbaar uit de registers van het CBS. Voor hun ouders in 1996 zijn echter vooral basiskenmerken beschikbaar zoals leeftijd, herkomst en huishoudenssamenstelling. Deze zijn reeds meegenomen in het eerder gepubliceerde onderzoek. Er zijn voor deze oudere generatie onvoldoende aanvullende achtergrondkenmerken voorhanden in de registers die het CBS ter beschikking heeft, wanneer terug in de tijd wordt gekeken.

De conclusie is dan ook dat het uitvoeren van een onderzoek gebaseerd op AI-techniek zoals XGBoost op dit moment weinig meerwaarde heeft ten opzichte van het onderzoek naar intergenerationele armoede uit 2022 en eerder. Wellicht dat over enkele jaren een dergelijk onderzoek wel zin vol zou kunnen zijn. De verwachting is immers dat tegen die tijd wel voldoende aanvullende registerdata beschikbaar zullen zijn voor de personen die dan 25 tot en met 42 jaar zijn, en hun ouders 25 jaar eerder.