2. Methode

2.1 Onderzoekspopulatie

De onderzoekspopulatie van dit artikel bestaat uit personen vanaf 18 jaar tot aan AOW-leeftijd die gedurende het gehele eerste kwartaal 2022 in Nederland woonden. Dit is inclusief mensen in institutionele huishoudens. Dat zijn personen in instellingen zoals verpleeg- en verzorgingstehuizen en revalidatiecentra, die daar in principe voor langere tijd (zullen) verblijven. Voor de gehele onderzoekspopulatie is bepaald of zij op enig moment gedurende het eerste kwartaal 2022 gebruik maakten van bijstand. Het percentage personen met bijstand in dit onderzoek is iets hoger dan op Statline wordt gerapporteerd. Dit heeft te maken met andere selecties die in dit onderzoek worden toegepast op leeftijd (de leeftijdgrens van 18 jaar in plaats van 15 jaar) en huishoudens (dit onderzoek is inclusief institutionele huishoudens). Daarnaast wordt bijstandsgebruik niet bepaald op basis van een peildatum maar op basis van enig gebruik in een kwartaal.

De bijstand is een uitkering die wordt toegekend aan een huishouden. De analyses in dit onderzoek worden verricht op persoonsniveau, niet op huishoudensniveau. Zowel de aanvrager als diens eventuele partner worden in dit onderzoek geteld als personen met een bijstandsuitkering. De onderzoekspopulatie bestaat uit 11 051 142 mensen.

2.2 Achtergrondkenmerken

In deze paragraaf geven we een beschrijving van de achtergrondkenmerken. De achtergrondkenmerken zijn grotendeels ontleend aan het verdeelmodel voor de Participatiewet. Met dit verdeelmodel wordt voor elk huishouden de kans op bijstand geschat. Op basis van deze kansen ontvangt de gemeente van het Rijk een budget waaruit de bijstandsuitkeringen betaald kunnen worden.

Herkomst

De herkomst is in het geval dat een persoon is geboren in het buitenland het land waar de persoon is geboren. Wanneer een persoon in Nederland is geboren is de herkomst het geboorteland van de moeder tenzij de moeder ook in Nederland is geboren. In dit geval is de herkomst het geboorteland van de vader. Dit betekent dat wanneer de persoon zelf en beide ouders geboren zijn in Nederland de herkomst Nederlands is.

2.1.1 Onderzoekspopulatie naar herkomst, eerste kwartaal 2022
	Nederland	Geboren in Nederland, ouder(s) in buitenland	Geboren in buitenland
	%	%	%
Totaal	71,6	10,1	18,2
Europa (exclusief Nederland)		2,5	6,4
Turkije		1,3	1,6
Marokko		1,2	1,3
Suriname		1,2	1,2
Nederlands-Caribisch gebied		0,4	0,7
Indonesië		1,9	0,3
Overig Buiten-Europa		1,6	6,7

Leeftijd, geslacht en type huishouden

De leeftijd is gebaseerd op de geboortemaand en geboortejaar zoals deze vermeld staat in de Basisregistratie Personen (BRP). De peildatum was het einde van het eerste kwartaal 2022 (31 maart 2022). Geslacht is gebruikt zoals deze in de BRP is geregistreerd. Het type huishouden bestaat uit de volgende groepen: eenpersoonshuishouden, eenouderhuishouden, institutioneel huishouden, en paar met/zonder kinderen en overige huishoudens.

Andere uitkering en studerend

We bepalen of personen in het eerste kwartaal 2022 gebruik maakten van een andere uitkering (werkloosheid, arbeidsongeschiktheid en/of algemene nabestaandenwet) en of personen stonden ingeschreven bij een onderwijsinstelling. Zowel andere uitkeringen en studeren hangen namelijk samen met het recht op bijstand.

Zorgkosten en zorggebruik

De gezondheidstoestand van personen bepalen we op basis van drie kenmerken: (1) de totale zorgkosten in 2021 gefinancierd uit de Zorgverzekeringswet, (2) de zorgkosten ggz 2021 gefinancierd uit de Zorgverzekeringswet en het gebruik van geneesmiddelen voor depressie, psychose, en/of verslaving, en (3) niet-gebruik of gebruik van geneesmiddelen uit een of meer hoofdgroepen (nul tot vier, vier tot zes, zes tot acht en acht of meer hoofdgroepen). De hoofdgroepen zijn gebaseerd op de anatomische therapeutische en chemische (ATC) classificatie van geneesmiddelen.

De totale zorgkosten (1) zijn opgedeeld in drie gelijke groepen (op basis van tertielgroepen): laag, midden en hoog. In de groep met lage zorgkosten vallen ook mensen met zorgkosten van nul euro. De zorgkosten ggz (2) zijn opgedeeld in twee groepen: gebruik van ggz (nul euro zorgkosten ggz) en wel gebruik van ggz (meer dan nul euro zorgkosten ggz). Personen waarvan de zorgkosten onbekend zijn (omdat zij geen basisverzekering hadden in 2021) zijn ingedeeld in een aparte categorie.

Sociaaleconomische status

Om de sociaaleconomische status (SES) van mensen te bepalen is gebruik gemaakt van de recent ontwikkelde SES-Welvaart, Opleiding en Arbeidsdeelname (SES-WOA) (CBS, 2022c). De SES-WOA wordt, net als een bijstandsuitkering, toegekend aan een huishouden, en geeft een compleet beeld van de sociaaleconomische status van particuliere huishoudens. De SES-WOA bestaat uit drie deelscores: het welvaartsniveau, het opleidingsniveau en de recente arbeidsdeelname. De deelscore welvaartsniveau is gebaseerd op het inkomen en vermogen van een huishouden en dat is nauw verwant met het ontvangen van bijstand. De deelscore welvaart wordt daarom niet gebruikt voor dit onderzoek. Gegevens over het hoogst behaalde opleidingsniveau zijn voor circa 70 procent van de bevolking beschikbaar. Voor het jongere deel van de bevolking is relatief meer informatie beschikbaar dan voor het oudere deel en voor migranten is weinig informatie beschikbaar over de opleiding. In de SES-WOA wordt de informatie over opleidingsniveau die mist geïmputeerd. De imputatie vindt plaats op basis van een multinominaal logistisch regressiemodel met daarin de volgende verklarende variabelen: geslacht, leeftijdsklasse, migratieachtergrond, generatie, stedelijkheid, landsdeel, voornaamste inkomstenbron, welvaartsdecielgroepen en recent arbeidsverleden. Omdat geïmputeerde scores de resultaten kunnen beïnvloeden, is in de regressiemodellen (zie paragraaf 2.3) een indicator opgenomen die aangeeft of er sprake is van imputatie. De arbeidsdeelname is gebaseerd op het arbeidsverleden van de afgelopen vier jaar (voortdurend werkzaam, gedeeltelijk werkzaam, niet werkzaam). Mensen die kort in Nederland zijn, vallen in de categorie niet of gedeeltelijk werkzaam.

We maken gebruik van gegevens over SES-WOA uit 2019 omdat recentere jaren nog niet beschikbaar waren tijdens het uitvoeren van dit onderzoek. De SES-WOA is bepaald op huishoudensniveau. Omdat de analyses in dit onderzoek op persoonsniveau uitgevoerd worden, is de SES-WOA per persoon bepaald door elke persoon in een huishouden (gebaseerd op de samenstelling 2019) de score toe te kennen van het huishouden. Dat komt neer op het hoogst behaalde opleidingsniveau van de hoofdkostwinner of de partner, en het arbeidsverleden van de (meest) werkzame van beide (zie CBS, 2022c). Personen waar de opleidingsniveauscore onbekend was (bijvoorbeeld omdat zij in een institutioneel huishouden wonen of in 2019 niet in Nederland ingezeten waren) zijn ingedeeld in de categorie ‘onbekend’. De opleidingsniveauscore is verder ingedeeld in groepen: laag, midden en hoog.

2.3 Analyse

Om te onderzoeken welke kenmerken samenhangen met het gebruik van bijstand gebruiken we regressieanalyse. De afhankelijke variabele is het gebruik van bijstand (1 = ja, 0 = nee). De modellen zijn geschat aan de hand van Linear Probability Models (LPM) met maximum likelihood. Dit is een lineair regressiemodel dat de kans op de binaire uitkomstvariabele – in dit geval de kans op het gebruik van bijstand – schat. Een alternatief voor het schatten van een model met een binaire afhankelijke variabele is logistische regressie. Dit kent echter twee belangrijke nadelen in deze context. Ten eerste, de coëfficiënten van logistische regressie zijn niet één-op-één te vergelijken tussen groepen of modellen (Mood, 2009). Dit is juist het doel van deze studie. Ten tweede, de coëfficiënten zijn moeilijker te interpreteren omdat ze in log-odds worden uitgedrukt. Dat maakt ze moeilijk te herleiden tot de verschillen zoals getoond in de beschrijvende figuren van paragraaf 3. Een nadeel van LPM is dat het geen rekening houdt met het feit dat de afhankelijke variabele alleen waarden tussen 0 en 1 kan aannemen, waardoor het in sommige gevallen onrealistische voorspellingen kan opleveren (bijvoorbeeld een negatieve kans). Daarom zijn dezelfde modellen ook geschat met logistische regressie. De resultaten van beide methoden leidden tot gelijke conclusies. Vanwege bovengenoemde voordelen worden alleen de resultaten van LPM getoond.

De modellen worden opgebouwd door eerst de verschillen naar herkomstgroep te schatten (de geobserveerde waarden, zoals ook zichtbaar in de beschrijvende figuren van paragraaf 3), en daar stapsgewijs achtergrondkenmerken aan toe te voegen. Op deze manier wordt zichtbaar in hoeverre elk kenmerk de verschillen naar herkomst verklaart.

Voor de geschatte verschillen is in de regressie gebruik gemaakt van Weighted Effects Coding (WEC). Dit betekent dat de coëfficiënten worden uitgedrukt als afwijking van het gemiddelde in plaats van afwijking van de referentiegroep (personen met Nederlandse herkomst, in dit geval). Dit is vergelijkbaar met het centreren van variabelen rond het gemiddelde.