2. Methode
2.1 Data
In dit onderzoek zijn de gegevens geanalyseerd van alle 287 566 vrouwen van 15 tot 65 jaar die op 1 januari 2022 stonden ingeschreven in de Basisregistratie Personen (BRP) en voldeden aan de volgende criteria: zij hadden in 2022 geen officieel inkomen uit arbeid (in Nederland of daarbuiten), waren niet ingeschreven in een onderwijsprogramma, ontvingen geen uitkeringen en leefden niet in een institutioneel huishouden. De selectie van deze groep is gebaseerd op de sociaaleconomische categorievariabele van het CBS (zie Integraal Inkomens- en Vermogensonderzoek (IIV) | CBS). Dit betekent dat de volgende groepen zijn uitgesloten:
- Personen geregistreerd als werknemer, directeur-grootaandeelhouder, zelfstandige ondernemer, andere zelfstandige of meewerkend gezinslid.
- Personen die onderwijs volgden, een opleiding deden of in training waren (ongeacht of zij een inkomen hadden).
- Ontvangers van werkloosheids-, ziekte- en arbeidsongeschiktheidsuitkeringen, pensioen- en bijstandsuitkeringen.
Toeslagen, zoals kinderbijslag, huurtoeslag of zorgtoeslag—bedoeld als tegemoetkoming in de kosten van bijvoorbeeld kinderopvang, huur en zorgverzekeringen—zijn niet meegenomen als uitsluitingscriterium. Dit betekent dat vrouwen in huishoudens die deze toeslagen ontvangen nog steeds deel kunnen uitmaken van de onderzoekspopulatie. In hetzelfde jaar voldeden 72 982 mannen aan deze criteria, wat betekent dat 80 procent van de personen zonder baan of uitkering in Nederland vrouwen waren.
2.2 Clusteringvariabelen
Op basis van de literatuur over arbeidsmarktparticipatie (Cipollone et al., 2014; Kan, 2007; Klasen & Pieters, 2012; Van Damme, Kalmijn & Uunk, 2008) zijn clusteringvariabelen geselecteerd om de data in betekenisvolle clusters in te delen. Het onderwijsniveau is hierbij als clusteringvariabele opgenomen en gemeten op een 8-puntsschaal, variërend van basisonderwijs tot een masterdiploma of hoger. Vanwege een groot aantal ontbrekende waarden in deze variabele, werd het onderwijsniveau voor vrouwen met een ontbrekende waarde geïmputeerd op basis van het gemiddelde onderwijsniveau van vrouwen met dezelfde leeftijd en herkomst.
Daarnaast is de financiële situatie van de vrouwen meegenomen op basis van de financiële welvaart, gemeten in percentielgroepen. Particuliere huishoudens werden verdeeld in 100 gelijke groepen op basis van vermogen en gestandaardiseerd inkomen. De financiële welvaart van een huishouden is bepaald door zowel het gestandaardiseerd inkomen als het vermogen. Na rangschikking op basis van inkomen en vermogen werd de financiële welvaart van een huishouden berekend door de som van het cumulatieve aandeel in het totale inkomen en het cumulatieve aandeel in het totale vermogen. Op basis van deze optelling werden de huishoudens van laag naar hoog gerangschikt en verdeeld in 100 groepen van gelijke omvang. De eerste groep bevat de 1 procent huishoudens met de laagste financiële welvaart, terwijl de honderdste groep de 1 procent huishoudens met de hoogste financiële welvaart omvat (Van den Brakel & Gidding, 2019).
De relatiestatus is geoperationaliseerd in drie categorieën: geen partner, samenwonend en gehuwd of geregistreerd partnerschap. Hierbij is belangrijk te weten dat individuen zonder partner mogelijk wel een relatie hebben. Leeftijd werd opgenomen als continue variabele. Daarnaast werd er onderscheid gemaakt tussen vrouwen zonder kinderen, vrouwen met kinderen van 0 tot 5 jaar, vrouwen met minderjarige kinderen vanaf 5 jaar en vrouwen met volwassen kinderen. Deze classificatie omvat biologische en adoptiekinderen, maar geen pleegkinderen.
De herkomst van een persoon werd bepaald op basis van de geboorteplaats van zowel de persoon zelf als diens ouders. Er werden vijf categorieën onderscheiden. (1) Nederlandse herkomst verwees naar personen die in Nederland geboren waren en van wie beide ouders eveneens in Nederland geboren waren. (2) Personen die in Nederland geboren waren en ten minste één ouder hadden die afkomstig was uit Europa, exclusief Nederland, vielen in de tweede categorie. (3) De derde categorie omvatte personen die in Nederland geboren waren en ten minste één ouder hadden die buiten Europa geboren was. (4) De vierde categorie betrof personen die niet in Nederland geboren waren, maar geboren zijn in een ander Europees land. (5) Tot slot omvatte de vijfde categorie personen die niet in Nederland geboren waren maar buiten Europa geboren zijn.
Tot slot werd de mate van verstedelijking van de woongemeente als continue variabele opgenomen, variërend van niet-stedelijk (1) tot zeer stedelijk (5), bepaald aan de hand van dichtheidsgrenzen van 500, 1 000, 1 500 en 2 500 adressen per vierkante kilometer.
Om te voorkomen dat verschillen in meeteenheden en variantie de clusteranalyse vertekenen (Mooi et al., 2018), werden de continue variabelen (leeftijd, onderwijsniveau, verstedelijking en financiële welvaart) genormaliseerd naar een schaal van 0 tot 1, wat de aanbevolen standaardisatiemethode is voor clusteranalyses (Milligan & Cooper, 1988).