4. Methodologische mogelijkheden voor het definiëren en monitoren van bestaanszekerheid
Het begrip bestaanszekerheid kan op verschillende manieren worden weergegeven. Zo kan er aan de hand van een theoretisch kader zoals de vier vormen van kapitaal (zie Hoofdstuk 2) een overzicht worden gemaakt van de verschillende indicatoren per vorm van kapitaal. Vervolgens kunnen deze indicatoren voor verschillende groepen mensen in Nederland worden weergegeven. Naast het definiëren van bestaanszekerheid met behulp van de vier vormen van kapitaal, kan ook methodologisch onderzocht worden of bestaanszekerheid op een hoger aggregatieniveau gemeten kan worden dan de individuele indicatoren. Een exploratieve factoranalyse (EFA) is een manier om dit te onderzoeken. De mogelijkheden daarvan worden verder uiteengezet in Paragraaf 4.1. Verder dient inzichtelijk gemaakt te worden wat de mogelijkheden en beperkingen zijn van het gebruik van één of meerdere enquêtes en wat daarvan de invloed is op de kwaliteit van monitoring. Dit wordt verder uitgediept in Paragraaf 4.2.
4.1 Factoranalyse
Er is geen eenduidig “cijfer” dat het concept bestaanszekerheid kan meten. Het begrip bestaanszekerheid omvat een breed palet van dimensies, die lastig te vangen zijn in één enkele indicator. Om bestaanszekerheid in brede zin te monitoren, dienen dus verschillende aspecten bekeken te worden, zoals economisch, sociaal, cultureel en persoonskapitaal. Naast inzicht in de losse indicatoren behorend tot deze vormen van kapitaal, zou wel gekeken kunnen worden hoe al deze losse indicatoren zich tot elkaar verhouden in een conceptueel model rondom bestaanszekerheid. Volgt daaruit dat de indicatoren die onder de verschillende vormen van kapitaal geschaard worden met elkaar samenhangen? Of is er wellicht een andere onderliggende structuur in de data? En zijn alle indicatoren relevant of kan het aantal indicatoren gereduceerd worden?
Om inzicht te krijgen in de onderliggende structuur achter bestaanszekerheid, kan gebruik worden gemaakt van een EFA. Hierbij wordt onderzocht of het concept bestaanszekerheid gemeten kan worden door één of meerdere factoren met behulp van de gekozen onderliggende indicatoren. Zie een voorbeeld van een dergelijke structuur in figuur 4.1.1. Met een factoranalyse wordt onderzocht of er factoren te vinden zijn die bijdragen aan het brede concept bestaanszekerheid. Zowel vanuit inhoudelijk als statistisch oogpunt moet gevalideerd worden of de uitkomsten van het factormodel aansluiten bij het hierboven vormgegeven concept bestaanszekerheid. Daarnaast blijft het relevant dat de resultaten bruikbaar zijn voor beleid: er moet dus goed naar beleidsrelevantie en handelingsperspectief gekeken worden.
Als er een onderliggende structuur uit de factoranalyse naar voren komt om bestaanszekerheid te meten, kunnen de losse indicatoren gebruikt worden om bestaanszekerheid samen te vatten in één of meerdere factorscores per individu. Deze factorscores geven aan in hoeverre elk individu scoort op de dimensies van bestaanszekerheid die door de factoren vertegenwoordigd worden. Deze individuele factorscores kunnen vervolgens weer gebruikt worden om op geaggregeerd populatieniveau de bestaanszekerheid van bepaalde groepen en/of regio’s te monitoren. Het is echter wel noodzakelijk om voor iedere persoon in de populatie gegevens over de onderliggende indicatoren beschikbaar te hebben. Vooral bij indicatoren afkomstig uit enquêtes is dat niet altijd mogelijk (zie verder Paragraaf 4.2).
Stappen factoranalyse
Een exploratieve factoranalyse omvat de volgende stappen:
- Exploratief onderzoeken hoeveel factoren er terugkomen in de data. Welke indicatoren horen bij elkaar? En zijn er logische labels te geven aan de groepjes indicatoren (factoren)? Komen hier bijvoorbeeld de vier vormen van kapitaal in terug? EFA onderzoekt hoe verschillende indicatoren met elkaar samenhangen en groepeert indicatoren die sterk met elkaar correleren. Deze groepen kunnen dan gezien worden als factoren, zoals economisch kapitaal of financiële zekerheid.
- Selecteren van het definitieve aantal factoren en de modelkwaliteit beoordelen. Wat is het ideale aantal factoren? En als er wordt uitgaan van deze structuur, hoe goed past dit model dan bij de data? Is het inhoudelijk een logisch model dat in brede zin iets zou kunnen zeggen over bestaanszekerheid? Hierbij wordt ook gekeken naar de factorladingen van indicatoren op een factor, die zeggen iets over hoe sterk een indicator samenhangt met een factor. Daarnaast kan met behulp van andere statistische criteria beoordeeld worden welk definitieve aantal factoren het beste bij de data past. Dit kan onder andere gedaan worden met behulp van: eigenwaarden, een scree-plot, de verklaarde variantie en/of een parallel analyse. Voor meer informatie over factoranalyse kan hoofdstuk 17 uit ‘Discovering Statistics Using R’ van Andy Field, Jeremy Miles en Zoë Field (2012) geraadpleegd worden. Naast statistische validatie speelt ook theoretische validatie een rol: experts bepalen of het gevonden kader en de gevonden structuur aansluit bij de werkdefinitie van bestaanszekerheid.
- Mocht het model goed passen bij de data, dan kunnen factorscores worden berekend op individueel niveau met behulp van het model. Er zijn verschillende methoden voor het maken van samengestelde factorscores. In deze stap zal bekeken worden wat de meest passende methode is.
Voor- en nadelen factoranalyse
Het voordeel van een EFA bij het monitoren van bestaanszekerheid is dat door middel van een model onderzocht kan worden of er een onderliggende structuur te vinden is die goed past bij het concept bestaanszekerheid. Dit zou een stevige basis vormen voor het monitoren van het begrip bestaanszekerheid, die niet alleen theoretisch geaard is, maar ook ondersteund wordt door de onderliggende datastructuur. Het zou inzicht kunnen geven in hoe het begrip bestaanszekerheid er modelmatig uit zou kunnen zien. Als er een passend model gevonden kan worden, geeft dit de mogelijkheid de data verder samen te vatten in één of meerdere globale scores (factoren) waarmee in een oogopslag inzicht verkregen kan worden in de verschillende dimensies van bestaanszekerheid. Deze scores zijn dan ook weer te aggregeren naar verschillende groepen in de populatie, hetgeen inzicht geeft in de mate van bestaanszekerheid van verschillende groepen mensen. Voor beleidsmatig handelingsperspectief blijft het daarnaast wenselijk om te kunnen sturen op individuele indicatoren.
Er zijn echter ook risico’s bij een EFA. Er is namelijk altijd een mogelijkheid dat er geen logische onderliggende datastructuur gevonden kan worden voor bestaanszekerheid. Dit kan komen omdat het begrip complex is en theoretisch nog niet voldoende onderbouwd, of omdat er geen passend model gevonden kan worden van voldoende kwaliteit. Ook kan het in de praktijk lastig zijn om het aantal uiteindelijke factoren te selecteren. Dit is niet puur met statistische richtlijnen te bepalen: er is ook een inhoudelijke component die bepaalt of een factormodel logisch in elkaar zit.
Daarnaast is er voor het berekenen van een factorscore data nodig op alle indicatoren voor elk individu. Omdat er ook met enquêtedata gewerkt gaat worden (om de subjectieve kant van bestaanszekerheid te kunnen meenemen), zal dit niet voor ieder individu mogelijk zijn. Er zal daarom een methode ontwikkeld moeten worden om voor de ontbrekende enquêtedata een factorscore te schatten. Of om op geaggregeerd niveau de gemiddelde factorscore van groepen uit de steekproef te herwegen naar de hele populatie. Dit zou alleen kunnen als er met één enquête wordt gewerkt, omdat vrijwel elke enquête steekproefgewichten beschikbaar heeft die de scores “ophogen” en wegen. Wanneer er wordt gewerkt met meerdere enquêtes bestaat het risico dat de steekproeven niet overlappen en er daardoor nog meer ontbrekende data ontstaan. Er wordt dan “onzekerheid op onzekerheid gestapeld”, hetgeen de kwaliteit van het factormodel ondermijnt. Bovendien kan een factormodel alleen geschat worden op volledige data, bij te veel ontbrekende data valt er geen model meer te schatten.
Tenslotte kan met een factoranalyse onderzocht worden of bestaanszekerheid op dezelfde manier gemeten kan worden bij verschillende groepen in de populatie. Bestaanszekerheid zou bijvoorbeeld iets anders kunnen betekenen voor jongeren dan voor ouderen en daarom ook anders gemeten moeten worden. Omdat er nog niet bekend is of er een passend factormodel gevonden kan worden in het algemeen, zou deze vraag in vervolgonderzoek verder bekeken moeten worden om de meting van bestaanszekerheid nog betrouwbaarder te maken.
4.2 Gebruik van enquêtedata
Het doel is om in dit onderzoek niet alleen de informatie uit registers te gebruiken, maar ook informatie over tevredenheid, gevoelens over financiën, stress, culturele activiteiten en andere indicatoren die niet integraal uit registers beschikbaar zijn. Hiervoor is het noodzakelijk om enquêtes te gebruiken. Omdat het gebruik van enquêtes ervoor zorgt dat de informatie slechts voor een kleinere steekproef beschikbaar is, moet er gekeken worden naar eventuele belemmeringen. Bij gebruik van meerdere enquêtes is er vaak geen sprake van overlap van de steekproef. Daarom lijkt het onwaarschijnlijk dat meerdere enquêtes in samenhang bekeken kunnen worden. Voor de factoranalyse lijkt daarom de meest voor de hand liggende optie om één enquête te gebruiken. In Bijlage 3 is een overzicht opgenomen van de enquêtes die, vanwege hun omvang, in aanmerking kunnen komen voor het monitoren van bestaanszekerheid. Hierbij is - naast de grootte van de steekproef - ook gekeken naar de doelpopulatie, periodiciteit van de data en de onderwerpen die aan bod komen. De enquête Nederland in Beeld (NiB) lijkt het meest geschikt wegens de grote verscheidenheid aan onderwerpen, echter is de steekproefgrootte niet heel groot. Er dient verder onderzocht te worden of dit tot robuuste en bruikbare resultaten leidt.