3. Kernbegrippen, databestanden en methoden
3.1 Kernbegrippen
Doelpopulatie
De doelpopulatie bestaat uit werknemers van 15 tot 75 jaar woonachtig in Nederland in 2021. In dat jaar behoorden 9,3 miljoen personen tot de werkzame beroepsbevolking. Van deze groep waren 7,8 miljoen personen werkzaam als werknemer, de overigen werkten als zelfstandige. Ten tijde van het onderzoek was 2021 het meest recente jaar waarvoor de analyse kon worden uitgevoerd. De registerbestanden voor de bepaling van de belangrijkste inkomensbron een jaar na de enquêtedatum waren toen nog niet beschikbaar voor latere verslagjaren.
Werkdruk
In dit onderzoek is de definitie van TNO voor werkdruk gehanteerd: een situatie waarbij een disbalans is ontstaan tussen de eisen van het werk en de mogelijkheden van de werknemer om het werk goed uit te voeren (Wiezer et al., 2013). De TNO-definitie sluit aan bij bestaande theorieën over werkstress (o.a. Karasek, 1979; Karasek en Theorell, 1990) en wordt ook in de wetenschappelijke literatuur toegepast (Mather, 2015). De gedachte is dat disbalans tussen taakeisen en regelmogelijkheden leidt tot werkstressklachten. Dit vergroot de kans op uitval door ziekte (de Vries et al., 2018). Voor de operationalisering van werkdruk, zie Bijlage 7.3.
Uitstroom uit de werknemersbaan
Uitstroom wordt gemeten één jaar na de enquêtedatum (t+1). Er is sprake van uitstroom, als de respondent op t+1 niet in dezelfde hoofdbaan werkt als tijdens de enquête. Heeft de respondent op t+1 ander werk als belangrijkste inkomensbron, dan is er sprake van uitstroom naar een andere baan als werknemer of zelfstandige. Bij de overige uitstroombestemmingen wordt eveneens gekeken naar de belangrijkste inkomensbron:
- Een uitkering in het kader van ziekte of arbeidsongeschiktheid, een sociale voorziening (onder meer de Participatiewet), of een werkloosheidsuitkering (WW). Deze uitkeringen duiden in veel gevallen op uitstroom vanwege ziekte. Voor de arbeidsongeschiktheidsuitkeringen is dat evident, maar een deel van de uittreders wordt door het UWV als minder dan 35 procent arbeidsongeschikt beoordeeld en komt dan in de WW of bijstand.
- Een pensioenuitkering.
- Overige uitstroom, bijvoorbeeld vanwege onvoldoende rechten op een uitkering of hervatting van de opleiding.
3.2 Databestanden
Voor het onderzoek zijn gegevens gebruikt uit de volgende databestanden:
Nationale Enquête Arbeidsomstandigheden (NEA)
De Nationale Enquête Arbeidsomstandigheden (NEA) is een jaarlijkse enquête met als doel het in kaart brengen van informatie over onder meer de arbeidsomstandigheden van werknemers. De NEA wordt uitgevoerd door het CBS en TNO, in samenwerking met het ministerie van Sociale Zaken en Werkgelegenheid. De doelpopulatie betreft alle werknemers van 15 tot 75 jaar die in Nederland wonen en werken.
Polisadministratie
De Polisadministratie bevat een integrale waarneming van inkomstenverhoudingen van personen (banen of uitkeringen) die bij in Nederland gevestigde werkgevers of instellingen in dienst zijn (geweest).
SECM-bestand
Dit bestand bevat gegevens over tot welke sociaaleconomische categorie (SECM) personen behoren in een bepaalde maand.
Werkgeversenquête (WGE)
In de Werkgeversenquête (WGE) wordt informatie verzameld over werkgevers in de zorg- en welzijnssector. Het CBS voert dit onderzoek uit in opdracht van het ministerie van Volksgezondheid, Welzijn en Sport (VWS) voor het onderzoeksprogramma Arbeidsmarkt Zorg en Welzijn.
Werknemersenquête (WNE)
In de Werknemersenquête (WNE) wordt informatie verzameld over werknemers die werkzaam zijn in de zorg- en welzijnssector. Ook dit onderzoek wordt door het CBS uitgevoerd voor het onderzoeksprogramma Arbeidsmarkt Zorg en Welzijn.
Analysebestand
Het analysebestand bestaat uit een koppeling op persoonsniveau van het NEA-jaarbestand (2021) met de Polis-administratie op enquêtedatum t en t+1 en met het SECM-bestand op t+1. Met dit analysebestand is de kans geschat op uitstroom vanuit de hoofdbaan naar een andere zelfstandigen- of werknemersbaan op t+1, en naar overige uitstroombestemmingen: uitkeringen in het kader van werkloosheid, ziekte of arbeidsongeschiktheid, pensioen, of uitstroom zonder uitkering. Deze kans wordt afgezet tegen de individuele werkdruk in jaar t. Het databestand bevat 49 659 records.
3.3 Methoden
Multinomiale logistische regressie
Voor het analyseren van de uitstroom in termen van werkdruk en andere variabelen is multinomiale logistische regressie (Agresti, 2003) gebruikt. De afhankelijke variabele is een discrete variabele voor de beschrijving van de uitstroom, met als categorieën: uitstroom naar ander werk, naar een uitkeringssituatie, naar pensioen, en naar overige. De referentiecategorie van deze afhankelijke variabele is: geen baanbeëindiging.
Modelselectie
Voor het selecteren van het best passende model wordt gebruikgemaakt van het Akaike Informatie Criterium (Akaike, 1973). Dit is een maat voor de kwaliteit van de modelfit, waarbij rekening wordt gehouden met de complexiteit van het model. Zie Bijlage 7.1 voor de resultaten.
Modeldiagnostiek
De modeldiagnostiek kijkt naar de mate waarin het model de geobserveerde data goed kan voorspellen. Hiervoor zijn verschillende methoden ingezet:
- Berekening van gestandaardiseerde Pearson-residuen (Agresti, 2002; Pierce & Schafer, 1986);
- Vergelijking van gewogen schattingen voor een uitstroomcategorie met de voorspelde uitstroom, naar achtergrondkenmerken in StatLine;
- Berekening van ROC-curves per uitstroomkanaal (Agresti, 2003; Fawcett, 2006).
De resultaten van de modeldiagnostiek staan in Bijlage 7.2.
Mediatie-analyse
De samenhang van een onafhankelijke variabele met een afhankelijke variabele kan via een directe interactie plaatsvinden, maar ook indirect. Mediatie-analyse probeert deze afzonderlijke onderdelen van de samenhang te splitsen. In dit artikel wordt gebruik gemaakt van de zogenaamde ‘potential outcomes’ aanpak van Imai et al. (2010).
Het indirecte effect wordt wiskundig gedefinieerd door de afhankelijke variabele, bijvoorbeeld uitstroom naar een andere baan, te berekenen voor twee verschillende situaties. De eerste situatie betreft een simulatie waarbij de waarde van de mediërende variabele wordt berekend alsof er sprake is van hoge werkdruk. In de tweede situatie wordt deze simulatie herhaald, maar nu alsof geen van de werknemers werkdruk ervaart. Het verschil van de uitkomsten in deze twee situaties vertegenwoordigt dan het indirecte effect.