Auteur: G.M.J. Mars (CBS), S.G. van den Heuvel (TNO), J.C.M. Knops (CBS), E.M.M. de Vroome (TNO), W.J.M. Gielen (CBS), L.M.C. van Dam (TNO), G.M. Gommans (CBS), B.J.M. Janssen (CBS)
Nationale Enquête Arbeidsomstandigheden (NEA) 2023 - Onderzoeksbeschrijving

7. Weging

7.1 Weegmethode

De steekproef is willekeurig in twee helften verdeeld, cluster 1 en 2, en in de vragenlijst is sturing aanwezig waardoor een deel van de vragen alleen aan cluster 1 wordt getoond en een ander deel van de vragen alleen aan cluster 2, het split-half ontwerp.

Omdat er uitspraken gedaan dienen te worden over zowel beide helften als over de hele populatie worden er twee wegingen uitgevoerd: één weging voor cluster 1 en één weging voor cluster 2. Achteraf worden de gewichten van beide wegingen gecombineerd via zogenaamde proportionele gewichten. De twee clusters wegen mee naar rato van de respons. Dit leidt in het algemeen tot iets nauwkeurigere schattingen dan wanneer de twee clusters gelijk meewegen. Bovendien is het gemiddelde proportionele gewicht niet alleen in de totale respons, maar ook in beide clusters gelijk aan 1 als de beide clusters naar rato van de respons meewegen.

Daarnaast is het bij de NEA gebruikelijk dat er twee soorten gewichten in het microdatabestand zijn opgenomen: zogenaamde ophooggewichten die optellen tot de populatieomvang en zogenaamde proportionele gewichten die optellen tot de steekproefomvang.

Het microdatabestand bevat daarom meerdere gewichten. In paragraaf 10.2 staan instructies voor gebruikers van het bestand voor het gebruik van de verschillende weegfactoren, waaronder enkele aandachtspunten voor het gebruik van de jaren 2020 en 2021.

7.2 Weegmodel

Voor de NEA 2023 is het volgende weegmodel gebruikt:

[Geslacht(2) × Leeftijd(6)] +

[Stratum(44)]+

[Herkomst(5)] +

[Type huishouden(7)] +

[Type contract(2)] +

[Primair inkomen(10)] +

[landnegendeling(9)]

Al deze variabelen zijn categoriaal. Het aantal categorieën staat bij elke variabele aangegeven tussen haakjes. Het weegmodel maakt uitsluitend gebruik van registergegevens. De verdeling van het steekproefkader, de steekproef en de bruikbare respons over de categorieën van deze variabelen is in paragraaf 6.2 beschreven.

7.3 Gewichten

Voor cluster 1 en 2 is een lineaire weging uitgevoerd op alle bruikbare responsen, waarbij enerzijds rekening wordt gehouden met ongelijke insluitkansen en anderzijds met mogelijk selectieve non-respons. Uitvoeren van de wegingen levert correctie- en eindgewichten op zoals weergegeven in figuur 7.3.1 en 7.3.2.

7.3.1 Spreiding van correctiegewichten, NEA 2023
Productgroep Waarde Eerste serie
Cluster 1 Minimum 0,26
Cluster 1 1e kwartiel 0,75
Cluster 1 Mediaan 0,94
Cluster 1 3e kwartiel 1,18
Cluster 1 Maximum 4,00
Cluster 2 Minimum 0,29
Cluster 2 1e kwartiel 0,76
Cluster 2 Mediaan 0,94
Cluster 2 3e kwartiel 1,18
Fietsen Maximum 4,06
7.3.1 Spreiding van correctiegewichten, NEA 2023
 Cluster 1Cluster 2
Correctiegewichten44.06
Bron: CBS, TNO

Het weegmodel is robuust. De verdelingen van zowel de correctie- als eindgewichten is vergelijkbaar voor cluster 1 en 2. Er zijn geen negatieve gewichten en het aantal ‘grote’ correctiegewichten is beperkt. Daarnaast zijn er geen eindgewichten kleiner dan 1 (het is niet logisch als een persoon voor minder dan zichzelf meetelt). Ook de celvulling is voldoende: de kleinste cel bevat 111 personen voor cluster 1 en 107 personen voor cluster 2.

7.3.2 Spreiding van eindgewichten, NEA 2023
Productgroep Waarde Eerste serie
Cluster 1 Minimum 23,61
Cluster 1 1e kwartiel 201,41
Cluster 1 Mediaan 270,63
Cluster 1 3e kwartiel 337,87
Cluster 1 Maximum 1005,88
Cluster 2 Minimum 24,48
Cluster 2 1e kwartiel 201,68
Cluster 2 Mediaan 269,26
Cluster 2 3e kwartiel 331,42
Fietsen Maximum 1009,96
7.3.2 Spreiding van eindgewichten, NEA 2023
 Cluster 1Cluster 2
Eindgewichten1005.881009.96
Bron: CBS, TNO