Opleidingsniveaubestand

Wat behelst het onderzoek

Doel

Het doel van het opleidingsniveaubestand is om voor een zo groot mogelijk deel van de Nederlanders het hoogste behaalde en hoogst gevolgde opleidingsniveau vast te leggen zodat tal van onderzoeken kunnen worden uitgebreid met informatie over opleidingsniveau.

Doelpopulatie

Alle personen die op 1 oktober van het verslagjaar in een Nederlandse gemeente zijn ingeschreven.

Statistische eenheid 

Persoon.

Aanvang onderzoek

Het opleidingsniveaubestand in zijn huidige vorm is beschikbaar vanaf verslagjaar 2013.

Frequentie

Het opleidingsniveaubestand wordt jaarlijks gemaakt.

Publicatiestrategie

In september van jaar J wordt de voorlopige versie van het opleidingsniveaubestand over J-1 gemaakt en de definitieve versie van het opleidingsniveaubestand over J-2.

Hoe wordt het uitgevoerd

Soort onderzoek

Het opleidingsniveaubestand is gebaseerd op een combinatie van gegevens uit registers en steekproefgegevens.

Bronnen

Registergegevens worden beschikbaar gesteld door het Ministerie van Onderwijs, Cultuur en Wetenschap, het Uitvoeringsinstituut Werknemers Verzekeringen en de gemeenten (de Basis Registratie Personen). De enquêtegegevens zijn afkomstig van de Enquête beroepsbevolking (EBB) die door het CBS wordt uitgevoerd, zie de onderzoeksbeschrijving van de Enquête beroepsbevolking (EBB).

Aantal waarnemingen

Via registers is van ruim 11 miljoen Nederlanders het opleidingsniveau waargenomen. Via steekproefonderzoek is van 900 duizend Nederlanders het opleidingsniveau waargenomen. De aantallen nemen jaarlijks toe omdat de waarneming cumulatief is: eerder gedane waarnemingen worden voor een nieuw verslagjaar opnieuw gebruikt en uitgebreid met nieuwe waarnemingen. Die nieuwe waarnemingen betreffen deels personen die eerder niet waren waargenomen en deels nieuwe diploma’s die zijn behaald door personen die eerder al waren waargenomen.

Controle- en correctiemethode

Via de registers die gebruikt worden voor het opleidingsniveaubestand wordt al het onderwijs waargenomen dat door de overheid wordt bekostigd. Echter, niet al het onderwijs dat wordt gevolgd aan particuliere instellingen of in het buitenland wordt door deze registers waargenomen. Daardoor onderschat het opleidingsniveaubestand in circa 2,5 procent van de gevallen het opleidingsniveau. Hiervoor wordt gecorrigeerd door te imputeren. Daartoe wordt op basis van registerwaarnemingen en EBB-waarnemingen een model geschat dat vervolgens wordt gebruikt om in een klein deel van de records het opleidingsniveau naar boven toe bij te stellen.

Weging

Het opleidingsniveaubestand bevat niet van alle Nederlanders het opleidingsniveau. De waarneming is bovendien sterk selectief naar leeftijd. Dit komt doordat ouderen veelal hun opleidingen hadden afgerond voordat de registers tot stand kwamen die voor het opleidingsniveaubestand gebruikt worden. Om informatie te krijgen over het opleidingsniveau van de hele Nederlandse bevolking en om te corrigeren voor selectiviteit, wordt opgehoogd en gewogen. Daarbij wordt onderscheid gemaakt tussen waarnemingen vanuit registers en waarnemingen op basis van de EBB. De eerste zijn niet gebaseerd op een aselecte steekproef. Daarom mogen zij uitsluitend zichzelf vertegenwoordigen. Met andere woorden, registerwaarnemingen krijgen per definitie een gewicht gelijk aan 1 en worden dus feitelijk uitgesloten van de weging. Daarentegen zijn de EBB-waarnemingen wel gebaseerd op een aselecte steekproef, zij kunnen worden onderworpen aan een weging. Ten behoeve van de weging wordt de populatie opgesplitst in twee groepen:

De zogenoemde registerpopulatie. Deze deelpopulatie van de Nederlandse bevolking betreft alle personen van wie het opleidingsniveau middels één of meer registers is waargenomen. Ook personen van wie het opleidingsniveau via de EBB én via één of meer registers is waargenomen, worden gerekend tot de registerpopulatie. De records die behoren tot de registerpopulatie krijgen allemaal gewicht 1. Zij vertegenwoordigen alleen zichzelf.

De zogenoemde restpopulatie. Deze deelpopulatie van de Nederlandse bevolking betreft alle personen van wie het opleidingsniveau via geen enkel register is waargenomen. De records uit de EBB die betrekking hebben op de restpopulatie vormen een steekproef uit deze restpopulatie, en worden opgehoogd en gewogen zodat ze na weging de gehele restpopulatie vertegenwoordigen. Voor de weging wordt een uitgebreid model gebruikt dat rekening houdt met de achtergrondkenmerken leeftijd, geslacht, herkomst, burgerlijke staat, type huishouden, regio, inkomen en inkomensbron

Na weging is de selectiviteit opgeheven en vertegenwoordigt het opleidingsniveaubestand de gehele Nederlandse bevolking.

Wat is de kwaliteit van de uitkomsten

Nauwkeurigheid

steekproeffout

Het opleidingsniveaubestand is deels gebaseerd op steekproefwaarneming. Om die reden is sprake van een steekproeffout. Die steekproeffout kan sterk variëren al naar gelang de deelpopulatie die in ogenschouw wordt genomen. Een deelpopulatie die uit veel ouderen bestaat zal gepaard gaan met een verhoudingsgewijs grote steekproeffout omdat de waarneming onder ouderen sterker leunt op steekproefwaarneming. Met behulp van een bootstrap methode wordt de steekproeffout, in de vorm van betrouwbaarheidsintervallen, bepaald.

non-responsfouten

Een deel van de populatie (de restpopulatie, zie paragraaf Weging) wordt waargenomen via steekproefonderzoek (EBB). Die waarneming is behept met selectiviteit door non-respons. Die selectiviteit zal voor een belangrijk deel, maar niet volledig, worden opgeheven door de toegepaste weging.

modelaannamefouten

De onderschatting van particulier onderwijs en onderwijs gevolgd in het buitenland wordt gecorrigeerd middels modelmatige imputatie (zie paragraaf Controle- en correctiemethode). Het toegepaste model houdt rekening met diverse achtergrondkenmerken van personen. Wanneer tabellen worden gemaakt waarin het opleidingsniveau is weergegeven naar andere achtergrondkenmerken dan degenen die in het model zijn opgenomen, is het mogelijk dat vertekening optreedt.

Volgtijdelijke vergelijkbaarheid

De jaargangen vanaf 2013 zijn volgtijdelijk goed vergelijkbaar. Er zijn geen noemenswaardige methodebreuken opgetreden. Bovendien zijn de waarnemingen die gebruikt worden voor de opeenvolgende jaargangen niet onafhankelijk: voor een nieuwe jaargang worden de eerdere waarnemingen opnieuw gebruikt en uitgebreid met nieuwe waarnemingen (zie paragraaf Aantal waarnemingen). Daardoor zijn de jaar op jaar steekproeffluctuaties betrekkelijk gering.

Beschrijving kwaliteitsstrategie

De nauwkeurigheid van de uitkomsten wordt gemaximaliseerd door gebruik te maken van een groot aantal waarnemingen en door de sterke kanten van de bronnen optimaal te combineren.