Gezonde levensverwachting naar onderwijsniveau

3. Methode

Het berekenen van (gezonde) levensverwachting naar onderwijsniveau gaat in een aantal stappen:
 • Het schatten van sterftekansen naar onderwijsniveau
 • Het kalibreren van die sterftekansen aan de totale sterftekansen in de bevolking
 • Het berekenen van de levensverwachting naar onderwijsniveau
 • Het schatten van prevalenties van (on)gezondheid
 • Het berekenen van de gezonde levensverwachting naar onderwijsniveau
Deze stappen worden elk in aparte paragrafen beschreven. Daarbij wordt vooral ingegaan op de wijzigingen ten opzichte van de methode van voor revisie. Voor onderdelen die niet zijn gewijzigd wordt soms verwezen naar de methodebeschrijving van voor revisie (Bruggink, 2017). Als een deelprocesstap niet is beschreven, mag verondersteld worden dat deze ongewijzigd is gebleven.

3.1 Het schatten van sterftekansen naar onderwijsniveau

Sterftekansen naar onderwijsniveau vormen de basis voor het bepalen van de levensverwachting naar onderwijsniveau. Om die sterftekansen te bepalen wordt gebruik gemaakt van de bij het CBS aanwezige onderwijsniveaubestanden. Deze geven informatie over het hoogstbehaalde en hoogstgevolgde onderwijsniveau van de bevolking van Nederland. De onderwijsniveaubestanden zijn gevuld met gegevens vanuit onderwijsregisters en met gegevens vanuit de Enquête Beroepsbevolking (EBB), waarin onderwijsniveau is uitgevraagd. De registraties bevatten vooral informatie over het jongere deel van de bevolking. Voor de oudere leeftijden leunen de bestanden meer op de informatie uit de EBB.
Er zijn onderwijsniveaubestanden voor ieder jaar, met als peildatum 1 oktober. Aan de onderwijsniveaubestanden wordt informatie gekoppeld over sterfte. Die informatie is aanwezig bij het CBS, via de bevolkingsstatistiek. Op die manier wordt bepaald of een persoon overlijdt in de periode van 1 jaar vanaf de peildatum (dus in de periode van 1 oktober van jaar X t/m 30 september van jaar X+1).
Voor het onderwijsniveau worden daarbij de categorieën laag (basisonderwijs, vmbo, mbo1, avo-onderbouw), middelbaar (havo, vwo, mbo2, mbo3 en mbo4) en hoog (hbo, wo) onderscheiden.
Voor personen van 25 jaar of ouder wordt gebruik gemaakt van het hoogstbehaalde onderwijsniveau. Voor personen van 20 t/m 24 jaar wordt gebruik gemaakt van het hoogstgevolgde onderwijsniveau. Voor personen van jonger dan 20 jaar is opleidingsinformatie van de ouders/verzorgers aangekoppeld. Voor hen wordt het hoogstbehaalde onderwijsniveau van de ouder(s)/verzorger(s) gebruikt. Als van twee ouders/verzorgers het onderwijsniveau bekend is, wordt daaruit de hoogste genomen. Kinderen waarvan van geen van de ouders/verzorgers het onderwijsniveau bekend is, zijn niet meegenomen in de analyse.
Voor een verslagperiode van 4 jaar, worden vanuit 3 onderwijsniveaubestanden sterftekansen geschat. Voorbeeld:
De periode waarover (gezonde) levensverwachtingen gepubliceerd gaan worden is 2015/2018. Dan worden de onderwijsniveaubestanden met de peildata 1-10-2015, 1-10-2016 en 1-10-2017 gebruikt. Dit is een wijziging ten opzichte van de methode van voor revisie, toen er maar gebruik gemaakt werd van 1 onderwijsniveaubestand (uit het midden van de verslagperiode). Door nu gebruik te maken van meer bestanden worden de schattingen robuuster.

Er worden dus drie keer sterftekansen bepaald voor de kruisingen van geslacht (totaal, mannen, vrouwen), onderwijsniveau (laag, middelbaar, hoog) en leeftijd. Voor leeftijd wordt dat gedaan voor elke individuele leeftijd tot en met 89 jaar, voor de leeftijdsgroep 90 t/m 94 en voor de leeftijdsgroep van 95 jaar of ouder. Dit is een wijziging ten opzichte van de methode van voor revisie, toen sterftekansen alleen bepaald werden voor de leeftijdsgroepen: 0 jaar, 1 t/m 4, 5 t/m 9, 10 t/m 14, …, 70 t/m 74, 75 t/m 80 en 80 jaar of ouder. De wijziging leidt tot verfijndere (en betere) schattingen van de sterftekansen naar onderwijsniveau. De gemiddelde leeftijd binnen leeftijdsgroepen kan nu minder variëren, wat vergelijkingen tussen groepen van hetzelfde geslacht en of onderwijsniveau beter mogelijk maakt. Het gemiddelde van de drie sterftekansen wordt gebruikt voor kalibratie aan de totale sterftekansen.

3.2 Kalibreren van sterftekansen aan de totale sterftekansen in de bevolking

De onderwijsniveaubestanden zijn niet integraal. We hebben dus niet voor iedereen informatie over het onderwijsniveau (of dat van de ouders). Om af te dwingen dat de levensverwachtingen naar onderwijsniveau in lijn komen te liggen met de door CBS gepubliceerde levensverwachtingen voor de hele bevolking, worden de sterftekansen uit de vorige stap gekalibreerd. Dat gaat als volgt:

 • Op basis van de bevolkings- en sterfteaantallen, die gepubliceerd zijn op CBS-StatLine, worden voor de betreffende verslagperiode, voorwaardelijke sterftekansen voor een leeftijd/geslachtgroep bepaald. Noem deze kansen X. 
 • Uit de in de vorige stap bepaalde sterftekansen op basis van de onderwijsniveaubestanden worden voor diezelfde leeftijd/geslachtgroep de sterftekansen genomen. Noem deze kansen Y. 
 • De verhouding tussen die twee kansen is dan X/Y = Z 1).
 • De factor Z wordt vervolgens toegepast op de opleidingsspecifieke sterftekansen voor de betreffende leeftijd/geslachtgroep. Daarmee worden gekalibreerde sterftekansen verkregen.
 • Ook de ‘ruwe’ sterftekansen die geschat zijn voor leeftijdsgroepen (90-94 en 95+) worden gekalibreerd op de leeftijdsspecifieke sterftekansen X. Dus voor de leeftijden 90, 91, 92, 93, 94, 95, 96, 97, 98 en 99+.

3.3 Het berekenen van levensverwachting naar onderwijsniveau

De gekalibreerde sterftekansen worden ingevoerd in een calculatiesheet die is gebaseerd op de standaardsheet, die behoort bij de methode van Sullivan (Jagger, Euro-reves, 2001). De calculatiesheet is in feite niet veel anders dan een overlevingstafel, waarin op basis van leeftijdsspecifieke sterftekansen de levensverwachting van een groep wordt bepaald. De calculatiesheet biedt de mogelijkheid om eenvoudig de stap van levensverwachting naar gezonde levensverwachting te maken. De calculatiesheet is afgestemd op de binnen het CBS gebruikelijke methodiek om levensverwachting te bepalen (Stoeldraijer & Harmsen, 2017, Van der Meulen & Janssen, 2007)

3.4 Het schatten van prevalenties van ongezondheid

Om de stap van levensverwachting naar gezonde levensverwachting te maken zijn prevalenties van ongezondheid nodig. Ongezondheid kan daarbij op verschillende manieren bepaald worden. Elke manier levert zijn eigen variant van gezonde levensverwachting op. Het CBS onderscheidt de volgende varianten:

 • Levensverwachting in als goed ervaren gezondheid (op basis van een enkelvoudige vraag naar gezondheidservaring).
 • Levensverwachting zonder lichamelijke beperkingen (op basis van de OESO-vragenset over beperkingen)
 • Levensverwachting zonder chronische aandoeningen (op basis van een selectie van aandoeningen)
 • Levensverwachting in goede geestelijke gezondheid (op basis van de Mental Health Inventory-5)
 • Levensverwachting zonder GALI-beperkingen (op basis van de Global Activity Limitations Indicator

Voor de gezonde levensverwachting naar onderwijsniveau is de variant op basis van de GALI-beperking niet eerder bepaald. Daar wordt nu mee gestart. Deze variant kan vanaf de verslagperiode 2015/2018 worden bepaald. De variant op basis van chronische aandoeningen is niet langer opgenomen. De andere varianten worden van 2007/2010 bepaald.
De prevalenties van ongezondheid zijn gebaseerd op de CBS Gezondheidsenquête. Dit is een jaarlijks onderzoek naar de gezondheid, de leefstijl en het zorggebruik van de bevolking van Nederland, woonachtig in particuliere huishoudens.
Het onderzoek telt jaarlijks ca 9500 respondenten, waardoor er per combinatie van leeftijd, geslacht en onderwijsniveau niet zoveel waarnemingen zijn. Om toch voldoende waarnemingen te hebben worden vier onderzoeksjaren samengevoegd, bijvoorbeeld 2007 t/m 2010 of 2015 t/m 2018. Maar dan nog is het niet mogelijk om prevalentieschattingen te maken voor even verfijnde groepen als waarvoor sterftekansen bepaald worden.
De prevalenties worden geschat voor de kruisingen van geslacht (totaal, mannen, vrouwen), onderwijsniveau (laag, middelbaar, hoog) en leeftijdsgroep. Als leeftijdsgroepen worden onderscheiden: 0 jaar, 1 t/m 4, 5 t/m 9, 10 t/m 14, …, 75 t/m 79, 80 t/m 84 en 85 jaar of ouder 2). Dit is een beperkte wijziging ten opzicht van de methode van voor revisie, toen de hoogste leeftijdsgroep gevormd werd door mensen van 80 jaar of ouder. In de nieuwe hoogste leeftijdsgroepen zijn de aantallen waarnemingen bij sommige geslacht/opleidingsgroepen soms beperkt. Er zijn bijvoorbeeld niet veel oudere hoogopgeleide vrouwen. Dat maakt de prevalentieschattingen voor die groepen tamelijk grof. Op jongere leeftijden komt dat overigens ook een enkele keer voor, wat ook al het geval was bij de methode van voor de revisie.
Om de prevalenties te kunnen schatten per onderwijsniveau is informatie over opleiding nodig. Die informatie wordt binnen de Gezondheidsenquête uitgevraagd. Voor respondenten tot 12 jaar worden de antwoorden gegeven door een ouder/verzorger en wordt ook van de ouders/verzorgers informatie over het onderwijsniveau uitgevraagd. Het onderwijsniveau wordt ook hier weer in drie groepen ingedeeld (laag, middelbaar, hoog):

 • Voor kinderen tot 12 jaar wordt het hoogstbehaalde onderwijsniveau van de ouder(s)/verzorger(s) genomen.
 • Voor jongeren van 12 tot 25 jaar wordt het hoogstgevolgde onderwijsniveau genomen.
 • Voor personen vanaf 25 jaar wordt het hoogstbehaalde niveau genomen.

3.5 Het berekenen van de gezonde levensverwachting naar onderwijsniveau

De op basis van de Gezondheidsenquête bepaalde prevalenties van ongezondheid worden toegevoegd aan de calculatiesheets waarin de levensverwachting al was bepaald. Door het toevoegen van de prevalenties en de bijbehorende aantallen onderliggende waarnemingen worden de gezonde levensverwachting en de bijbehorende standaardfouten bepaald. Dit gebeurt voor de leeftijden, 0, 1, 5, 10, …, 75, 80 en 85. Er worden uiteindelijk (gezonde) levensverwachtingen gepubliceerd voor de leeftijden 0, 1, 5, 10, …, 75 en 80.

1) De waarde Z ligt meestal in de buurt van 1. Ter illustratie: voor de 100 leeftijden waarvoor sterftekansen geschat werden voor de periode 2015/2018 voor de totale bevolking (mannen en vrouwen samen) lag de waarde van Z 82 keer tussen de 0,8 en 1,2. Lage waarden van Z worden vooral aangetroffen bij hele lage leeftijden.
2) Op lagere leeftijden worden de volgende aannames gedaan:

 • Variant lichamelijke beperkingen: betreffende vragen worden niet gesteld over respondenten jonger dan 12. Aanname dat deze beperkingen niet voorkomen op die leeftijden. Omdat hoogopgeleide 12 t/m 14 jarigen nauwelijks of niet voorkomen, wordt voor hen de prevalentie van hoogopgeleide 15-19-jarige toegepast.
 • Variant geestelijke gezondheid: betreffende vragen worden niet gesteld over respondenten jonger dan 12. Aanname dat voor die lage leeftijden dezelfde prevalentie geldt als voor 12-14-jarigen. Omdat hoogopgeleide 12 t/m 14 jarigen nauwelijks of niet voorkomen, wordt voor hen de prevalentie van hoogopgeleide 15-19-jarige toegepast.

Variant GALI-beperking: betreffende vragen worden niet gesteld over respondenten van 0 en 1 jaar. Aanname dat deze beperkingen op die leeftijden niet voorkomen.
Zie ook: Naar een betere gezonde levensverwachting