Auteur: Marc Smeets, Jan van den Brakel
Toelichting berekening kwartaal- en jaarcijfers Gezondheidsenquête 2020

1. Inleiding

De gezondheidsenquête (GE) is een doorlopend steekproefonderzoek dat door het CBS wordt uitgevoerd met als doel de gezondheid, de leefstijl en het zorggebruik van de Nederlandse bevolking te beschrijven. Doordat de GE herhaaldelijk wordt uitgevoerd ontstaan er tijdreeksen die de ontwikkeling van de variabelen met betrekking tot gezondheid, leefstijl en zorggebruik door de tijd heen zo goed mogelijk beschrijven. De dataverzameling is gebaseerd op een sequentieel mixed-mode design waarbij gebruik wordt gemaakt van internetwaarneming (cawi) en face-to-facewaarneming (capi). Tot en met 2019 zijn op basis van het onderzoek alleen jaarcijfers over de gezondheid, de leefstijl en het zorggebruik van de Nederlandse bevolking gepubliceerd.

Door het tijdelijk wegvallen van de capi-waarneming als gevolg van de coronamaatregelen in 2020 ontstaan er breuken in de uitkomsten van de gezondheidsenquête (GE). Via een tijdreeksmethode wordt zo goed mogelijk gecorrigeerd voor de verandering in meet- en selectiefouten t.g.v. het wegvallen van capi. Daarnaast wordt de tijdreeksmethode gebruikt om verbanden tussen de COVID19-pandemie en de uitkomsten van de GE zo goed mogelijk in kaart te brengen. Tot 2020 publiceerde de gezondheidsenquête alleen jaarcijfers. Om het effect van de coronacrisis op de ontwikkeling van de gezondheid, het zorggebruik en de leefstijl van de Nederlandse bevolking zo goed mogelijk in kaart te brengen, is besloten om in 2020 kwartaalcijfers te gaan publiceren. Dit heeft twee voordelen. Ten eerste kan de periode van de coronacrisis scherper worden afgebakend en daarmee de effecten op uitkomsten van de GE. Daarnaast ontstaan al gedurende 2020 snellere cijfers over de mogelijke effecten van de coronacrisis op de uitkomsten van de GE. In deze nota wordt de gebruikte tijdreeksmethode beschreven. Er is besloten dat de gepubliceerde kwartalen over 2020 niet gereviseerd worden en dat de correcties voor het wegvallen van de capi ook verwerkt worden in de jaarcijfers over 2020. De eerste twee kwartalen over 2020 zijn in augustus gepubliceerd, het derde kwartaal in november en het vierde kwartaal en de jaarcijfers over 2020 worden in maart 2021 gepubliceerd. 

Het netto-effect van het wegvallen van capi kan worden berekend op basis van responsbestanden van de voorgaande jaren. Dit kan door de capi-respondenten uit de respons te verwijderen en de resterende responsen opnieuw te wegen. Daarmee worden twee schattingen voor een doelvariabele verkregen: één gebaseerd op de volledige respons (capi plus cawi) en één gebaseerd op alleen internetrespons (cawi). Voor de GE kunnen op deze manier tijdreeksen gemaakt worden vanaf het eerste kwartaal in 2014: de reguliere reeks gebaseerd op de volledige respons en de internetreeks gebaseerd op de internetrespons. De internetreeks is beschikbaar voor alle kwartalen t/m het vierde kwartaal van 2020. 

In 2020 is de capi-waarneming halverwege maart gestopt en is vervolgens weer opgestart in augustus. Halverwege december is de capi-waarneming vanwege de tweede lockdown opnieuw uitgevallen. Dat betekent dat in de kwartalen 1, 3 en 4 capi slechts deels beschikbaar is en in kwartaal 2 volledig ontbreekt. Voor de kwartalen 1 en 4 nemen we aan dat het om een normale waarneming met capi gaat, omdat de periode waarin CAPI niet mogelijk was beperkt was. Voor kwartaal 3 is capi voor twee derde beschikbaar en corrigeren we de directe schatting van de reguliere reeks via het tijdreeksmodel (zie paragraaf 2.2). Voor de reguliere reeks zijn er dus uiteindelijk schattingen beschikbaar voor de kwartalen 1, 3 en 4 en ontbreken deze voor het tweede kwartaal. 

In het tweede kwartaal is alleen internetrespons beschikbaar en kan het kwartaalcijfer gebaseerd op de internetrespons gecorrigeerd worden voor het systematisch verschil (kortweg de breuk) t.g.v. het wegvallen van capi. De breuk wordt geschat uit de voorgaande perioden waarvoor zowel de reguliere reeks als de internetreeks beschikbaar is. De gebruikte methode houdt tevens rekening met de duur van de periode zonder capi. Dit kan via een bivariaat structureel tijdreeksmodel waarbij het gecorrigeerde cijfer wordt genowcast op basis van de internetreeks. 

Voor de gezondheidsenquête, in zijn huidige opzet, is er respons beschikbaar vanaf het eerste kwartaal van 2014. De respons in de eerste kwartalen van de reeks is nodig om de onderliggende parameters van het tijdreeksmodel goed te kunnen schatten. Dit is het zogenaamde inregelen van het model. Om deze reden worden de kwartaalcijfers pas vanaf 2017 gepubliceerd. Er worden kwartaalcijfers gemaakt voor de volgende variabelen:

  • Ervaren gezondheid (0 jaar en ouder)
  • Psychisch ongezond (12 jaar en ouder)
  • Huisartscontact in de afgelopen vier weken (0 jaar en ouder)
  • Dagelijks roken (vanaf 18 jaar)
  • Overgewicht (vanaf 18 jaar)
  • Overmatig alcoholgebruik (vanaf 18 jaar)
  • Tandartsbezoek in de afgelopen vier weken (0 jaar en ouder)
  • Specialistcontact in de afgelopen vier weken (0 jaar en ouder)

De keuze voor deze variabelen is gemaakt in overleg met enkele externe partijen, te weten VWS, RIVM en SCP. Van de geselecteerde variabelen was er de wens om tijdens de coronacrisis te kunnen monitoren of er op kwartaalbasis veranderingen zouden optreden in de uitkomsten. De gekozen variabelen bestrijken de drie hoofdthema’s van de gezondheidsenquête: gezondheid (ervaren en psychisch), zorggebruik (huisarts, tandarts, specialist) en leefstijl (roken, alcohol, overgewicht).