Auteur: Jan-Willem Bruggink (CBS), Marieke Hiemstra (RIVM), Pauline Geuijen (RIVM), Saskia van Dorsselaer (Trimbos-instituut)

Dataverzamelingsproces Gezondheidsenquête/Leefstijlmonitor 2014-2021

Het dataverzamelingsproces van de GE/LSM-k sinds 2021, de veranderingen t.o.v. eerdere jaren en de invloed daarvan op de onderzoeksuitkomsten.

Over deze publicatie

De dataverzamelingsstrategie van de Gezondheidsenquete/Leefstijlmonitor-kern vanaf 2021 en de veranderingen daarin sinds 2014. Door middel van simulatie is gekeken naar de impact van de wijzigingen. Hoe zouden de uitkomsten er in eerdere jaren hebben uit gezien als toen al de strategie van 2021 zou zijn toegepast?

Leeswijzer

Na een korte inleiding in paragraaf 1 beschrijft deze notitie in paragraaf 2 de veranderingen in het dataverzamelingsproces van de Gezondheidsenquête/Leefstijlmonitor-kern (GE/LSM-k) die sinds 2014 zijn opgetreden. Per 2021 wordt bij dit dataverzamelingsproces gewerkt met de zogeheten geoptimaliseerde doelgroepenbenadering.
In paragraaf 3 maakt de nota vervolgens inzichtelijk welke impact de wijzigingen hebben op de uitkomsten van het onderzoek. Dit is gedaan door de sinds 2021 gebruikte geoptimaliseerde doelgroepenbenadering te simuleren voor de onderzoeksjaren vanaf 2014. Op die manier ontstaat een beeld van hoe de uitkomsten van de GE/LSM-k zouden zijn geweest als de geoptimaliseerde doelgroepenbenadering al in 2014 zou zijn ingevoerd. 
Tot slot staat in paragraaf 4 een gezamenlijk (CBS, RIVM en Trimbos-instituut) advies over hoe er met de bevindingen uit de simulatie kan worden omgegaan.

1. Inleiding

De Gezondheidsenquête (GE) is een jaarlijks onderzoek dat sinds 1981 wordt uitgevoerd door het Centraal Bureau voor de Statistiek. Sinds 2014 is de module met kernvragen uit de Leefstijlmonitor (LSM-k) onderdeel van de Gezondheidsenquête. Doel van het onderzoek is het geven van een beeld van de gezondheid, de leefstijl en het zorggebruik van de Nederlanders en de ontwikkelingen daarin. Daartoe wordt een vragenlijst voorgelegd aan een steekproef uit de Basisregistratie Personen (BRP), het Nederlandse bevolkingsregister. Sinds 2014 kunnen mensen meedoen aan het onderzoek via internet (CAWI) of aan-huis-interviews (CAPI).

In de afgelopen jaren zijn er veranderingen aangebracht in de benaderstrategie; de wijze waarop de data verzameld wordt bij de beoogde respondenten. Met ingang van 2021 is de zogeheten geoptimaliseerde doelgroepenbenadering ingevoerd. Voor deze benaderstrategie is gekozen om de samenstelling van de respons zo representatief mogelijk te laten zijn voor de Nederlandse bevolking. Ook is de strategie van geoptimaliseerde doelgroepenbenadering goedkoper ten opzichte van eerdere strategieën.

In deze nota leggen we uit hoe de geoptimaliseerde doelgroepenbenadering in zijn werk gaat. Ook beschrijven we de verschillende benaderstrategieën uit de periode 2014-2020. 
Om goed inzicht te krijgen op de invloed van veranderingen op de uitkomsten van het onderzoek, hebben we de strategie van 2021 gesimuleerd op de data van 2014 tot en met 20191). Op die manier kon voor de belangrijkste kernvariabelen uit de GE/LSM-k geschat worden wat de uitkomsten zouden zijn geweest als de geoptimaliseerde doelgroepenbenadering al in 2014 zou zijn ingevoerd. Deze schattingen vergelijken we met de sinds 2014 gepubliceerde cijfers en daardoor ontstaat inzicht in het effect van de doelgroepenbenadering op de schattingen. 

1) Deze simulatie is in 2020 uitgevoerd en liep daarom tot en met 2019. Later kon deze analyse niet uitgebreid worden met het jaar 2020, omdat in dat jaar door corona(maatregelen) de CAPI-waarneming deels niet kon worden uitgevoerd en de data hierdoor verstoord is.

2. Benaderstrategie GE/LSM-k

2.1 De jaren 2014-2020

Voor de GE/LSM-k trekt het CBS steekproeven uit de Basisregistratie Personen (BRP). We streven hierbij naar een minimum aantal respondenten (deelnemers) van 9500. Van 2014 tot en met 2016 kregen steekproefpersoon eerst een brief thuis kreeg met de vraag om via internet (CAWI) deel te nemen aan het onderzoek. Indien de steekproefpersoon niet deelnam via CAWI, ontvingen zijn een tweetal herinneringsbrieven. Wanneer zij niet meededen, maar ook niet expliciet weigerden mee te doen, werden ze herbenaderd voor een aan-huis-interview (CAPI). Vrijwel alle personen die in aanmerking kwamen voor CAPI werden daadwerkelijk herbenaderd. Een persoon kwam niet meer in aanmerking voor herbenadering als hij of zij was overleden of verhuisd. In 2016 kwam 92,9% van de CAWI-non-respons in aanmerking voor CAPI.

Met ingang van 2017 werden er vaste omvangen bij CAPI ingevoerd. Dat betekent dat het aantal mensen dat voor CAPI zou worden benaderd van tevoren werd vastgesteld, met als doel om de planning van de interviewers efficiënter te maken en van te voren de kosten van het dataverzamelingswerk te kunnen inschatten. Het percentage CAPI herbenadering ging daarbij van 92,9% in 2016 naar 83,1% in 2017. Dit betekende dus dat er in de stap van CAWI naar CAPI een uitdunning (niet herbenaderen) van ongeveer 10 procentpunten bij kwam. Deze uitdunning gebeurde aselect, ofwel willekeurig.
Een andere verandering was dat het aantal mensen dat benaderd werd voor CAWI werd vergroot. Zo waren we er zeker van dat er voldoende mensen overbleven voor de vaste CAPI-benadering, ook als de CAWI respons ineens hoger zou uitvallen. Dit had als effect dat de maximale vertekening groter werd. De coefficient of variation (CV) van de responskansen werd namelijk groter. De CV is een maat om aan te geven of de verdeling van de deelnemers aan een onderzoek lijkt op de verdeling in de bevolking. Deze vergelijking maken we op basis van bepaalde kenmerken, zoals geslacht, leeftijd en migratieachtergrond. Hoe kleiner de CV, des te meer de verdeling van de respondenten lijkt op de verdeling in de bevolking.

Met ingang van 2018 werden er twee grote wijzingen doorgevoerd.

  1. De eerste wijziging was dat een incentive (beloning) in de vorm van een iPad verloting werd ingevoerd met als doel de CAWI respons te verhogen. Deelnemers aan het onderzoek maakten dus kans op een prijs. Daarop nam de CAWI respons met 3,6 procentpunten toe, van 34,1% in 2017 naar 37,7% in 2018. Het is niet bekend of het invoeren van de incentive een effect had op de CAPI respons en dit was ook lastig te meten omdat er tegelijkertijd doelgroepenbenadering werd ingevoerd: de tweede wijziging.
  2. De tweede wijziging was de gedeeltelijke invoering van de doelgroepenbenadering bij CAPI. Van bepaalde doelgroepen, waarvan bekend is dat zij goed via CAWI responderen, worden minder mensen herbenaderd voor CAPI. De hierboven beschreven uitdunning en herbenadering werden dus selectief. Het idee van de doelgroepenbenadering was dat de CV van de responskansen kleiner zou worden en hiermee uiteindelijk de maximale vertekening verkleind werd. Zo vindt de correctie voor vertekening deels vooraf plaats en wordt deze niet meer alleen overgelaten aan de achteraf uitgevoerde weging.

Om de doelgroepenbenadering invulling te geven werd eerst een analyse gedaan om mensen op basis van achtergrondkenmerken te clusteren. Daarbij wordt gekeken naar de verwachte respons per waarnemingsmethode (CAWI en CAPI) van mensen met verschillende kenmerken op basis van data van de gerealiseerde respons uit voorgaande jaren. Mensen met verschillende kenmerken maar met eenzelfde verwachte respons worden geclusterd tot een doelgroep. De doelgroepen waren in 2018 gebaseerd op de kenmerken stedelijkheidsgraad van de woongemeente, gestandaardiseerd besteedbaar huishoudinkomen, leeftijd en migratieachtergrond2)
Voor 2018 werd als randvoorwaarde voor de clusteringsanalyse meegegeven dat er 8040 personen benaderd zouden worden voor een CAPI interview. Door die randvoorwaarde noemen we de doelgroepenbenadering van 2018 ‘gedeeltelijk’ en niet ‘optimaal’. Zonder de randvoorwaarde van het aantal voor CAPI te benaderen personen zouden minder personen voor CAPI zijn benaderd en zou de CV lager zijn uitgevallen.
Een effect van de invoering van de gedeeltelijke doelgroepenbenadering was dat de vertekening kleiner werd gemaakt omdat de verschillen in responskansen tussen groepen kleiner werden. Het overall responspercentage nam af omdat minder mensen uit goed responderende groepen herbenaderd werden voor CAPI en omdat het aantal mensen wat überhaupt herbenaderd werd afnam. De modeverhouding verschoof naar meer CAWI respons in de totale respons. In totaal werd in 2018 71,5% van de CAWI-non-respons herbenaderd via CAPI.

Met ingang van 2019 waren er kleine wijzingen in de doelgroepenindeling. Dit omdat de clusteringsanalyse opnieuw werd uitgevoerd, met recentere gerealiseerde responskansen als input, wat tot iets andere resultaten leidde. Stedelijkheidsgraad zat niet meer in de doelgroepenindeling van 2019 en er waren wijzigingen in de definities van migratieachtergrond en in de indelingen van de leeftijdscategorieën.
Er werd besloten om het aantal mensen dat voor CAPI werd benaderd gelijk te houden met het aantal van 2018: 8040 personen werden via CAPI herbenaderd. Door tegenvallende respons werden vanaf juli 2019 meer mensen voor CAWI-deelname benaderd om toch voldoende respons te verkrijgen. Het aantal mensen dat voor CAPI werd benaderd bleef gelijk. Dit zorgde ervoor dat het percentage CAPI herbenadering van 71,5% in 2018 daalde naar 69,7% in 2019.

In 20203) werden geen wijzingen doorgevoerd. De doelgroepenindeling bleef zoals in 2019 en de CAPI uitzet werd weer vastgesteld op 8040. Wel werd het percentage CAPI herbenadering per doelgroep licht gewijzigd, als gevolg van in 2019 waargenomen veranderingen in de responskansen per doelgroep per waarnemingsmethode.

2.2 Benaderstrategie GE/LSM-k met ingang van 2021: geoptimaliseerde doelgroepenbenadering

Met ingang van 2021 werd de doelgroepenbenadering bij de GE/LSM-k geoptimaliseerd. Een van de wijzigingen was dat de randvoorwaarde voor het aantal voor CAPI te benaderen personen werd losgelaten. Minimalisering van de CV werd het doel. De randvoorwaarde van een minimumaantal van in totaal 9.500 respondenten, ongeacht of deze via CAWI of CAPI deelnamen, bleef wel gehandhaafd.
Vanaf 2021 is de doelgroepenindeling voor de GE/LSM-k gebaseerd op inkomen, leeftijd en migratieachtergrond. Deze kenmerken sluiten aan bij de doelgroepenindeling van eerdere jaren. De precieze indeling van de doelgroepen stelden we vast door een clusteranalyse uit te voeren op responsdata uit de eerste helft van 2019. Uit deze analyse kwamen acht doelgroepen, zie tabel 2.2.1.

2.2.1 Doelgroepen voor de Gezondheidsenquete 2021
zonder migratieachtergrondzonder migratieachtergrondzonder migratieachtergrondmet migratieachtergrondmet migratieachtergrondmet migratieachtergrond
laag inkomenmidden inkomenhoog inkomenlaag inkomenmidden inkomenhoog inkomen
0 t/m 11 jaar222117
12 t/m 24 jaar337813
35 t/m 44 jaar333555
45 t/m 64 jaar374555
65 jaar of ouder376554

Leesvoorbeeld bij tabel 2.2.1: doelgroep 1 bestaat uit mensen met een migratieachtergrond van 0 tot en met 11 jaar uit huishoudens uit de inkomenscategorie laag of midden. En uit mensen met een migratieachtergrond van 12 tot en met 24 jaar uit huishoudens uit de inkomenscategorie midden.

Ten opzichte van de doelgroepen in 2020 is er in 2021 een leeftijdsgroep minder: voorheen werden 65-74 jaar en 75+ apart meegenomen, nu is er één groep voor 65+. Daarnaast zijn er op basis van verschillen in responskansen andere groepen samengevoegd tot één doelgroep. Dit leidde tot een aantal verschillen:

  • In vergelijking met 2020 werden in 2021 meer mensen benaderd voor CAWI (van 17.112 in 2020 tot 19.632 in 2021).
  • Het aantal mensen dat benaderd werd voor CAPI nam af (van 8.040 in 2020 tot 6.624 in 2021).

Het percentage personen uit de herbenaderbare CAWI nonrespons dat via CAPI zou worden herbenaderd in 2021 werd geschat op 55,2%4).

Tabel 2.2.2 geeft een samenvatting van de waarneemstrategie bij de GE/LSM-k in de jaren 2014 tot en met 2021.

020202Tabel 2.2.2 Overzicht waarneemstrategie 2014-2021

2) Er kan alleen naar kenmerken gekeken worden die integraal, dus voor iedereen, beschikbaar zijn. Clusteren naar onderwijsniveau kan bijvoorbeeld niet, omdat onderwijsniveau een doelvariabele is van de GE/LSM-k. Het onderwijsniveau is dus niet vooraf voor iedereen bekend, maar wordt in de vragenlijst zelf uitgevraagd.
3) In 2020 brak de coronaepidemie uit. CAPI-waarneming was in delen van het jaar niet of met beperkingen mogelijk. Het CBS heeft door het inzetten van tijdreeksmodellen gepubliceerd over het jaar 2020. Die tijdreeksmodellen maakten gebruik van informatie uit eerdere jaargangen over het verschil tussen CAWI en CAPI-respons. Op die manier werd zo goed mogelijk gecompenseerd voor het deels wegvallen van CAPI-waarneming. Meer informatie hierover is te vinden in Smeets & Van den Brakel, 2021.
4) In 2021 was het door corona(maatregelen) niet mogelijk om de vooraf geplande waarneemstrategie in zijn geheel uit te voeren. Het was, net als in grote delen van 2020, niet of slechts met beperkingen mogelijk aan-huis waar te nemen. Door de inzet van tijdreeksmodellen heeft het CBS toch gepubliceerd over 2021, zie ook voetnoot 2.

3. Simulatie van de 2021-strategie op data vanaf 2014

In 2020 hebben we de geoptimaliseerde benaderstrategie van 2021 gesimuleerd op de GE/LSM-k-data van de jaren 2014 tot en met 20195). Er is daarbij dus gedaan alsof in die jaren al de geoptimaliseerde benaderstrategie werd toegepast die pas vanaf 2021 daadwerkelijk is ingevoerd. Hierbij werd de verhouding CAWI-CAPI waarneming, uit het steekproefontwerp van 2021, per doelgroep gesimuleerd. Dit deed het CBS door het responsbestand van een bepaald jaar te pakken en daaruit met bootstrapping responsen te trekken. Deze nieuwe dataset had daarmee dezelfde omvang per doelgroep als in het steekproefontwerp van de GE/LSM-k van 2021. Dit gesimuleerde responsbestand werd vervolgens gewogen en op basis van dit gewogen bestand werden voor 17 kernvariabelen (tabel 3.1) nieuwe cijfers geschat. Dit gehele proces herhaalden we vervolgens 1000 keer en van deze 1000 uitkomsten berekenden we vervolgens het gemiddelde. Hieruit volgde dan per kernvariabele voor ieder jaar een gesimuleerde schatting.

3.1 Overzicht onderzochte kernvariabelen
OnderwerpThemadoelpopulatie
HuisartscontactZorggebruik0 jaar of ouder
TandartscontactZorggebruik0 jaar of ouder
Gebruik niet-voorgeschreven medicijnenGezondheid0 jaar of ouder
Ervaren gezondheidGezondheid0 jaar of ouder
DiabetesGezondheid0 jaar of ouder
Psychische gezondheid (MHI)Gezondheid12 jaar of ouder
Beperkingen (OESO)Gezondheid12 jaar of ouder
Mantelzorg gevenLeefstijl/Gezondheid16 jaar of ouder
(wel eens) RokenLeefstijl18 jaar of ouder
Dagelijks rokenLeefstijl18 jaar of ouder
DrinkenLeefstijl18 jaar of ouder
Overmatig alcoholgebruikLeefstijl18 jaar of ouder
Cannabis afgelopen jaarLeefstijl18 jaar of ouder
Obesitas (BMI ≥ 30)Leefstijl4 jaar of ouder
5 dagen voldoende groenteLeefstijl1 jaar of ouder
Risicovolle seksLeefstijl16 jaar of ouder
Voldoen aan beweegrichtlijnLeefstijl12 jaar of ouder

De analyses werden per jaar gedaan op totaalniveau (alle respondenten uit de doelpopulatie) en voor de volgende deelpopulaties:

  • leeftijd (0 t/m 17, 18 t/m 64, 65 of ouder)
  • geslacht (man, vrouw)
  • migratieachtergrond (NL, westers, niet-westers)
  • inkomen (kwintiel 1 (laag), kwintiel 2 t/m 5).

De simulatieschattingen zijn vervolgens vergeleken met de eerder al gepubliceerde cijfers over de 17 kernvariabelen. De verschillen tussen de gesimuleerde en de gepubliceerde uitkomsten zijn vervolgens getoetst op statistische significantie.

Bij vijf kernvariabelen werden statistisch significante verschillen gevonden op totaalniveau tussen de gesimuleerde en de gepubliceerde cijfers. Die verschillen traden het meest op in de beginjaren van de GE/LSM-k, zie tabel 3.2.

3.2 Overzicht statistisch significante verschillen, in procentpunten, per kernvariabele, op totaalniveau
201420152016201720182019
Gebruik niet-voorgeschreven medicijnen2,21,61,5
Roken1,41,3
Dagelijks roken1,51,21,2
Overmatig alcoholgebruik1,31
Voldoen aan beweegrichtlijn-2,9-2,3-2,3-2,1-1,6

Op totaalniveau werden bij de 12 overige kernvariabelen dus geen statistisch significante verschillen gevonden6).

Dat de meeste en grootste verschillen werden gevonden in de beginjaren van de GE/LSM-k komt doordat de veranderingen in de waarneemstrategie vanaf 2014 stap voor stap hebben plaatsgevonden. De eerdere jaren wijken daardoor het meest af van de per 2021 doorgevoerde geoptimaliseerde doelgroepenwaarneming.

Voor de vijf kernvariabelen waarbij op totaalniveau statistisch significante verschillen werden gevonden in tenminste 1 jaar, worden in het vervolg van deze paragraaf de gesimuleerde cijfers en de gepubliceerde cijfers getoond op totaalniveau, zowel grafisch als in tabelvorm (grafiek 3.3 tot en met tabel 3.12). Dit om inzicht te krijgen in de omvang en richting van de verschillen en het verloop ervan in de tijd. In de bijlage zijn voor elk van de vijf betreffende kernvariabelen de cijfers per deelpopulatie te vinden. Verschillen die vet zijn weergegeven, zijn statistisch significant.

3.3 Gebruik niet-voorgeschreven medicijnen
jaarsimulatie (%)gepubliceerd (%)
201436,438,7
201536,237,6
201636,838,4
201738,740,2
201839,640,1
201939,840,4
202039,8
202142
 

3.4 Gebruik niet-voorgeschreven medicijnen
simulatiegepubliceerdverschil
%%
201436,438,72,2
201536,237,61,4
201636,838,41,6
201738,740,21,5
201839,640,10,5
201939,840,40,6
2020 39,8
2021 42,0

3.5 Roken, 18 jaar of ouder
jaarsimulatie (%)gepubliceerd (%)
201424,325,7
201525,126,3
201622,924,1
20172223,1
201821,822,4
201921,321,7
202020,2
202120,6
Bron: CBS, RIVM, Trimbos-instituut
 

3.6 Roken, 18 jaar of ouder
simulatiegepubliceerdverschil
%%
201424,325,71,4
201525,126,31,2
201622,924,11,3
20172223,11,1
201821,822,40,5
201921,321,70,4
2020 20,2
2021 20,6

3.7 Dagelijks roken, 18 jaar of ouder
jaarsimulatie (%)gepubliceerd (%)
201418,219,7
201518,419,5
201617,418,6
201716,217,2
201815,516
201915,515,9
202014,9
202115,2
Bron: CBS, RIVM, Trimbos-instituut
 

3.8 Dagelijks roken, 18 jaar of ouder
simulatiegepubliceerdverschil
%%
201418,219,71,5
201518,419,51,2
201617,418,61,2
201716,217,21
201815,5160,5
201915,515,90,4
202014,9
202115,2

3.9 Overmatig alcoholgebruik, 18 jaar of ouder
jaarsimulatie (%)gepubliceerd (%)
20148,79,9
20158,59,5
20168,38,8
20178,89,2
201888,2
20198,48,5
20206,9
20217,3
Bron: CBS, RIVM, Trimbos-instituut
 

3.10 Overmatig alcoholgebruik, 18 jaar of ouder
simulatiegepubliceerdverschil
%%
20148,79,91,3
20158,59,51
20168,38,80,5
20178,89,20,4
201888,20,3
20198,48,50,1
20206,9
20217,3

3.11 Voldoen aan beweegrichtlijn, 12 jaar of ouder
jaarsimulatie (%)gepubliceerd (%)
201446,543,6
201545,743,4
201645,343
201747,745,6
201847,246
20195048,4
202051,9
2021
Bron: CBS, RIVM
 

3.12 Voldoen aan beweegrichtlijn, 12 jaar of ouder
simulatiegepubliceerdverschil
%%
201446,543,6-2,9
201545,743,4-2,3
201645,343-2,3
201747,745,6-2,1
201847,246-1,2
20195048,4-1,6
2020 51,9
2021

5) Deze analyses zijn in 2020 uitgevoerd, waardoor het statistiekjaar 2020 niet is meegenomen. Later was het niet mogelijk het statistiekjaar 2020 nog toe te voegen. Dit vanwege de gevolgen van de coronapandemie waardoor er in 2020 veel minder CAPI-waarneming was dan vooraf gepland. Op het afwijkende 2020-databestand kon de voor 2021 beoogde geoptimaliseerde waarneemstrategie niet worden gesimuleerd.
6) Een enkele keer werd bij deze variabelen op deelpopulatieniveau wel een statistisch significant verschil gevonden.

4. Aanbeveling voor gebruik van de cijfers uit GE/LSM-k

In deze nota is beschreven welke veranderingen sinds 2014 zijn doorgevoerd in het dataverzamelingsproces van de GE/LSM-k en is ook ingegaan op de redenen voor die veranderingen. Belangrijke veranderingen waren:

  • De invoering van vaste CAPI-omvangen door middel van aselecte uitdunning in 2017.
  • De gedeeltelijke invoering van doelgroepenbenadering en de invoering van incentives in 2018.
  • De invoering van de geoptimaliseerde doelgroepenbenadering in 2021.

Ook is voor 17 kernvariabelen van het onderzoek gesimuleerd hoe de uitkomsten over de jaren 2014-2019 er waarschijnlijk hadden uitgezien als de huidige waarneemstrategie, die sinds 2021 in gebruik is, in al die jaren al in gebruik was geweest.
Uit die simulatie komt naar voren dat er voor 12 van de 17 kernvariabelen geen statistisch significante verschillen zouden zijn geweest. Bij de overige vijf variabelen is dat echter wel het geval. Daar lijkt sprake van methodebreuken als gevolg van de doorgevoerde wijzigingen. Bij die variabelen zien we dat vooral de uitkomsten van de oudere onderzoeksjaren afwijkend uit de simulatie komen. Dit hangt waarschijnlijk samen met de stapsgewijs doorgevoerde veranderingen. Elke wijziging kan een effect hebben en de optelsom van die effecten kan dus groter worden naarmate er over de tijd meer veranderingen zijn doorgevoerd. De simulatie geeft een beeld van het totale effect van de veranderingen. Het is niet aan te geven welk deel daarvan veroorzaakt wordt door selectie-effecten (doen er andere mensen mee?) en welk deel door mode-effecten (geven mensen via internet een ander antwoord dan via een aan-huis-interview?). Het CBS, RIVM en Trimbos-instituut willen in 2022 proberen meer zicht te krijgen op het effect van mode. De bevindingen van dat onderzoek zullen apart worden gepubliceerd.

CBS, RIVM en Trimbos-instituut adviseren gezamenlijk om de oorspronkelijk gepubliceerde cijfers, over de periode sinds 2014 te blijven zien als dé uitkomsten van de GE/LSM-k. Deze cijfers zijn onder andere te vinden op CBS-Statline. Een belangrijke reden hiervoor is de bevinding dat bij de meeste van de onderzochte variabelen geen sprake was van statistisch significante afwijkingen tussen de gepubliceerde en de gesimuleerde uitkomsten. Een andere reden is de wetenschap dat aanpassingen aan het proces van dataverzameling onvermijdelijk zijn bij een langlopend onderzoek als de GE/LSM-k. Veranderingen zullen ook in de jaren vanaf 2022 blijven optreden. Het streven daarbij zal altijd zijn om, gegeven bepaalde randvoorwaarden, een zo representatief mogelijk beeld van de gezondheid en leefstijl van de Nederlandse bevolking te geven. Het is echter niet uitgesloten dat aanpassingen in de methode in sommige gevallen invloed kunnen hebben op de schattingen. Ook zonder aanpassingen in het onderzoeksproces zullen wijzigingen optreden. De verhouding tussen de aandelen CAWI en CAPI in de respons verandert bijvoorbeeld door veranderingen in de bereidwilligheid om mee te doen aan het onderzoek.

Om de gesimuleerde uitkomsten van de jaren 2014-2019 te kunnen reproduceren heeft het CBS een bestand beschikbaar gesteld met daarin de daarvoor benodigde doelgroepsimulatie-weegvariabelen. Elke oorspronkelijke respondent uit de jaren 2014-2019 kan met behulp van dat bestand worden voorzien van een simulatiegewicht. De beschikbaarstelling gebeurt via CBS-Microdataservices en het bestand kan gebruikt worden door onderzoekers die aan de voorwaarden voor het gebruik van microdata (via Remote Access) voldoen. Door de doelgroepsimulatie-weegvariabele van bijvoorbeeld 2014 te koppelen aan het reguliere 2014-bestand van de GE/LSM-k, kunnen zowel de oorspronkelijk gepubliceerde uitkomsten als de simulatie-uitkomsten bepaald worden.


Bijlage

Gesimuleerde en gepubliceerde uitkomsten over het gebruik van niet-voorgeschreven medicijnen, naar achtergrondkenmerken

B1 Gebruik niet-voorgeschreven medicijnen, naar leeftijd
jaar0-17 jaar: simulatie (%)0-17 jaar: gepubliceerd (%)18-64 jaar: simulatie (%)18-64 jaar: gepubliceerd (%)65 jaar of ouder: simulatie (%)65 jar of ouder: gepubliceerd (%)
201429,833,939,140,534,837,7
201528,832,439,139,734,936,2
201628,231,639,940,835,937,8
201731,434,841,742,536,538,5
201831,632,443,243,436,737,7
201931,933,342,342,739,940,4
202030,842,640,3
202133,14444,5


B2. Gebruik niet-voorgeschreven medicijnen, naar leeftijd
0-17 jaar0-17 jaar0-17 jaar18-64 jaar18-64 jaar18-64 jaar65 jaar of ouder65 jaar of ouder65 jaar of ouder
simulatiegepubliceerdverschilsimulatiegepubliceerdverschilsimulatiegepubliceerdverschil
%%%%%%
201429,833,94,139,140,51,434,837,72,9
201528,832,43,639,139,70,734,936,21,2
201628,231,63,439,940,80,935,937,81,9
201731,434,83,441,742,50,836,538,52,0
201831,632,40,843,243,40,236,737,71,0
201931,933,31,442,342,70,439,940,40,4
202030,842,640,3
202133,144,044,5


B3 Gebruik niet-voorgeschreven medicijnen, naar geslacht
jaarman: gesimuleerd (%)man: gepubliceerd (%)vrouw: gesimuleerd (%)vrouw: gepubliceerd (%)
201429,932,142,845,1
201529,530,942,944,2
201631,132,642,444,1
20173233,545,346,8
201833,433,845,946,4
201933,233,846,346,9
202033,146,5
202134,849,1
 
B4. Gebruik niet-voorgeschreven medicijnen, naar geslacht
manmanmanvrouwvrouwvrouw
simulatiegepubliceerdverschilsimulatiegepubliceerdverschil
%%%%
201429,932,12,242,845,12,3
201529,530,91,542,944,21,3
201631,132,61,542,444,11,6
201732,033,51,545,346,81,6
201833,433,80,445,946,40,6
201933,233,80,646,346,90,6
202033,146,5
202134,849,1


B5 Gebruik niet-voorgeschreven medicijnen, migratieachtergrond
jaarNederland: simulatie (%)Nederland: gepubliceerd (%)Niet-westers: simulatie (%)Niet-westers: gepubliceerd (%)Westers: simulatie (%)Westers: gepubliceerd (%)
201435,337,738,641,142,743,3
201535,637,337,638,239,839,2
201636,538,235,937,140,641,6
201738,640,336,937,941,842,7
201839,339,840,341,241,241
201939,339,940,841,342,342,7
202038,941,644
202141,144,844,2


B6. Gebruik niet-voorgeschreven medicijnen, migratieachtergrond
NederlandNederlandNederlandniet-westersniet-westersniet-westerswesterswesterswesters
simulatiegepubliceerdverschilsimulatiegepubliceerdverschilsimulatiegepubliceerdverschil
%%%%%%
201435,337,72,438,641,12,642,743,30,6
201535,637,31,737,638,20,739,839,2-0,6
201636,538,21,735,937,11,240,641,61,0
201738,640,31,736,937,91,041,842,71,0
201839,339,80,540,341,20,941,241,0-0,3
201939,339,90,740,841,30,442,342,70,4
202038,941,644,0
202141,144,844,2


 
B7 Gebruik niet-voorgeschreven medicijnen, naar inkomen
jaar1e kwintiel: simulatie (%)1e kwintiel: gepubliceerd (%)2e tm 5e kwintiel: simulatie (%)2e tm 5e kwintiel: gepubliceerd (%)
201438,340,336,138,3
201538,838,935,737,3
201638,239,536,638,2
201739,440,638,540,1
201839,640,239,740,1
201942,142,239,440,1
202040,739,7
202144,241,5


B8. Gebruik niet-voorgeschreven medicijnen, naar inkomen
1e kwintiel1e kwintiel1e kwintiel2e t/m 5e kwintiel2e t/m 5e kwintiel2e t/m 5e kwintiel
simulatiegepubliceerdverschilsimulatiegepubliceerdverschil
%%%%
201438,340,32,036,138,32,3
201538,838,90,235,737,31,6
201638,239,51,336,638,21,6
201739,440,61,238,540,11,6
201839,640,20,639,740,10,5
201942,142,20,239,440,10,7
202040,739,7
202144,241,5

De achterliggende vraagstellingen over het niet-voorgeschreven medicijngebruik zijn te vinden via deze webpagina: Vragenlijsten Gezondheidsenquête vanaf 2014 (cbs.nl)

Gesimuleerde en gepubliceerde uitkomsten over roken, 18 jaar of ouder, naar achtergrondkenmerken

B9 Roken, naar leeftijd
jaar18-64 jaar: simulatie (%)18-64 jaar: gepubliceerd (%)65 jaar of ouder: simulatie (%)65 jar of ouder: gepubliceerd (%)
201427,528,812,314
201528,729,71213,9
201625,927,112,313,7
201725,126,111,312,6
201824,925,411,512,2
201924,324,811,311,5
20202311
202123,112,5
Bron: CBS, RIVM, Trimbos-instituut


B10. Roken, naar leeftijd
18-64 jaar18-64 jaar18-64 jaar65 jaar of ouder65 jaar of ouder65 jaar of ouder
simulatiegepubliceerdverschilsimulatiegepubliceerdverschil
%%%%
201427,528,81,412,314,01,7
201528,729,71,012,013,91,9
201625,927,11,212,313,71,4
201725,126,11,011,312,61,3
201824,925,40,511,512,20,6
201924,324,80,511,311,50,2
202023,011,0
202123,112,5


B11 Roken, naar geslacht
jaarman: gesimuleerd (%)man: gepubliceerd (%)vrouw: gesimuleerd (%)vrouw: gepubliceerd (%)
201428,229,620,521,9
201528,83021,522,6
201627,728,918,219,5
201725,92718,219,2
201824,925,718,919,2
201924,825,417,818,1
202022,817,7
202124,716,6
Bron: CBS, RIVM, Trimbos-insituut


B12. Roken, naar geslacht
manmanmanvrouwvrouwvrouw
simulatiegepubliceerdverschilsimulatiegepubliceerdverschil
%%%%
201428,229,61,420,521,91,4
201528,830,01,221,522,61,1
201627,728,91,318,219,51,3
201725,927,01,118,219,21,1
201824,925,70,818,919,20,3
201924,825,40,617,818,10,3
202022,817,7
202124,716,6


B13 Roken, migratieachtergrond
jaarNederland: simulatie (%)Nederland: gepubliceerd (%)Niet-westers: simulatie (%)Niet-westers: gepubliceerd (%)Westers: simulatie (%)Westers: gepubliceerd (%)
201422,924,828,728,630,530,1
20152425,727,827,530,729,8
201621,42330,330,726,326,1
201720,922,325,425,526,726,1
201820,721,526,626,625,224,5
201919,920,525,625,626,526,3
202019,324,221,7
202119,323,326,4
Bron: CBS, RIVM, Trimbos-instituut


B14. Roken, migratieachtergrond
NederlandNederlandNederlandniet-westersniet-westersniet-westerswesterswesterswesters
simulatiegepubliceerdverschilsimulatiegepubliceerdverschilsimulatiegepubliceerdverschil
%%%%%%
201422,924,81,928,728,6-0,130,530,1-0,4
201524,025,71,727,827,5-0,330,729,8-0,8
201621,423,01,630,330,70,426,326,1-0,2
201720,922,31,525,425,50,126,726,1-0,6
201820,721,50,826,626,6-0,125,224,5-0,7
201919,920,50,625,625,60,026,526,3-0,2
202019,324,221,7
202119,323,326,4


B15 Roken, naar inkomen
jaar1e kwintiel: simulatie (%)1e kwintiel: gepubliceerd (%)2e tm 5e kwintiel: simulatie (%)2e tm 5e kwintiel: gepubliceerd (%)
201435,136,722,423,8
201537,538,122,924,2
201633,23521,222,4
201731,732,820,121,3
201833,733,919,720,3
201931,832,619,419,7
202029,318,5
202129,618,9
Bron: CBS, RIVM, Trimbos-instituut


B16. Roken, naar inkomen
1e kwintiel1e kwintiel1e kwintiel2e t/m 5e kwintiel2e t/m 5e kwintiel2e t/m 5e kwintiel
simulatiegepubliceerdverschilsimulatiegepubliceerdverschil
%%%%
201435,136,71,622,423,81,5
201537,538,10,622,924,21,4
201633,235,01,821,222,41,2
201731,732,81,020,121,31,1
201833,733,90,219,720,30,6
201931,832,60,819,419,70,3
202029,318,5
202129,618,9

De achterliggende vraagstellingen over roken zijn te vinden via deze webpagina: Vragenlijsten Gezondheidsenquête vanaf 2014 (cbs.nl)

Gesimuleerde en gepubliceerde uitkomsten over dagelijks roken, 18 jaar of ouder, naar achtergrondkenmerken

B17 Dagelijks roken, naar leeftijd
jaar18-64 jaar: simulatie (%)18-64 jaar: gepubliceerd (%)65 jaar of ouder: simulatie (%)65 jar of ouder: gepubliceerd (%)
201420,621,99,411,4
201520,721,79,811,7
201619,420,710,211,3
201717,91910,111,2
201817,317,89,49,9
201917,317,79,710
202016,59,5
202116,411,4
Bron: CBS, RIVM, Trimbos-instituut


B18. Dagelijks roken, naar leeftijd
18-64 jaar65 jaar of ouder
simulatiegepubliceerdverschilsimulatiegepubliceerdverschil
%%%%
201420,621,91,39,411,42,0
201520,721,71,09,811,71,9
201619,420,71,210,211,31,1
201717,919,01,010,111,21,1
201817,317,80,59,49,90,5
201917,317,70,49,710,00,3
202016,59,5
202116,411,4


B19 Dagelijks roken, naar geslacht
jaarman: gesimuleerd (%)man: gepubliceerd (%)vrouw: gesimuleerd (%)vrouw: gepubliceerd (%)
201420,922,415,617
201520,521,816,317,4
201620,421,714,415,6
201718,819,913,614,5
201817,818,413,313,7
201917,818,313,313,6
202016,213,5
202118,212,2
Bron: CBS, RIVM, Trimbos-instituut


B20. Dagelijks roken, naar geslacht
manmanmanvrouwvrouwvrouw
simulatiegepubliceerdverschilsimulatiegepubliceerdverschil
%%%%
201420,922,41,515,617,01,4
201520,521,81,316,317,41,1
201620,421,71,314,415,61,2
201718,819,91,213,614,50,9
201817,818,40,613,313,70,4
201917,818,30,513,313,60,3
202016,213,5
202118,212,2


B21 Dagelijks roken, migratieachtergrond
jaarNederland: simulatie (%)Nederland: gepubliceerd (%)Niet-westers: simulatie (%)Niet-westers: gepubliceerd (%)Westers: simulatie (%)Westers: gepubliceerd (%)
201416,718,623,623,324,624,6
201517,619,119,619,823,522,9
201616,117,624,324,820,219,9
201715,216,519,719,920,219,7
20181515,719,11915,615,2
201914,414,92020,118,618,4
202014,218,216,1
202113,718,221,9