2. Data en methode
De gegevens die in dit onderzoek worden gebruikt zijn afkomstig uit het Stelsel van Sociaal-Statistische Bestanden (SSB) (Bakker, Van Rooijen en Van Toor, 2014) van het CBS.
2.1 Populatie
In dit onderzoek staan huishoudens centraal die geen zonnepanelen hebben, maar wel de mogelijkheid hebben om deze te nemen. Deze huishoudens zijn als volgt gedefinieerd:
- De huishoudens wonen in hun eigen koopwoning (dus niet in een huurwoning);
- De huishoudens wonen in een woning met een eigen, niet gedeeld dak (dus niet in een appartement);
- De vertegenwoordigers van de huishoudens hebben ten minste één ander huishouden in hun netwerk;
- Geen van de vertegenwoordigers van de huishoudens heeft eerder in een woning met zonnepanelen gewoond.
Deze eerste twee vereisten vergroten de kans dat (de vertegenwoordigers van) de huishoudens zelfstandig de keuze kunnen maken voor het nemen van zonnepanelen, zonder tussenkomst van een huisbaas of vereniging van eigenaren. De derde vereiste is noodzakelijk om de invloed van het netwerk te kunnen identificeren. De vierde vereiste is nodig omdat eerdere ervaringen met zonnepanelen de keuze voor zonnepanelen kunnen beïnvloeden, waardoor een netwerkeffect moeilijker wordt om waar te nemen.
Voor ieder huishouden worden één of twee volwassenen aangeduid als vertegenwoordiger. De eerste vertegenwoordiger is de referentiepersoon van het huishouden. De tweede vertegenwoordiger is de eventuele partner van de referentiepersoon, als die op hetzelfde adres woont. Anders is er geen tweede vertegenwoordiger. Van deze vertegenwoordiger(s) worden persoonskenmerken gebruikt in de analyse, zoals leeftijd en opleidingsniveau. Daarnaast komt elk adres maar een keer voor in de data. Het komt voor dat meerdere huishoudens een woning delen, in dat geval wordt een willekeurig huishouden op dat adres gekozen voor de onderzoekspopulatie.
Ieder peiljaar (zie 2.4) heeft een andere onderzoekspopulatie. Dat komt doordat huishoudens die in een bepaald jaar zonnepanelen nemen in latere jaren niet meer voorkomen in de populatie, en doordat huishoudens die op een eerder moment niet aan de voorwaarden hierboven voldoen, op een later moment wel in de populatie kunnen zitten, bijvoorbeeld als zij verhuisd zijn van een huurwoning naar een koopwoning. De populatie bestaat ieder jaar uit zo’n 3 miljoen huishoudens.
| Peiljaar | Aantal huishoudens |
|---|---|
| 2012 | 3090724 |
| 2013 | 3036766 |
| 2014 | 2989063 |
| 2015 | 2935099 |
| 2016 | 2911773 |
| 2017 | 2842415 |
| 2018 | 2786899 |
| 2019 | 2710543 |
2.2 Zonnepanelen
Zonnepanelen worden door het CBS geregistreerd per installatie, en gekoppeld aan adressen. Hiermee wordt voor ieder huishouden in de populatie en de huishoudens in hun netwerk bepaald of zij wonen op een adres met zonnepanelen. Informatie over installaties van zonnepanelen is afkomstig uit verschillende bronnen (zie ook de toelichting van CBS StatLine, 2025 en CBS, 2025b), waarschijnlijk is 85-90 procent van de installaties van zonnepanelen op particuliere adressen bekend tot en met verslagjaar 2020. Vanaf verslagjaar 2021 is dit minimaal 90 procent (CBS, 2025b).
De huishoudens uit de onderzoekspopulatie wonen in het peiljaar (zie 2.4) nog op een adres zonder zonnepanelen. Een jaar daarna wordt bepaald of zij dan zonnepanelen hebben (ofwel via installatie op het eigen dak, ofwel door verhuizing naar een woning met zonnepanelen).
2.3 Netwerken
Voor het afleiden van de netwerkrelaties van de huishoudens in de onderzoekspopulatie is het persoonsnetwerkenbestand (Van der Laan et al., 2022, Das et al., 2023) van het CBS gebruikt. Dit bestand bevat relaties tussen alle inwoners van Nederland en bestaat uit vijf dimensies: familie, huisgenoten (huishouden), buren, collega’s (werk), en klasgenoten (school).
In dit onderzoek worden de dimensies familie, buren en collega’s gebruikt. Het gaat om administratieve relaties, het is niet bekend of mensen elkaar daadwerkelijk kennen of contact met elkaar hebben. Het familienetwerk bevat alle administratief bekende relaties tussen ouders, kinderen, broers en zussen (inclusief stief/schoonfamilie-relaties), en daarnaast nog grootouders, kleinkinderen, ooms en tantes en neven en nichten. Het burennetwerk bestaat uit de personen die wonen op de 10 dichtstbijzijnde adressen plus 20 willekeurig gekozen personen die binnen een straal van 200 meter wonen. Het colleganetwerk bestaat uit maximaal 100 personen die bij hetzelfde bedrijf werken. Wanneer er meer dan 100 mensen bij een bedrijf werken zijn de 100 meest dichtbij wonende collega’s gekozen.
Het netwerk van een huishouden wordt gebaseerd op het netwerk van de vertegenwoordiger(s) van het huishouden. Netwerken van andere medebewoners (andere huisgenoten, voornamelijk kinderen) worden niet meegenomen, we gaan ervan uit dat het hoofdzakelijk de vertegenwoordigers van het huishouden zijn die het besluit nemen om zonnepanelen te (laten) installeren.
De netwerkrelaties zijn oorspronkelijk op persoonsniveau. Die relaties zijn voor dit onderzoek uniek gemaakt op huishoudniveau, dus worden bijvoorbeeld ouders en kinderen die samen een huishouden vormen maar één keer geteld als ‘huishouden in het netwerk’.
Voor alle unieke huishoudens in het netwerk wordt bepaald of zij wonen op een adres met zonnepanelen. Hiervoor gelden geen andere restricties, deze huishoudens kunnen bijvoorbeeld ook wonen in huurhuizen met zonnepanelen die geïnstalleerd zijn door de eigenaar van de woning (in tegenstelling tot de huishoudens uit de populatie zelf).
Voor alle huishoudens met kans op zonnepanelen wordt voor elk peiljaar bepaald welk percentage van de huishoudens in hun netwerk zonnepanelen had. In 2012 hadden de meeste huishoudens in de populatie helemaal geen huishoudens met zonnepanelen in hun netwerk. In 2019 was het gemiddelde percentage huishoudens met zonnepanelen in de netwerken van de huishoudens in de populatie 16,7 procent.
Waarden boven de 30 procent komen bijna niet voor, ook niet in latere jaren. Huishoudens die wel een hoger percentage zonnepanelen in het netwerk hebben, hebben vaak een klein netwerk, met minder dan 10 huishoudens. Hierdoor valt het percentage zonnepanelen in het netwerk relatief hoog uit als maar een paar huishoudens in het netwerk zonnepanelen heeft. Deze zeldzaam hoge waarden kunnende uitkomsten van de analyse vertekenen. Daarom is het percentage huishoudens in het netwerk met zonnepanelen begrensd op 30 procent, en zijn alle waarden daarboven zijn gelijkgesteld aan 30 procent.
2.4 Peiljaren
De analyse beslaat de jaren 2012 tot en met 2019. Voor ieder jaar wordt een nieuwe onderzoekspopulatie van huishoudens met kans op zonnepanelen vastgesteld. Huishoudens die bijvoorbeeld in 2012 zonnepanelen namen, komen in latere jaren niet meer voor in de onderzoekspopulatie. Het kan zijn dat huishoudens in meerdere jaren voorkomen, als zij in de tussentijd geen zonnepanelen nemen, maar wel in meerdere jaren voldoen aan de vereisten (2.1).
Voor ieder jaar zijn de achtergrondkenmerken van de populatie huishoudens, en het percentage huishoudens in hun netwerk met zonnepanelen, vastgesteld op 1 januari. Om te bepalen of een huishouden al dan niet zonnepanelen heeft genomen, wordt gekeken naar de situatie één jaar later. Deze tussenperiode van een jaar vergroot de kans dat de huishoudens die zonnepanelen nemen daadwerkelijk beïnvloed zijn door het netwerk. Situaties waar niet sociale beïnvloeding maar een externe factor zorgt voor de gelijktijdige keuze voor zonnepanelen door een hele groep op hetzelfde moment, worden op deze manier uitgesloten van de analyse (bijvoorbeeld als de hele straat tegelijk zonnepanelen neemt omdat dat voordeliger is dan individuele contracten).
Voor de analyses is de data van alle peiljaren samengevoegd. Omdat het aandeel mensen dat zonnepanelen neemt wel van jaar op jaar verschilt, is het peiljaar toegevoegd als achtergrondvariabele in de analyses.
2.5 Analyse
Om het effect te bepalen van het percentage huishoudens met zonnepanelen in het netwerk op het al dan niet nemen van zonnepanelen, wordt gebruik gemaakt van regressieanalyse. De uitkomstvariabele van de regressie is of een huishouden in de populatie wel of geen zonnepanelen heeft genomen (1 = wel, 0 = niet). De voorspellende variabele waarvan we het effect willen meten is het percentage huishoudens met zonnepanelen in het netwerk van het huishouden. Daarnaast worden verschillende achtergrondkenmerken meegenomen in de analyse.
Er wordt gebruik gemaakt van Linear Probability Models (LPM): een lineaire regressieanalyse, toegepast op een binaire uitkomstmaat. Deze modellen schatten de kans op de binaire uitkomstvariabele, in dit onderzoek de kans dat een huishouden zonnepanelen neemt. In de bijlage worden deze modellen verder toegelicht.
Achtergrondkenmerken
In het eerste deel van de resultaten worden de kenmerken beschreven van huishoudens die zonnepanelen nemen. In de regressieanalyse worden deze kenmerken meegenomen als voorspellende variabelen. Daarmee wordt gedeeltelijk gecorrigeerd voor gedeelde achtergrondkenmerken waardoor mensen in een netwerk op elkaar kunnen lijken.
Het gaat om de volgende achtergrondkenmerken:
- Hoogst behaald onderwijsniveau (referentiepersoon)
- Partner in het huishouden (‘Ja’ als referentiepersoon een partner heeft die tot hetzelfde huishouden behoort en er dus twee vertegenwoordigers zijn, anders ‘Nee’)
- Gemiddelde leeftijd (vertegenwoordiger(s) van het huishouden)
- Aantal andere volwassen medebewoners (exclusief de vertegenwoordiger(s))
- Financiële welvaart (combinatie van besteedbaar inkomen en vermogen van het huishouden), in kwintielen
- Bouwjaar (woning)
- WOZ-waarde (woning)
- Regio (van de woonplaats, ingedeeld in Noord-, Oost-, West- en Zuid-Nederland)
- Stedelijkheid (van de woonplaats)