Het persoonlijke netwerk en de keuze voor zonnepanelen

Bijlage

Uitleg uitkomstmaten regressie

Voor dit artikel is gebruik gemaakt van lineaire regressie om het verband te schatten tussen het percentage zonnepanelen in het netwerk en het wel of niet nemen van zonnepanelen.

Een alternatief voor het schatten van een model met een binaire uitkomstvariabele is logistische regressie. Een belangrijk nadeel hiervan is dat de coëfficienten van logistische regressie niet één-op-één te vergelijken zijn tussen modellen (Mood, 2009). In dit onderzoek wordt de analyse twee keer uitgevoerd: één keer met het percentage huishoudens met zonnepanelen in het hele netwerk, en één keer met het percentage huishoudens met zonnepanelen in het familie-, buren- en colleganetwerk als drie losse variabelen. Door LPM te gebruiken in plaats van logistische regressie zijn deze analyses beter onderling te vergelijken. Daarnaast zijn de uitkomsten van logistische regressie moeilijker te interpreteren en visualiseren, omdat ze niet direct iets zeggen over de kans op een uitkomstmaat, maar over de kansverhouding (odds); de verhouding van de kans dat iets gebeurt, tegenover de kans dat dit juist niet gebeurt. Dezelfde modellen zijn ter controle wel geschat met logistische regressie. De resultaten leiden tot dezelfde conclusies als de resultaten van LPM. In dit artikel zijn alleen de resultaten van LPM getoond.

Om de tabellen in deze bijlage te begrijpen is het handig om te weten dat in een lineair regressiemodel de data worden beschreven als:

\[ y_i = \beta_0 + \beta_1*x_{i1}+\beta_2*x_{i2} + \ldots + \beta_n*x_{in} \]

Waarbij de yi de uitkomstvariabele is, en xi1 tot en met xin de voorspellende variabelen. In dit onderzoek is de uitkomstvariabele of een huishouden wel of geen zonnepanelen nam. Dit is een binaire variabele, de uitkomst is 0 (geen zonnepanelen) of 1 (wel zonnepanelen). Wanneer een lineaire regressie wordt toegepast op een dataset met binaire uitkomstvariabele, noemen we dit een Linear Probability Model (LPM).

De interpretatie van een LPM is iets anders dan bij een lineaire regressie met een continue uitkomstvariabele, omdat het model bij een LPM niet de uitkomstmaat yi zelf voorspelt, maar de kans op een positieve uitkomst, gegeven bepaalde waarden voor de voorspellende variabelen in het model. In dit onderzoek is dat de kans dat iemand zonnepanelen neemt. De vergelijking wordt dan:

\[ \Pr(y_i=1 | x_i) = \beta_0 + \beta_1*x_{i1}+\beta_2*x_{i2} + \ldots + \beta_n*x_{in} \]

Uit de regressieanalyse volgen de waarden voor βo tot en met βn waarmee deze formule het beste past op de data. Dit noemen we de coëfficiënten. Stel dat β1 een fictieve waarde heeft van 0,5, en dat dit de coëfficiënt is voor het percentage huishoudens met zonnepanelen in het netwerk. Voor elke toename van xi1, het percentage huishoudens met zonnepanelen in het netwerk, van 1 procentpunt, neemt volgens het model Pr(yi=1), de kans dat een huishouden zonnepanelen neemt, toe met 0,5 procentpunt, wanneer de andere achtergrondkenmerken gelijk blijven.

Hetzelfde geldt voor de andere xi, ook wanneer de waarden niet continu zijn, maar discreet. Stel bijvoorbeeld dat xi2 het kenmerk ‘partner in het huishouden’ is. Dit kan ‘ja’ of ‘nee’ zijn. In de regressieanalyse wordt ‘ja’ als referentie gebruikt voor de uitkomst. Dan is de kans op het nemen van zonnepanelen voor een huishouden zonder partner β2 keer groter of kleiner dan de kans voor huishoudens met partner, wanneer alle andere voorspellende variabelen gelijk worden gehouden.

B.1 Resultaten lineaire regressieanalyse
Model 1Model 1Model 2Model 2
CoëfficiëntSDCoëfficiëntSD
Intercept0,05700,0362-0,09470,0467
% zonnepanelen in netwerk
Hele netwerk0,16860,0008
Familie 0,08430,0007
Buren 0,08310,0008
Collega's 0,09270,0010
Peiljaar (ref. 2012)
2013-0,00520,0001-0,00730,0002
2014-0,00320,0001-0,00580,0002
2015-0,00960,0002-0,01390,0002
2016-0,00590,0002-0,01060,0002
20170,00290,0002-0,00250,0002
20180,01800,00020,01290,0002
20190,02550,00020,02190,0003
Onderwijsniveau (ref. basisonderwijs, vmbo, mbo-1)
Havo, vwo, mbo2-40,00540,00020,00480,0002
Hbo, wo0,01060,00020,00950,0002
Onbekend0,00230,00010,00310,0002
Partner (ref. ja)
Nee-0,01730,0001-0,01690,0001
Leeftijd (ref. 18 - 30)
31 - 450,00600,00020,00570,0002
46 - 650,01060,00020,01040,0002
66+-0,00260,00020,00500,0004
Medebewoners (ref. 0)
1-0,00200,0001-0,00150,0001
2-0,00180,0001-0,00150,0001
3 of meer-0,00030,00010,00020,0002
Welvaart (ref. 1e kwintiel)
2e kwintiel0,00330,00030,00270,0004
3e kwintiel0,00710,00030,00630,0004
4e kwintiel0,01250,00030,01140,0004
5e kwintiel0,02160,00030,02050,0004
Bouwjaar (ref. 1700 t/m 1950)
1951 - 19800,00650,00010,00740,0001
1981+0,01030,00010,00990,0001
WOZ (ref. <= 200 duizend euro)
201 - 400 duizend euro0,00310,00010,00390,0001
> 400 duizend euro0,00280,00010,00450,0002
Regio (ref. Noord)
Oost-0,00790,0001-0,00800,0002
West-0,01250,0001-0,01300,0002
Zuid-0,00790,0001-0,00730,0002
Stedelijkheid (ref. niet/weinig stedelijk)
Matig stedelijk-0,00180,0001-0,00180,0001
Sterk stedelijk-0,00290,0001-0,00290,0001
Zeer sterk stedelijk-0,00530,0001-0,00450,0002
SD: standaarddeviatie

B.2 Resultaten lineaire regressieanalyse, niet gecorrigeerd voor achtergrondkenmerken
Model 1Model 1Model 2Model 2
CoëfficiëntSDCoëfficiëntSD
Intercept1,08760,00560,87660,0073
% zonnepanelen in netwerk
Hele netwerk0,29210,0006
Familie 0,10920,0007
Buren 0,13120,0007
Collega's 0,15180,0008
SD: standaarddeviatie

B.3 Verklaarde variantie
Model 1Model 2
R2 (%)
Model met correctie voor achtergrondkenmerken (B.1)1,92,1
Model zonder correctie voor achtergronkenmerken (B.2)1,11,5