Auteur: Edwin Horlings, Olaf Koops, Julius Hage
Monitor Verduurzaming Industrie 2022

5. Data

In dit hoofdstuk beschrijven we op hoofdlijnen de data die worden gebruikt om indicatoren te berekenen.

Data op macro- en mesoniveau

Voor het volgen van de hoofddoelen van het beleid worden primair bestaande data op macroniveau en mesoniveau gebruikt. Het macroniveau is dat van de hele industrie. Het mesoniveau betreft een uitsplitsing naar bedrijfstakken op sbi-2-niveau. De macro- en mesocijfers zijn consistent met de voornaamste statistische standaarden (zoals de Nationale Rekeningen en de IPCC), worden nauwgezet onderhouden en regelmatig gereviseerd, zijn internationaal vergelijkbaar en worden alom herkend.

De volgende indicatoren zijn opgenomen in de tabellenset van de Monitor Verduurzaming Industrie 2022 op macro- en mesoniveau:

  • Toegevoegde waarde, aantal gewerkte uren en arbeidsproductiviteit
  • Broeikasgasemissies (volgens IPCC-definities en Nationale Rekeningen) en emissie-intensiteit
  • Energieverbruik en energie-intensiteit
  • Aandeel hernieuwbare energie en fossiele brandstoffen in finaal energieverbruik
  • Aandeel energiekosten in productiekosten
  • Aantal ingeleverde emissierechten
  • Milieu-investeringen
  • Bedrijfsafval, totaal en aandeel met een nuttige toepassing als bestemming

Data-infrastructuur voor microdata

Voor het monitoren van de activiteiten die bedrijven ondernemen om te verduurzamen zijn allerlei microdatabestanden nodig. Macro- en meso-cijfers geven geen inzicht in veranderingen binnen bedrijven (zoals de investeringen die bedrijven doen in nieuwe technologieën). Ook is het doorgaans niet mogelijk om cijfers uit te splitsen naar bedrijfsgrootte en regionaal cluster.

Het onderliggende principe is dat meerdere dimensies van veranderingen binnen bedrijven kunnen worden gemonitord door koppelingen te maken tussen microdatabestanden die ieder een ander deel van de bedrijfsactiviteiten meten.

Ieder microdatabestand geeft inzicht in een specifiek deel van de activiteiten. Bijvoorbeeld, de Productiestatistiek (PS) geeft cijfers over omzet en productiekosten, de Investeringsenquête geeft cijfers over investeringen naar type, en voor energieverbruik en CO2-emissies moest een maatwerktabel gemaakt worden.

Ieder microdatabestand vertegenwoordigt een bepaald deel van het totale bedrijvenbestand. Sommige variabelen zijn integraal beschikbaar (zoals omzet). De meeste bestanden zijn gevuld op basis van enquêtes onder een steekproef van bedrijven. In hoofdstuk 5 gaan we in op de methodologische uitdagingen die dit met zich meebrengt.

Figuur 5.1 geeft een overzicht van de thema’s die relevant zijn voor de MVI. Voor alle groen gekleurde thema’s zijn microdatabestanden verzameld en aan het ABR gekoppeld. De databestanden van de energieverduurzamingsregelingen zijn door RVO aan het CBS geleverd en zijn aan het ABR gekoppeld. Dit betreft de SDE++, EIA, ISDE en MIA/VAMIL.

Figuur 5.1 Beschrijving van de data-infrastructuur

Dit figuur beschrijft de bestanden in de data-infrastructuur van de Monitor Verduurzaming Industrie en de manier waarop ze zijn gekoppeld via het Algemeen Bedrijven Register.

Tabel 5.1 Microdatabestanden in de MVI data-infrastructuur
bronperiode (zonder breuk)populatie en bijzonderhedentype datakennisinstellingentoegankelijkheid
ABR2006-2021Alle in Nederland geregistreerde bedrijven en instellingen (incl. zelfstandigen).IntegraalJaBeschikbaar in RA
BDK2007-2022Alle in Nederland geregistreerde bedrijven en instellingen (incl. zelfstandigen).IntegraalJaBeschikbaar in RA
DRT2014-2020Actieve bedrijfseenheden met als hoofdactiviteit groothandel en handelsbemiddeling,
vervoer en opslag, horeca, informatie en communicatie, specialistische zakelijke diensten,
overige zakelijke dienstverlening en overige diensten.
Analysebestand op basis van verschillende bronnen
van omzetgegevens
Geen hoger onderwijs of UMC’s,
wel overige kennisinstellingen
CBS-intern. Derden kunnen een
verzoek voor maatwerk doen.
IHG2009-2020Alle bedrijfseenheden die in een jaar actief zijn geweest en internationale handel in
goederen hadden, alleen ‘marktgerichte eenheden’, bedrijven die aan het ABR gekoppeld kunnen worden.
IntegraalNeeBeschikbaar in RA
Investeringen1995-2020Alle bedrijven in SBI-range B tot en met J en L tot en met N.Steekproef tot 20 wp, daarna integraal.
Bedrijven buiten de steekproef zijn geïmputeerd.
NeeBeschikbaar in RA
Microdata CO2-emissies en energieverbruik2015-2020Bedrijven in industrie (SBI 10 t/m 33) en energie (SBI 35), waaronder alle ETS-bedrijvenSteekproefNeeNiet beschikbaar in RA
MKB2012-2019Bedrijven in delfstoffenwinning (SBI 6 t/m 9), industrie (SBI 10 t/m 33) en energie (SBI 35)SteekproefNeeBeschikbaar in RA
Prodcom1993-2020delfstoffenwinning en industrieSteekproefNeeBeschikbaar in RA
PS1993-2020Bedrijven in: landbouw, winning van delfstoffen, industrie, productie en distributie
van energie en water, bouwnijverheid, reparatie van consumentenartikelen, groothandel en detailhandel,
horeca, vervoer, opslag en communicatie, zakelijke en persoonlijke dienstverlening, milieudienstverlening
en gezondheids- en welzijnszorg.
SteekproefNeeBeschikbaar in RA
NEA2011-2021ETS installaties (gekoppeld aan het ABR)IntegraalNeeBeschikbaar in RA

5.1 RVO-databases

RVO heeft ten behoeve van de ontwikkeling en productie van de MVI microdatabestanden geleverd voor de energieverduurzamingsregelingen. Dit betreft de EIA, SDE++, ISDE en MIA/VAMIL. Het is de bedoeling dat op termijn ook microdata uit innovatieregelingen in de MVI-data-infrastructuur wordt ondergebracht (figuur 5.2).


Figuur 5.2 Regelingen per fase van innovatietraject

De figuur toont de regelingen voor bedrijven voor energie-innovatie en energieverduurzaming per Technology Readiness Level.

De afspraken over de levering van de RVO-databases is onderdeel gemaakt van de werkafspraken tussen CBS en RVO (“Procesdocument koppelingen beleidsinstrumenten B&I”, december 2019). Daarin is een structurele koppelsystematiek wordt beschreven waarmee de administratieve uitvoeringsgegevens van RVO jaarlijks worden gekoppeld aan de statistische data-infrastructuur van het CBS. Vanaf het begin is zorgvuldig afgestemd met RVO (bijvoorbeeld over het koppelen van bestanden en het classificeren van bedrijven en technologieën) en met werkzaamheden binnen het CBS die zich op hetzelfde terrein begeven. Zo zijn processen en statistieken op elkaar afgestemd en wordt dubbel werk zoveel mogelijk vermeden.

Binnen het CBS zijn de microbestanden op bedrijfsniveau aan elkaar te koppelen middels een bedrijfsidentificatienummer dat onderhouden wordt in het ABR. Het ABR houdt zich bezig met het vaststellen en registreren van de identificatie- en structuurgegevens van de bedrijven en instellingen in Nederland. Voor deze werkzaamheden gebruikt het ABR onder andere data van de Kamer van Koophandel (KVK). Op deze manier kan een koppeling worden gemaakt tussen de interne CBS-microdata en de externe bedrijfseenheden.

Om de koppeling tussen de CBS-microdata en de RVO-databases tot stand te brengen is zo een koppeling vereist. De RVO-databases zijn alle voorzien van een KVK-nummer. Dit KVK-nummer is opgegeven tijdens de aanvraag voor de desbetreffende RVO-regeling. Met behulp van het ABR kan in de meeste gevallen een koppeling met de CBS-microbestanden worden gemaakt.

Het koppelen van de bedrijfseenheden is echter geen sinecure. Eenvoudige bedrijfsstructuren zijn gemakkelijk aan de bedrijfsidentificatie te koppelen. Maar complexe bedrijfsstructuren maken het in sommige gevallen minder eenduidig welke bedrijfsidentificatie gekozen dient te worden.

Er is een beslisboom opgesteld om per jaar op een gestandaardiseerde manier tot de juiste koppeling te komen. Om zoveel mogelijk aan te sluiten bij reeds bestaande CBS-methodes voor het koppelen van bedrijven is er voor de MVI gekozen om gebruik te maken van de methode van het CBS Centrum voor Beleidsstatistiek. Zo worden alle RVO-regelingen die het CBS gebruikt volgens dezelfde systematiek gekoppeld.

De beslisboom bepaalt voor zowel de eenvoudige als voor de complexe bedrijfsstructuren welke koppeling het beste gebruikt kan worden. Zo worden bedrijven met een SBI in de onderstaande lijst uitgesloten indien meer dan één koppeling beschikbaar is:

  • SBI '64' Financiële instellingen (geen verzekeringen en pensioenfondsen
  • SBI '65' Verzekeringen en pensioenfondsen (geen verplichte sociale verzekeringen)
  • SBI '68' Verhuur van en handel in onroerend goed
  • SBI '69' Rechtskundige dienstverlening, accountancy, belastingadvisering en administratie
  • SBI '70' Holdings (geen financiële), concerndiensten binnen eigen concern en managementadvisering
  • SBI '82' Overige zakelijke dienstverlening

Indien na deze selectie nog altijd meerdere koppelingen beschikbaar zijn per uniek KVK-nummer, zal met behulp van de microbestanden een score per bedrijfsidentificatie worden berekend om zo tot de beste koppeling te komen. Aan ieder microbestand is een weging toegekend al naar gelang het belang van de microdata voor de MVI. Deze weging wordt toegekend indien het interne bedrijfsidentificatienummer beschikbaar is in het microbestand. Uiteindelijk worden de scores opgeteld en wordt de koppeling met de hoogste score gekozen.

De beslisboom is universeel te gebruiken voor iedere lijst met KVK-nummers. Nieuwe regelingen kunnen eenvoudig door de beslisboom worden gehaald. De beslisboom corrigeert automatisch voor ontbrekende voorloopnullen indien die aanwezig zijn in de lijst. Uitdagingen doen zich voornamelijk voor wanneer in de lijst foutieve KVK-nummers voorkomen. Wanneer een KVK-nummer niet voorkomt in het ABR kan dat bedrijf niet automatisch worden gekoppeld. In dit soort gevallen valt er nog een koppeling te maken op basis van postcode, huisnummer en plaats. Dit is echter handwerk en geen onderdeel van de beslisboom.