Wat behelst het onderzoek?
Doel
De Europese regeringsleiders hebben in 2000 het doel uitgesproken dat de Europese Unie (EU) in 2010 de belangrijkste kenniseconomie van de wereld heeft. De Nederlandse regering heeft zich ten doel gesteld om Nederland een land in de Europese voorhoede te laten zijn waar het gaat om onderwijs, onderzoek en innovatie. Om op deze doelen te kunnen sturen, vraagt de EU elke 2 jaar uitgebreide informatie van de lidstaten over de innovatieve inspanningen van bedrijven. Deze enquêtes zijn Europees geharmoniseerd. Zij worden de Community Innovation Surveys (CIS) genoemd. Tevens vraagt de EU elk jaar informatie over de Research & Development-activiteiten van bedrijven, instellingen en het hoger onderwijs.
Doelpopulatie
Het CBS voert de statistieken uit bij in Nederland gevestigde bedrijven en instellingen met 10 en meer werkzame personen. Niet alle bedrijfstakken van de economie worden echter (in dezelfde mate) onderzocht, omdat R&D en innovatie niet overal relevant zijn. De Industrie- en Dienstensector is de belangrijkste doelpopulatie.
Statistische eenheid
Het CBS onderhoudt een eigen bedrijvenregister waarin de Nederlandse bedrijven en ondernemingen worden beschreven als statistische eenheden. Binnen dit Algemeen Bedrijvenregister (ABR) wordt voor een bedrijf een zogenoemde bedrijfseenheid afgeleid en vastgelegd. Het ABR is de basis voor de populatieafbakening en steekproeftrekking van veel bedrijfseconomische statistieken, waaronder de statistieken Research & Development en Innovatie.
Aanvang onderzoek
De innovatie-enquête wordt door het CBS uitgevoerd sinds de verslagperiode 1994-1996, de R&D-enquêtes sinds verslagjaar 1970. Sinds 2002 voert het CBS de statistiek uit bij in Nederland gevestigde bedrijven met 10 en meer werkzame personen. Tot verslagjaar 2002 betrof de onderzoekspopulatie bedrijven in Nederland met 10 en meer werknemers. In de innovatie-enquêtes over de verslagperiodes 1996-1998 en 1998-2000 zijn ook bedrijven met 1 tot 10 werknemers geënquêteerd.
Frequentie
De statistieken Research & Development en Innovatie meten jaarlijks hoe de Nederlandse kenniseconomie er voor staat. Ze beschrijven de investeringen in R&D en overige innovatieve activiteiten van Nederlandse bedrijven en instellingen. Kennisstromen en de resultaten van het innovatieproces horen hier ook bij.
In de oneven verslagjaren wordt de Research & Development (R&D) gemeten en in de even verslagjaren worden ook andere aspecten van innovatie (CIS) gemeten.
Publicatiestrategie
De uitkomsten voor verslagjaar t worden ten minste tweemaal vastgesteld en gepubliceerd: allereerst ten behoeve van de Europese verordening een voorlopig R&D-cijfer in november van het jaar t+1. Uiterlijk in juli t+2 volgen de definitieve R&D-cijfers en voor de even jaren t ook de innovatiedata.
Hoe wordt het uitgevoerd?
Soort onderzoek
Voor de statistieken over Research & Development en Innovatie wordt jaarlijks een deel van de bedrijfseenheden in de doelpopulatie geënquêteerd. Dit gebeurt op steekproefbasis (gestratificeerde steekproef).
Waarnemingsmethode
De waarneming vindt plaats via schriftelijke enquêteformulieren en enquêteformulieren die digitaal, via internet, kunnen worden ingevuld.
Berichtgevers
Dit zijn in Nederland gevestigde bedrijven en instellingen met 10 en meer werkzame personen.
Steekproefomvang
De totale steekproefomvang bevat in de even verslagjaren (CIS) ongeveer 15.000 bedrijfseenheden. In de oneven verslagjaren (R&D-enquête) worden ongeveer 1.500 eenheden uitgevraagd.
Controle- en correctiemethoden
Allereerst wordt naar de samenhang tussen verschillende vragen gekeken. Als hierin duidelijk fouten blijken te staan - zoals een bedrijf dat zegt geen innovator te zijn, maar wel innovatie-uitgaven heeft - dan wordt er een vlag geplaatst. Na bestudering van de case wordt beslist welke acties ondernomen moeten worden om bepaalde gegevens handmatig te corrigeren. In de volgende fase wordt een aantal automatische correcties doorgevoerd. De gecorrigeerde velden krijgen ook een vlagwaarde. Ontbrekende waarden die worden geïmputeerd leiden tot een andere vlagwaarde bij de case dan gecorrigeerde waarden. De controles en correcties zijn door Eurostat voorgeschreven en aangevuld met een aantal extra controles en correcties. Bij ernstige twijfel of onduidelijkheid omtrent ingevulde vragenlijsten wordt het gescande formulier opgevraagd en zo nodig navraag gedaan bij de berichtgever. Het streven is om zo veel mogelijk fouten binnen het CBS te corrigeren. Naast het formulier van het lopende enquêtejaar, is ook vaak de opgave van vorig jaar beschikbaar. Op grond van deze vergelijking kunnen vaak fouten worden gecorrigeerd. Uiteindelijk resteren fouten die ‘automatisch’ kunnen worden gecorrigeerd.
Indien van een cruciaal bedrijf niets bekend is, worden resultaten van vorige jaren bekeken; indien gewenst, wordt de opgave van het voorgaand jaar gedupliceerd. Verder schrijft Eurostat voor dat item non-respons (partiële non-respons) moet worden ingeschat. Dat betekent dat bij slechts gedeeltelijk ingevulde enquêteformulieren ontbrekende waarden worden bijgeschat. Dit geldt zowel voor metrische variabelen (uitgaven en R&D-personeel), ordinale (sterk/gematigd/zwak-vragen en dergelijke), als voor nominale (ja/nee) variabelen. Hiertoe is een SPSS-syntax opgesteld, die als volgt werkt: Het bestand wordt opgedeeld in cellen. Dit zijn combinaties van grootteklasse en bedrijfstak. Voor elk bedrijf waarvoor gegevens moeten worden geschat, wordt een bedrijf (donor) gezocht dat zoveel mogelijk op het betreffende bedrijf lijkt (de donor wordt dus vanzelfsprekend binnen dezelfde cel gezocht). Wanneer een geschikte donor is gevonden, worden de gegevens hiervan overgenomen voor het in te schatten bedrijf. Elk bedrijf kan slechts eenmaal als donor optreden.
De overige non-respondenten (en de niet waargenomen populatie-eenheden) worden geschat door voor de bedrijfseenheden per stratum (SBI 2-digit/grootteklasse combinatie) een ophoogfactor te bepalen (stratumpopulatie/respons – N/n).
Weging
De populatieschatting komt tot stand door voor de bedrijfseenheden per stratum (sbi 2-digit / grootteklasse combinatie) een ophoogfactor te bepalen (stratumpopulatie/respons – N/n).
Wat is de kwaliteit van de uitkomsten?
Nauwkeurigheid
Voor deze statistiek wordt gebruik gemaakt van een grote, representatieve en gestratificeerde steekproef. Het populatiekader zal echter nooit foutloos zijn. Als fouten worden overdekking, onderdekking en classificatiefouten onderscheiden. De overdekking bestaat uit eenheden die ten onrechte in het kader zijn opgenomen, terwijl ze bijvoorbeeld niet meer bestaan of in een andere eenheid zijn opgegaan. Onder de onderdekking wordt het ontbreken van eenheden verstaan, bijvoorbeeld omdat zij met vertraging in het kader worden opgenomen. Classificatiefouten zijn onjuiste waarden van classificatiewaarden, zoals SBI en grootteklasse. Tussen het moment van steekproeftrekken en het publiceren van de resultaten zal een aantal fouten worden ontdekt. Deze fouten worden gecoördineerd verwerkt en de resultaten komen beschikbaar aan alle statistieken.
Volgtijdelijke vergelijkbaarheid
In de oneven statistiekjaren wordt de R&D gemeten en in de even statistiekjaren worden ook andere aspecten van innovatie gemeten. Sinds 1996 zijn de hoofdvariabelen van beide enquêtes vergelijkbaar.
Beschrijving kwaliteitsstrategie
De data worden eerst op individueel niveau consistent gemaakt. Vervolgens wordt de geaggregeerde data vergeleken met de cijfers van vorig jaar. Verder is er een zeer uitgebreide vragenset en berekeningen die garant staan voor de kwaliteit van deze statistiek.