Vacatures, online waarneming (beroepenindeling)

Wat behelst het onderzoek

Doel

Het publiceren van vacaturecijfers in Nederland naar beroepsklasse en beroepssegment volgens de Beroepenindeling ROA-CBS 2014 (BRC 2014).

Doelpopulatie

Alle nieuw ontstane online vacatures van bedrijven en instellingen in Nederland met personeel.

Statistische eenheid

Ontstane vacature.

Aanvang onderzoek

Gegevens over vacatures naar beroepenindeling zijn beschikbaar vanaf 2018.

Frequentie

Elk jaar.

Publicatiestrategie

De resultaten worden ongeveer vijf maanden na afloop van een jaar gepubliceerd. De cijfers zijn voorlopig en kunnen bijgesteld worden ten gevolge van een verbetering van de weegmethode.

Hoe wordt het uitgevoerd

Soort onderzoek

Het onderzoek combineert online vacaturedata met gegevens uit steekproefonderzoek en registerdata. De online vacatures worden gewogen naar het totaal aantal vacatures van de Vacatures, kwartaalenquête.

Waarnemingsmethode

Online vacatures worden verzameld via webscraping op internet. Hierbij wordt systematisch gezocht naar nieuwe vacatures op websites. Vervolgens worden de teksten van de vacatures in het geheel bewaard. Dubbele publicaties van identieke vacatures worden daarna verwijderd. De vacatures worden geclassificeerd naar o.a. beroep en bedrijf.

Berichtgevers

De online vacatures worden verzameld door Textkernel.

Steekproefomvang

Alle online vacatures in Nederland.

Controle- en correctiemethoden

Het CBS past de SBI-code van de online vacatures aan op basis van het Algemene Bedrijvenregister (ABR). Als koppelsleutel wordt het KvK nummer van het door Textkernel toegewezen bedrijf gebruikt. Koppelingen worden gecontroleerd op consistentie via een top down benadering.

Weging

Het aantal online vacatures komt niet geheel overeen met de totale populatie ontstane vacatures. Een verklaring is dat niet alle vacatures online worden gepubliceerd of waargenomen; ook kan een vacature op meerdere plekken online worden gepubliceerd.

Daarom wordt het aantal online vacatures gewogen, zodat het aantal per bedrijfstak aansluit bij het aantal uit de Vacatures, kwartaalenquête (niet seizoensgecorrigeerd). De weging is gebaseerd op een methode van het Uitvoeringsinstituut Werknemersverzekeringen (UWV). Elke online vacature krijgt een gewicht, waarmee zo goed mogelijk gecorrigeerd wordt voor:

  • Vacatures met verschillende beroepsniveaus. Voor elementaire beroepsniveaus wordt er minder online geworven en meer andere kanalen ingezet. Lagere beroepsniveaus krijgen daarom een hoger gewicht dan hogere beroepsniveaus, afgeleid uit het aandeel werkenden naar beroepsniveau uit de Enquête Beroepsbevolking (EBB);
  • Indirecte vacatures via intermediairs. Intermediairs kunnen de enige bron zijn voor een vacature, maar kunnen ook zorgen voor meer dubbele vacatures. Als er voor een vacature zowel direct als indirect online geworven wordt, is het niet altijd duidelijk dat het om dezelfde vacature gaat en wordt er dus niet altijd ontdubbeld. De indirecte vacatures krijgen daarom een kleiner gewicht (25%) dan de directe vacatures;
  • Directe vacatures met een onbekende bedrijfstak, zodat deze bij de juiste BRC 2014 beroepsgroep worden meegeteld;
  • Aansluiting van de ontstane vacatures per bedrijfstak bij de aantallen uit de Vacatures, kwartaalenquête voor ieder kwartaal.

Wat is de kwaliteit van de uitkomsten

Nauwkeurigheid

De uitkomsten van het onderzoek hebben een onnauwkeurigheidsmarge. Waarden worden daarom afgerond om de suggestie van al te grote nauwkeurigheid te voorkomen.
Drie oorzaken van onnauwkeurigheid zijn vastgesteld. Hieruit zijn drie voorwaarden afgeleid voor publicatie:

  • Het resultaat moet niet te sterk afhankelijk zijn van variatie ten gevolge van onvolledigheid van online vacatures. De online vacaturedata is hiervoor 50 duizend keer random samengesteld volgens een bootstrap analyse. Voorwaarde (1): 90% van de bootstrap-resultaten van een waarde moet binnen een interval liggen dat minder afwijkt dan 10% van de berekende waarde.
  • Het resultaat moet niet te sterk afwijken ten gevolge van variatie in de beroepsclassificaties. Hiervoor is gebruik gemaakt van een correctietabel uit eerder onderzoek van UWV naar de beroepenclassificering door Textkernel. Voorwaarde (2): Herclassificatie leidt tot maximaal 10% afwijking van de berekende waarde.
  • Het resultaat moet niet te sterk afhankelijk zijn van het gekozen gewicht van 25% van de intermediaire vacatures. Voorwaarde (3): Het verschil tussen de uitkomsten van weging van intermediaire vacatures met zowel een gewicht van 10% als 70% is maximaal 20% van de berekende waarde.

Alleen als de waarde van een cel voldoet aan alle drie de voorwaarden in de jaren 2018, 2019 en 2020, worden de bijbehorende cijfers gepubliceerd.

Uitgezonderd van voorwaarde (2) zijn de beroepen van de BRC 2014 beroepsklasse 06 (Openbaar bestuur, veiligheid en juridische beroepen). Bij deze beroepsklasse wordt de van het UWV onderzoek afgeleide voorwaarde als te streng beschouwd, zie ook de publicatie beroepen classificeren met data in online vacatures.

Volgtijdelijke vergelijkbaarheid

De gegevens zijn volgtijdelijk vergelijkbaar.

Beschrijving kwaliteitsstrategie

De aantallen ontstane vacatures per bedrijf of instelling worden gecontroleerd op plausibiliteit. Onjuiste koppelingen van vacatures aan bedrijven of instellingen worden gecorrigeerd als deze zouden leiden tot indeling bij een verkeerde bedrijfstak.