Auteur: Chantal Melser, Sven Meijs, Anouk de Rijk en Mark van der Loo

Online vacatures als nieuwe informatiebron voor vacatures in de VVT

Over deze publicatie

Het CBS heeft in opdracht van het ministerie van Volksgezondheid, Welzijn en Sport (VWS) onderzocht of via nieuwe databronnen en innovatieve methodes bruikbare informatie met betrekking tot de arbeidsmarkt beschikbaar kan komen. Het onderzoek richt zich op online vacatures voor de Verpleging, Verzorging en Thuiszorg (VVT).

Samenvatting

Het CBS heeft in opdracht van het ministerie van Volksgezondheid, Welzijn en Sport (VWS) onderzocht of via nieuwe databronnen en innovatieve methodes bruikbare informatie met betrekking tot de arbeidsmarkt beschikbaar kan komen. Het onderzoek richt zich op online vacatures voor de Verpleging, Verzorging en Thuiszorg (VVT).

De online vacatures zijn verkregen via webscraping (bron: Textkernel). Deze bron bevat veel nieuwe informatie met vele details. Ontstane vacatures kunnen naar subbranche en diverse regio’s worden ingedeeld. Ook bevat de bron nieuwe kenmerken van vacatures, zoals (zorg)beroepen, gevraagd opleidingsniveau en arbeidsvoorwaarden. Deze kenmerken zijn rechtstreeks overgenomen uit het bronbestand. De kwaliteit is niet nader onderzocht. De data biedt de mogelijkheid om ontwikkelingen in de tijd te monitoren en branches en beroepen met elkaar te vergelijken.

Naast meer detailinformatie, bevatten de online vacaturedata ook de volledige vacatureteksten. Met technieken op het gebied van textmining kan nieuwe informatie uit deze teksten worden gewonnen. Dit onderzoek richt zich op de mogelijkheden om informatie samen te stellen over gevraagde vaardigheden in de VVT. Deze vaardigheden kunnen gegroepeerd worden naar beroep en branche en bieden inzicht in verschillen. In dit onderzoek is een methode ontwikkeld om vaardigheden uit teksten te extraheren, met als referentiekader de ESCO-classificatie. In de methode is tevens ruimte voor het analyseren van teksten en tekstsegmenten waarbij geen directe koppeling met een bestaande classificatie gemaakt kan worden. De methode kan ook worden toegepast op vacatureteksten uit andere sectoren, op andere databronnen en met andere classificaties. Wanneer data over een langere periode beschikbaar komt, is het mogelijk om ontwikkelingen in de tijd te bekijken.

Het CBS doet verder onderzoek naar het gebruik van online vacaturedata voor reguliere statistiekproductie. Vooralsnog zijn mogelijkheden om versneld over vacatures te publiceren beperkt, omdat vanwege de benodigde weging van de resultaten moet worden aangesloten bij de bestaande CBS Kwartaalenquête Vacatures.

1. Inleiding

Het ministerie van Volksgezondheid, Welzijn en Sport (VWS) heeft het CBS gevraagd om aansluitend op lopend CBS-onderzoek te onderzoeken op welke innovatieve wijze andersoortige type data toegankelijk kunnen worden gemaakt voor beleid. Dit soort onderzoek biedt VWS een kans om te kijken op welke wijze andere databronnen in de toekomst de mogelijkheid bieden om de kennis te vergroten. Voor het huidige onderzoek ligt de focus op de arbeidsmarkt en de vacatures voor Verpleging, Verzorging en Thuiszorg (VVT).

Het CBS publiceert vanaf verslagjaar 1997 ieder kwartaal informatie over het aantal vacatures in Nederland en de vacaturegraad op basis van de Kwartaalenquête Vacatures. Het doel van deze statistiek is het samenstellen van gegevens over het aantal vacatures in Nederland. De doelpopulatie bestaat uit bedrijven en instellingen in Nederland met personeel. Bedrijven en instellingen worden hiervoor op basis van een steekproef benaderd. Het is van belang om te weten in welke bedrijfstakken en functies de spanning op de arbeidsmarkt het grootst is, en of de gevraagde vaardigheden aansluiten op de vaardigheden van mensen die nieuw op de arbeidsmarkt komen. Het CBS onderzoekt daarom naar nieuwe mogelijkheden om meer achtergrondinformatie over vacatures samen te stellen, met meer detail over bedrijfstakken, zonder de enquêtering bij bedrijven uit te breiden. Voor dit onderzoek wordt gebruik gemaakt van online vacatures die verzameld zijn door middel van webscraping.

Het huidige onderzoek bestaat uit twee delen. In het eerste deel wordt aan de hand van figuren beschreven welke beleidsmatig relevante informatie over vacatures in de VVT kan worden samengesteld op basis van deze nieuwe databron verzameld via webscraping en wat de meerwaarde en beperkingen zijn ten opzichte van de reguliere vacaturestatistieken. Het tweede deel bestaat uit een beschrijving van de mogelijkheden om aan de hand van innovatieve technieken een methode te ontwikkelen waarmee vaardigheden uit vacatureteksten kunnen worden geëxtraheerd.

De informatie uit dit onderzoek zou in de toekomst op reguliere basis kunnen worden opgenomen in AZW StatLine: de online databank van het onderzoeksprogramma Arbeidsmarkt Zorg en Welzijn.

2. Beleidsmatig relevante informatie op basis van online vacaturedata

2.1 Inleiding

In dit hoofdstuk beschrijven we aan de hand van figuren welke relevante informatie kan worden samengesteld over online gepubliceerde vacatures in de VVT-sector. De VVT-sector bestaat uit de subbranche Verpleging en verzorging en de subbranche Thuiszorg. Veel instellingen verzorgen beide activiteiten, maar zij worden slechts in één subbranche ingedeeld, op basis van hun hoofdactiviteit.1) Voor het onderzoek maken we gebruik van een databestand dat is samengesteld door Textkernel. Dit bestand bevat online gepubliceerde vacatures die verzameld zijn via webscraping. Textkernel doorzoekt het internet dagelijks op nieuwe vacatures in Nederland. Op deze wijze worden nieuw ontstane vacatures gevonden. Vacatures die op meerdere websites worden gepubliceerd, worden ontdubbeld2). Het CBS heeft het bestand verder bewerkt, gecorrigeerd en gewogen naar de vacature-enquête, zodat er één totaalcijfer is voor het aantal ontstane vacatures. Het bestand bevat diverse kenmerken van de vacatures, zoals het gevraagd opleidingsniveau en arbeidsvoorwaarden. In dit hoofdstuk geven we een overzicht van de informatie die op basis van de kenmerken van de vacatures kan worden samengesteld. Hierbij dient te worden opgemerkt dat de kenmerken rechtstreeks zijn overgenomen uit het bronbestand en dat de kwaliteit niet nader is onderzocht. Zie hoofdstuk 4.1 en 4.4 voor meer informatie over de bron, de bewerkingen die het CBS heeft uitgevoerd en de aandachtspunten.

Het zijn de nieuw ontstane vacatures in het bestand met online vacatures die we hier beschrijven. Bij veel dynamiek op de arbeidsmarkt ontstaan veel nieuwe vacatures. Dit kan, maar hoeft niet altijd te duiden op krapte of moeilijk vervulbare vacatures. De bestaande vacature-enquête van het CBS publiceert de nieuw ontstane vacatures, en ook de openstaande en moeilijk vervulbare vacatures. De vacature-enquête biedt echter niet de mogelijkheid om dieper in te zoomen op branches binnen de Gezondheids- en welzijnszorg.

Om praktische redenen is het onderzoek gebaseerd op een bestand met informatie over de periode vierde kwartaal 2017 tot en met vierde kwartaal 2018. Bij beschrijving van de VVT-vacatures hebben we doorgaans het cijfer van het verslagjaar 2018 genomen. Bij tijdreeksen hebben we alle beschikbare kwartalen opgenomen. Deze tijdsspanne van vijf kwartalen is veelal te kort om echte ontwikkelingen te zien. Het geeft wel een goed beeld van de mogelijkheden om kenmerken van vacatures te volgen in de tijd. Hierbij dient te worden opgemerkt dat de gebruikte data betrekking heeft op de periode voor de huidige coronacrisis. In welke mate deze crisis effect heeft op de aanstaande werving in de VVT is nu nog onbekend, en geheel nog niet zichtbaar in de cijfers over 2018.

Een nieuw databestand met cijfers tot en met eerste kwartaal 2020 is binnenkort beschikbaar, en publicatie van de eerste resultaten is voorzien in 2020. In paragraaf 2.7 gaan we dieper in mogelijkheden om zo recent mogelijk informatie samen te stellen.

2.2 Ontwikkeling vacatures in de VVT

Het aantal ontstane vacatures per kwartaal in de onderzoeksperiode ligt voor de VVT tussen de 9 880 en 11 610. Het hoogste aantal ligt in het eerste kwartaal van 2018, maar buiten de schommelingen is er in deze korte periode nog geen opvallende ontwikkeling te zien. In het vierde kwartaal van 2018 is er een lichte toename in het aantal ontstane vacatures ten opzichte van het jaar daarvóór.

1. Ontwikkeling vacatures VVT
JaarKwartaalVerpleging, verzorging en thuiszorgVerpleging en verzorgingThuiszorg
20174e kwartaal988069002980
20181e kwartaal1161083203290
20182e kwartaal 1063072603370
20183e kwartaal1135078003560
20184e kwartaal1064074003240
Bron: CBS, Textkernel

Voor een goede interpretatie van de cijfers is het interessant om te zien of de vacatures in de VVT zich anders ontwikkelen dan de vacatures over de gehele sector Gezondheids- en Welzijnszorg of over de gehele Nederlandse arbeidsmarkt.

De toename van 8 procent in de VVT tussen 2017 (vierde kwartaal) en 2018 (vierde kwartaal) komt in deze periode overeen met de ontwikkeling in de hele sector Gezondheids- en Welzijnszorg (8 procent), en ook met de ontwikkeling van vacatures van het totaal van alle sectoren (9 procent). Om sectoren van verschillende grootte met elkaar te vergelijken, gebruiken we indexcijfers.

2. Ontstane vacatures
JaarKwartaalAlle economische activiteiten (index (2017 4e kwartaal = 100))Gezondheids- en welzijnszorg (index (2017 4e kwartaal = 100))Verpleging, verzorging en thuiszorg (index (2017 4e kwartaal = 100))
20174e kwartaal100100100
20181e kwartaal110106118
20182e kwartaal121106108
20183e kwartaal117111115
20184e kwartaal109108108
Bron: CBS, Textkernel


Uit de vacature-enquête weten we dat er een regelmatig seizoenseffect is over alle economische activiteiten, met een piek in het aantal vacatures in het tweede kwartaal. In de Gezondheids- en welzijnszorg ligt het hoogste aantal vacatures in deze onderzoeksperiode in het derde kwartaal van 2018. Bekeken over meerdere jaren ligt het hoogste aantal vacatures in de Gezondheids- en welzijnszorg meestal in het eerste of tweede kwartaal van het jaar. Het verslagjaar 2018 lijkt hier dus een uitzondering te zijn (bron: vacature-enquête). In de online vacaturedata zien we voor de VVT dat in de onderzoeksperiode de meeste vacatures zijn ontstaan in het eerste kwartaal van 2018. Met een langere tijdreeks van een aantal jaren zullen we kunnen zien of de VVT structureel een eigen afwijkend seizoenseffect kent.

2.3 Beroepen

De online vacaturedata bevat informatie over de aangeboden functies (hierna zullen we vooral spreken over beroepen). Verreweg de meeste vacatures in de VVT werven voor verzorgenden. Zowel in de Verpleging en verzorging als in de Thuiszorg is dit het meest gevraagde beroep. Dat er veel vacatures zijn voor verzorgenden, komt ook omdat dit een zeer grote beroepsgroep is, met vele actieve werknemers.

3. Vacatures VVT naar beroepen, 2018
Beroepen 2018Verpleging en verzorging (x 1000)Thuiszorg (x 1000)
Verzorgenden11,64,79
Schoonmakers3,351,78
Verpleegkundigen (mbo)2,981,56
Gespecialiseerd verpleegkundigen1,531,25
Sociaal werkers, groeps-
en woonbegeleiders
1,710,82
Managers zorginstellingen0,720,25
Kelners en barpersoneel0,680,06
Keukenhulpen0,630,04
Artsen0,530,13
Fysiotherapeuten0,520,12
Maatschappelijk werkers0,150,08
Bron: CBS, Textkernel


Het beroep dat daarna binnen de VVT het meest wordt gezocht, is schoonmaker. Dat is een functie die niet uniek is voor de VVT of de zorg, maar in meerdere sectoren voorkomt. Dit is dus een beroepsgroep waarvoor de VVT concurreert met zowel andere zorgbranches als met sectoren buiten de zorg.

De overige veel voorkomende gevraagde beroepen zijn doorgaans cliëntgebonden functies voor verpleegkundigen, sociaal werkers, artsen en fysiotherapeuten. Veelvoorkomende gevraagde niet-cliëntgebonden functies zijn managers, barpersoneel en keukenhulpen.

Onderscheid tussen de Verpleging en verzorging en de Thuiszorg laten geen grote verschillen zien in de frequentie van de meest gevraagde beroepen.

Voor verdere figuren over beroepen in dit rapport worden de vijf meest gevraagde en beleidsmatig meest relevante beroepen geselecteerd.

Ontwikkelingen in de tijd

De data biedt de mogelijkheid om vacatures voor specifieke beroepen binnen de VVT te volgen in de tijd. We zien dat het aantal ontstane vacatures voor verzorgenden in de loop van 2018 wat afneemt. Vacatures voor verpleegkundigen (mbo) laten een lichte stijging zien.

4. Ontwikkeling vacatures VVT naar beroepen
   VerzorgendenVerpleegkundigen (mbo)SchoonmakersGespecialiseerd verpleegkundigenSociaal werkers, groeps- en woonbegeleidersMaatschappelijk werkers
20174e kwartaal38701030101067052060
20181e kwartaal46101130116068062060
20182e kwartaal40101070127061061060
20183e kwartaal41701160131079063060
20184e kwartaal36001170138069067060
Bron: CBS, Textkernel


Over deze korte tijdsperiode is nog niet te zeggen of dit structurele ontwikkelingen zijn, of dat dit normale fluctuaties van de aantallen zijn. Over een langere tijd gemeten zullen er wel ontwikkelingen te monitoren zijn.

Aantal vacatures per werknemers

Naar een grote beroepsgroep is vanzelfsprekend in absolute aantallen ook veel vraag. Dat er vele vacatures zijn voor verzorgenden, is daarom niet opmerkelijk. Om beroepsgroepen goed met elkaar te kunnen vergelijken, delen we het aantal ontstane vacatures (ook buiten de VVT) door het totaal aantal werknemers met dit beroep. Dit is een benadering van de vacaturegraad3).

5. Vacatures per werknemers naar beroepen, 2018
Beroepen 2018Vacatures per 1000 werknemers (vacatures / 1000 werknemers)
Alle werknemers158
Verzorgenden108
Verpleegkundigen (mbo)143
Gespecialiseerd verpleegkundigen96
Sociaal werkers, groeps- en woonbegeleiders96
Maatschappelijk werkers49
Bron: CBS, Textkernel


Opvallend is meteen dat voor alle werknemers in Nederland meer dan 150 vacatures ontstaan zijn per duizend werknemers in 2018 en dat dit hoger is dan de verschillende zorgberoepen. Het aantal ontstane vacatures voor verzorgenden binnen de VVT is in absolute aantallen hoog (figuur 3) omdat het een grote beroepsgroep is. Als de vacatures worden afgezet tegen het totaal aantal actieve werknemers is het minder opvallend hoog vergeleken met andere zorgberoepen of Nederland totaal. De verpleegkundigen (mbo) hebben in absoluut aantal veel minder vacatures binnen de VVT (figuur 3), maar in verhouding tot het totaal aantal werknemers zijn er meer nieuwe vacatures verschenen dan bij de verzorgenden.

2.4 Gevraagd opleidingsniveau4)

In de sector Zorg en Welzijn als geheel zijn er in verhouding wat meer vacatures op ho (hoger onderwijs: hbo of wo) niveau dan voor alle sectoren in Nederland. Dat ligt weer anders voor de VVT, waar de vacatures juist vaker vragen naar een vooropleiding op vmbo of mbo-niveau. De meeste vacatures binnen de VVT (figuur 3) zijn ook voor de functies van verzorgenden, schoonmakers en verpleegkundigen (mbo), dat zijn functies die geen ho-vooropleiding veronderstellen.

6. Vacatures naar opleidingsniveau, 2018
 vmbo (%)mbo (%)hbo (%)wo+ (%)
Alle economische activiteiten23943053513028242089110
Zorg en Welzijn13630845304062015870
VVT75402795072101410
Bron: CBS, Textkernel

Om te zien of het gevraagd opleidingsniveau verandert in de tijd, bekijken we deze per kwartaal.
7. Ontwikkeling vacatures VVT naar opleidingsniveau
jaarkwartaalvmbo (index (2017 4e kwartaal = 100))mbo (index (2017 4e kwartaal = 100))hbo (index (2017 4e kwartaal = 100))wo+ (index (2017 4e kwartaal = 100))
20174e kwartaal100100100100
20181e kwartaal115118117124
20182e kwartaal111105110128
20183e kwartaal113114117148
20184e kwartaal109102119160
Bron: CBS, Textkernel


Het meest opvallend is de toename van wo+-vacatures (universitair bachelor, master of postdoctoraal) in deze periode. In het vierde kwartaal van 2018 is het aantal wo+-vacatures ruim anderhalf keer zo groot als in dit kwartaal een jaar daarvoor. Deze grote toename van wo+-vacatures is te verklaren doordat het aandeel binnen de VVT zeer klein is (3 procent), waardoor kleine schommelingen in de aantallen direct een relatief groot effect laten zien5).

Opleidingsniveau per beroep

Het gevraagde opleidingsniveau kan binnen de vacatures voor een beroep verschillen. Voor verzorgenden wordt verreweg het meest naar een mbo-opleiding gevraagd, maar voor een aantal vacatures voor verzorgenden wordt een basisniveau van vmbo voldoende geacht, en een enkeling heeft hbo als gevraagde vooropleiding.

8. Vacatures VVT naar beroep en opleidingsniveau, 2018
Beroep 2018vmbo (%)mbo (%)hbo (%)wo+ (%)
Verzorgenden20301407029010
Schoonmakers40709306080
Verpleegkundigen (mbo)2036408800
Gespecialiseerd verpleegkundigen101500122040
Sociaal werkers, groeps- en woonbegeleiders300187030050
Maatschappelijk werkers030700
Bron: CBS, Textkernel

Wat ook in het oog springt is een zeer kleine maar opvallende groep van schoonmakers met een gewenst niveau van hoger onderwijs. De vacatures op wo-niveau hebben we specifiek bekeken. Deze vacatures blijken te werven voor standaard schoonmakers zonder verdere bijzonderheden, en dit zijn dus typeringsfouten in het bestand. Dit illustreert dat de uitkomsten met enige voorzichtigheid moeten worden geïnterpreteerd. Meer hierover in hoofdstuk 4.4.

2.5 Regionale verschillen

Het aantal vacatures in de VVT naar RegioPlus-arbeidsmarktregio (RA-regio)6) laat op een kaart zien dat zij vrijwel gelijkelijk over Nederland zijn verdeeld, met wat meer vacatures in druk bevolkte gebieden zoals de Randstad en wat minder vacatures in landelijke gebieden zoals Noord-Nederland en in de regio Zuid-Holland Zuid.

9. Vacatures VTT naar regio, 2018
 Vacatures
Utrecht en omgeving3510
Rijnmond2410
Haaglanden en Nieuwe Waterweg Noord2190
Zeeland2130
Amsterdam2120
Rijnstreek1920
Midden-Gelderland1830
West-Brabant1830
Zuidoost-Brabant1820
Stedendriehoek en Noord-Veluwe1750
Drenthe1660
Amstelland. Kennemerland en Meerl.1470
Noordoost-Brabant1250
Twente1240
Gooi- en Vechtstreek1130
Amersfoort en omgeving1090
Midden-Brabant1080
Achterhoek1040
Zuid-West Gelderland1040
Friesland1020
Zuid-Limburg1010
Groningen1010
Regio Zwolle990
Noord- en Midden-Limburg820
Noord-Holland Noord770
Flevoland700
Zuid-Holland Zuid420
Zaanstreek en Waterland280

Het kleine aantal vacatures in RA-regio Zaanstreek en Waterland is opvallend. Nader onderzoek wees uit dat een grote regionale aanbieder van VVT in die omgeving ontbreekt in de dataset7). Een verder onderscheid naar Verpleging en verzorging en Thuiszorg bleek inhoudelijk geen toegevoegde waarde te hebben.

Relatieve verschillen tussen regio’s

Voor een vergelijking van regio’s met elkaar, delen we het aantal ontstane vacatures van geheel 2018 door het aantal banen in de regio (stand 2018, vierde kwartaal). Relatief zijn er de meeste ontstane vacatures in de Gooi- en Vechtstreek, Zeeland, Utrecht en omgeving en Amsterdam. Opvallend laag is wederom Zaanstreek en Waterland.

Vacatures per 1 000 banen
 Vacatures per 1 000 banen
Groningen58,7
Drenthe100,6
Friesland45,9
Regio Zwolle79,2
Twente59,6
Stedendriehoek en Noord-Veluwe95,1
Achterhoek95,4
Zuid-West Gelderland69,8
Midden-Gelderland114,4
Flevoland64,8
Gooi- en Vechtstreek198,2
Utrecht en omgeving181,9
Amersfoort en omgeving143,4
Noord-Holland Noord49,0
Zaanstreek en Waterland33,3
Amsterdam173,8
Amstelland. Kennemerland en Meerl.94,8
Rijnstreek91,0
Rijnmond93,8
Haaglanden en Nieuwe Waterweg Noord84,2
Zuid-Holland Zuid46,2
Zeeland186,8
West-Brabant102,2
Midden-Brabant100,0
Noordoost-Brabant79,1
Zuidoost-Brabant103,4
Noord- en Midden-Limburg59,9
Zuid-Limburg63,1

2.6 Arbeidsvoorwaarden

Contracttype8) per branche

Uit de data over online vacatures blijkt dat de meeste vacatures direct een vast contract bieden. Voor alle economische sectoren van Nederland samen bedraagt dit 73 procent. In de Zorg en Welzijn en in de VVT bieden net meer dan 52 procent van de vacatures direct een vast contract. In de VVT en Zorg en Welzijn totaal is het aandeel van een tijdelijk contract dus hoger, al dan niet met uitzicht op een vaste baan.

11. Vacatures naar contracttype, 2018
contract_type_factorVast contract (%)Mogelijk vast contract (%)Tijdelijk contract (%)Bijbaan/ Detachering (%)
Alle economische activiteiten86030013200010026085340
Zorg en Welzijn7987044170287102250
VVT23530127806900950
Verpleging en verzorging1629088105060610
Thuiszorg728039901850350
Bron: CBS, Textkernel


Binnen de sector Zorg en Welzijn komen nul-urencontracten ook regelmatig voor: een medewerker krijgt een contract, maar het aantal uren per week van deze baan kan variëren. Een beperkt nader onderzoek wees uit dat deze nul-urencontracten in de meeste gevallen (50 procent) worden ingedeeld bij de vaste contracten, en dat een groot deel (30 procent) wordt ingedeeld bij de tijdelijke contracten. Een minderheid (elk 5 procent) wordt ingedeeld bij ‘mogelijk vast contract’ of ‘bijbaan’.

Vergelijking contracttype vacatures met actieve banen

Een tijdelijk contract met uitzicht op een vaste aanstelling komt vaker voor in vacatures dan in de actieve banen. Dat is ook logisch: een werknemer stroomt vaak in een baan in op een tijdelijke positie, met uitzicht op een vaste aanstelling. Na een tijdje wordt dit dan omgezet naar een vaste baan. Het is wel opvallend dat dit effect veel groter is in de VVT, dan in vergelijking met de totale arbeidsmarkt. Al zijn ook de meeste vacatures in de VVT voor een vaste aanstelling, de start is veel vaker tijdelijk in vergelijking met de totale arbeidsmarkt van Nederland.

12. Banen en vacatures naar contracttype, 2018
Positie in de werkkring x 1000, 2018Vast contract (%)Mogelijk vast contract (%)Tijdelijk contract (%)
Alle economische
activiteiten
Banen53520003840001586000
Vacatures860000132000186000
Verpleging en
verzorging
Banen1820001100037000
Vacatures1600090006000
Thuiszorg
Banen105000600023000
Vacatures700040002000
Bron: CBS, Textkernel


Net wat minder dan 20 procent van de banen in de VVT zijn tijdelijk, zonder uitzicht op een vast contract. Dit is zelfs wat minder dan gemiddeld voor Nederland totaal (meer dan 20 procent). Uitzendkrachten werkzaam in de VVT en vacatures voor uitzendkrachten in de VVT zijn tijdelijk, en worden niet meegerekend in de VVT zelf, omdat deze personen in dienst zijn of komen van het uitzendbureau. Deze tijdelijke banen en vacatures zijn meegeteld bij Nederland totaal.

Contracttype per beroep

Omdat de online vacaturedata zowel informatie over branches als beroepen bevat, kan voor specifieke beroepen bekeken worden of er verschillen zijn in de arbeidsvoorwaarden tussen branches binnen en buiten de zorg. In tabel 1 is te zien dat vacatures voor artsen doorgaans voor 60 procent een vaste aanstelling bieden op de gehele arbeidsmarkt, en dat de VVT hierin geen uitzondering is. Bij de vacatures voor artsen in UMC’s gaat het met 34 procent echter duidelijk minder vaak om een vast contract.

1. Vacatures artsen naar contracttype en branche, 2018
OnderwerpenAantal vacatures % Vacatures vast contract% Vacatures mogelijk vast contract% Vacatures tijdelijk contract% Vacatures bijbaan/detachering
Totaal Nederland11 7606018202
Zorg en Welzijn8 3505720231
Universitair Medisch Centra (UMC's)6503423430
Verpleging, Verzorging en Thuiszorg6606224122

Bron: CBS, Textkernel.



Deze vergelijking kan gemaakt worden voor vacatures van verschillende beroepen en voor verschillende branches.

Ontwikkeling contracttype

De aandelen van contracttypes in de tijd laten in deze relatief korte periode nog geen ontwikkeling zien.

13. Ontwikkeling vacatures VVT naar contracttype
contract_type_factorquarterVast contract (%)Mogelijk vast contract (%)Tijdelijk contract (%)Bijbaan/ Detachering (%)
20174e kwartaal50,231,516,81,5
20181e kwartaal52,028,716,42,9
20182e kwartaal53,127,116,73,0
20183e kwartaal54,528,715,31,4
20184e kwartaal53,631,214,01,2
Bron: CBS, Textkernel


Met het langer volgen van deze gegevens in de tijd kan een ontwikkeling wel gevolgd worden.

Dienstverband en beroep

De zorg staat bekend als een sector waarin veel in deeltijd wordt gewerkt. Binnen de vacatures voor beroepen in de zorg in het algemeen en binnen de VVT in het bijzonder zijn er wel verschillen. Waar de meest voorkomende beroepen in de VVT vooral werven voor een parttime aanstelling (minder dan 32 uur), ligt dat voor artsen in de VVT anders, zij krijgen vaker de optie om zelf te kiezen tussen fulltime of parttime. In de vacatures voor artsen is fulltime vaker gevraagd en vaker als mogelijke optie aanwezig.

14. Vacatures VVT naar beroepen en dienstverband, 2018
beroepen 2018Fulltime (>32 uur) (%)Fulltime / parttime (%)Parttime (%)
Verzorgenden513082010450
Schoonmakers20001203020
Verpleegkundigen (mbo)12004102930
Gespecialiseerd
verpleegkundigen
7602501760
Sociaal werkers, groeps-
en woonbegeleiders
7101001720
Maatschappelijk werkers6020150
Artsen260170230
Bron: CBS, Textkernel


Naast verschillen tussen de beroepen, is deze weergave ook mogelijk voor vacatures van verschillende branches voor een vergelijking met de sector Zorg en Welzijn als geheel en met de hele Nederlandse arbeidsmarkt. In de huidige rapportage is dit niet uitgewerkt.

Ontwikkeling dienstverband

De verdeling naar aangeboden dienstverband is in de tijd te volgen. Zo is te zien of nieuwe vacatures juist kleinere banen zijn, of dat het vaste contract (nog) vaker een optie wordt.

15. Ontwikkeling vacatures VVT naar dienstverband
   Fulltime (>32 uur) (%)Fulltime / Parttime (%)Parttime (%)
20174e kwartaal28,67,264,2
20181e kwartaal31,26,362,4
20182e kwartaal34,07,158,8
20183e kwartaal34,17,158,8
20184e kwartaal34,66,558,9
Bron: CBS, Textkernel

2.7 Meerwaarde en toekomstmogelijkheden

In dit hoofdstuk hebben we beschreven welke informatie potentieel uit de online vacaturedata gehaald kan worden. In deze paragraaf beschrijven we wat de meerwaarde is en wat de beperkingen zijn ten opzichte van de huidige bron voor vacatures: de vacature-enquête. Ook gaan we in op de vraag wat voor mogelijkheden deze bron in de toekomst geeft.

Meer details branche

De meerwaarde van het gebruik van de online vacature-data, is dat het mogelijk is om dieper in te zoomen op branches. De vacature-enquête van het CBS heeft binnen de sector Gezondheids- en welzijnszorg niet voldoende waarnemingen om voor branches apart de ontwikkeling te volgen en beperkt zich tot de gehele sector Gezondheids- en welzijnszorg. Ontwikkelingen van andere zorgbranches dan de VVT kunnen ook gevolgd worden via online vacatures, maar zijn nu niet opgenomen in dit rapport.

Meer details regio

De bestaande vacature-enquête publiceert uitkomsten op provinciaal niveau. Deze nieuwe bron van online vacatures levert meer regionaal detail. Deze eerste uitkomsten zijn gepubliceerd naar RegioPlus-arbeidsmarktregio’s, dit sluit beter aan op het regionale beleid van de arbeidsmarkt in de Zorg en Welzijn.

De regionale indeling is nu nog niet gewogen naar de vacature-enquête. De twee bronnen verschillen nog van elkaar in regionale cijfers. Het is gewenst dat deze beter op elkaar aansluiten en dat ook de regionale details van de online vacatures gebruikt kunnen worden. In 2020 onderzoekt het CBS of de regionale weging kan worden verbeterd, zodat cijfers op lagere regionale niveaus gepubliceerd kunnen worden.

Regionale cijfers zijn met meer detail en voor specifieke kenmerken te maken. Het aantal vacatures per regio is ook te geven voor specifieke beroepen of ten opzichte van het aantal banen van dat beroep in die regio. De cijfers van de banen naar beroep en naar regio (gebaseerd op een steekproef) zijn op dit moment niet direct beschikbaar maar zouden aanvullend berekend kunnen worden (voorwaarde is voldoende celvulling).

Nieuwe kenmerken van vacatures

De in dit rapport beschreven kenmerken en ontwikkelingen van deze kenmerken zijn per branche en per beroep weer te geven en te vergelijken met de hele sector Gezondheids- en welzijnszorg en de hele Nederlandse arbeidsmarkt. Deze informatie is niet beschikbaar vanuit de vacature-enquête. Ook is het mogelijk om ontwikkelingen door de tijd te volgen. Er zijn gegevens over beroepen, gevraagd opleidingsniveau en arbeidsvoorwaarden. Deze kenmerken zijn in dit onderzoek overgenomen uit het bronbestand. De kwaliteit van deze nieuwe onderwerpen is nog niet nader onderzocht.

Vacatures binnen een sector naar beroep zijn nog niet eerder gepubliceerd op dit detailniveau door het CBS. Deze nieuwe databron geeft daarom meer inzicht in de arbeidsmarkt voor de verschillende beroepen. Hier zijn deze beroepen geanalyseerd binnen de VVT, maar deze kunnen ook binnen andere branches of sectoren worden getoond. Ook het publiceren van relatieve cijfers over het aantal vacatures per werknemers naar verschillende beroepen is nieuw ten opzichte van de vacature-enquête. De vacature-enquête publiceert immers geen vacatures per beroep, en de combinatie van vacatures en werknemers kon daardoor nog niet eerder gemaakt worden. Dit kan nu ook gemaakt worden voor vacatures van de verschillende branches, of naar andere beroepen dan die hier geselecteerd zijn9).

Naast de beroepen bevat het bestand met online vacatures informatie over het gevraagde opleidingsniveau en de aangeboden arbeidsvoorwaarden (contract, dienstverband). Ook dit is nieuw, en zijn in dit rapport voor het eerst gepresenteerd.

De online vacaturedata bevat ook informatie over regelmatige of onregelmatige werktijden. Dit is een kenmerk dat ongetwijfeld sterk samenhangt met de beroepsgroep. Analyses kunnen hiervoor gedaan worden naar beroepsgroep en voor specifieke zorgbranches. Ten slotte bevat de data ook informatie over het medium waarop de vacature is gepubliceerd, waarbij er slechts twee voorkomen bij de online vacatures: instellingssite en jobsite. Vacatures worden vaak gepubliceerd op de website van de instelling zelf, dit komt het meest voor. Grotere organisaties kunnen ook een aparte website hebben ingericht waarop alle vacatures worden aangeboden, dat is een zogenaamde jobsite.

Openstaande en moeilijk vervulbare vacatures

De vacaturecijfers in dit rapport gaan over de nieuw ontstane vacatures. Wat nog niet beschikbaar is vanuit de online vacaturedata, zijn de openstaande vacatures en de moeilijk vervulbare vacatures.

Er wordt aanvullend onderzocht door het CBS of ook de openstaande vacatures af te leiden zijn. Dit is veelgevraagde informatie, omdat deze duidelijker aangeeft wat de werkelijke, actuele vraag naar werknemers is. Daarmee is bijvoorbeeld de vacaturegraad te berekenen zoals deze elders in het CBS wordt gebruikt, en daarmee worden de uitkomsten vergelijkbaar met overige vacaturedata van andere sectoren. Hier wordt in 2020 aan gewerkt.

Actuele arbeidsmarktinformatie

Hoewel de verslagperiode waarover we op dit moment publiceren nog beperkt is, geven de online vacatures in de nabije toekomst wel uitzicht op publicatie over een recentere periode. Het CBS onderzoekt op dit moment eerst de robuustheid van de gebruikte bewerkingen zodat reguliere productie van kwartaalstatistieken mogelijk wordt. Dit is nog nodig om in te schatten hoeveel van het handmatige werk in het onderzoek nu volledig of grotendeels geautomatiseerd kan worden. Deze oefening zal in eerste instantie het bronbestand aanvullen met vacatures tot en met eerste kwartaal 2020. Publicatie van deze cijfers voor de zorgbranches is voorzien voor 2020. Als dit onderzoek positief wordt afgerond, kan dit de basis worden voor reguliere vacaturestatistieken van het CBS.

Het bestand met online vacatures is eerder beschikbaar dan de enquêtedata, want online is er geen vertraging. De huidige ontwikkelde methode gebruikt weegfactoren per kwartaal uit de vacature-enquête. Dat is de reden waardoor de cijfers van ontstane vacatures nog niet eerder gepubliceerd kunnen worden dan ná de vacature-enquête. De vacature-enquête publiceert doorgaans anderhalve maand na afloop van een kwartaal. Wellicht kan het CBS op termijn actuele (maandcijfers, of ‘real-time’) voorlopige cijfers publiceren over ontstane vacatures op basis van voorlopige gewichten, zonder dat de uitkomsten van de vacature-enquête afgewacht hoeven te worden. Als de weegfactoren naar sector, beroepsniveau en kwartaal stabiel genoeg blijken, dan zijn deze wellicht te extrapoleren naar toekomstige perioden voor een of meerdere sectoren, al dan niet voor onderliggende branches. Om de stabiliteit van deze weegfactoren over de tijd te analyseren is een langere periode aan data nodig.

1) Zie hiervoor ook hoofdstuk 4.4.
2) Textkernel heeft de duplicaten aan het CBS beschikbaar gesteld en het CBS heeft de kwaliteit van het ontdubbelen beknopt getoetst. Dit gaf geen aanleiding tot twijfel aan de methode van ontdubbeling.
3) De reguliere vacaturegraad wordt berekend op basis van het aantal openstaande vacatures per aantal werknemers. In dit onderzoek gaan we altijd uit van het aantal ontstane vacatures.
4) Het gevraagde opleidingsniveau is rechtstreeks overgenomen uit het bestand met online vacatures. Zie ook hoofdstuk 2.7 en 4.4.
5) Dit zou ook nog te wijten kunnen zijn aan incidentele verkeerde typeringen in de kleine groep van wo+-vacatures. Deze vacatures zouden in detail bekeken kunnen worden om na te gaan of het om specifieke beroepen gaat, en of er dus inderdaad iets opvallends aan de hand is. Zie hiervoor hoofdstuk 4.4.
6) De RegioPlus-arbeidsmarktregio is een indeling van waaruit regionale werkgeversorganisaties, verenigd in het samenwerkingsverband RegioPlus, zich inzetten voor het behouden en aantrekken van voldoende en goed gekwalificeerd personeel in Zorg en Welzijn. Deze indeling wordt gebruikt binnen het AZW programma.
7) Een grote regionale aanbieder van VVT-vacatures is niet online opgemerkt, en onterecht niet opgenomen in de dataset. Meer hierover in hoofdstuk 4.4.
8) Het contracttype is rechtstreeks overgenomen uit het bestand met online vacatures. Zie ook hoofdstuk 2.7 en 4.4.
9) Het UWV publiceert ook een krapte-indicator voor de arbeidsmarkt. Dat is een andere variabele dan die hier gepubliceerd wordt. Deze krapte-indicator van het UWV gaat uit van het direct beschikbare aanbod van personen (recente WW-uitkering) voor de gezochte functies.

3. Vacatureteksten analyseren met behulp van textmining

3.1 Inleiding

In het vorige hoofdstuk is beschreven welke beleidsmatig relevante informatie uit de online vacature data kan worden afgeleid. Naast kenmerken over vacatures, bevat de online vacaturedata de volledige vacatureteksten. Deze teksten zijn ook een bron van data en bevatten veel informatie over gevraagde vaardigheden. Dit biedt mogelijkheden voor aanvullende, meer verdiepende analyses. Voor dit onderzoek hebben we gebruik gemaakt van textmining analyses. Textmining omvat het inzetten van ICT-technieken om grote hoeveelheden teksten te analyseren en hieruit waardevolle informatie te extraheren.

In dit hoofdstuk beschrijven we de methode die we hebben ontwikkeld om vaardigheden uit vacatureteksten te extraheren en welke informatie dit kan opleveren.

3.2 Databewerking en dataverkenning

Voor dit deel van het onderzoek is een bestand samengesteld bestaande uit de volledige teksten van de online vacatures (mits beschikbaar) voor de hoofdbranche “Verpleging, Verzorging en Thuiszorg”. Uit deze volledige vacatureteksten zijn alleen de gedeelten meegenomen die betrekking hebben op het profiel van de toekomstige kandidaat; informatie over de werkgever en sollicitatieprocedure is uitgesloten. De extractie van het kandidaatprofiel uit de volledig vacaturetekst is uitgevoerd door Textkernel en door het CBS overgenomen. Hierna kortweg benoemd als ‘de vacatureteksten’. Ook hier heeft de data betrekking op de periode vierde kwartaal 2017 tot en met vierde kwartaal 2018. Dat levert voor de analyse in totaal 39 734 vacatureteksten op bestaande uit 4 087 138 woorden.

De vacatureteksten zijn in deze vorm nog niet geschikt voor analysedoeleinden. Om analyses uit te kunnen voeren, moet de data eerst bewerkt worden en brengen we zo veel mogelijk structuur aan. De eerste stap is om de teksten zo basaal mogelijk neer te zetten zodat ze een ‘corpus’ vormen: een bibliotheek van teksten, inclusief de set aan variabelen (kenmerken) van de vacatures. Dit zijn de kenmerken die in het vorige hoofdstuk zijn besproken en die gebruikt kunnen worden voor nadere analyses. De volgende bewerking van de teksten bestaat uit het identificeren van afzonderlijke woorden (tokenization) en het verwijderen van standaard stopwoorden (waaronder bijvoorbeeld lidwoorden, persoonlijk voornaamwoorden). Zo valt de zin “dit is een vacaturetekst” uiteen in de woorden dit, is, een en vacaturetekst. De woorden dit en een worden vervolgens aangemerkt als stopwoorden en worden verwijderd voorafgaand aan het uitvoeren van verdere analyses. Het resulterende bestand vormt de basis voor de verdere dataverkenning en analyses.

Dataverkenning met behulp van wordclouds

Als eerste stap in de verkenning van de vacatureteksten hebben we een wordcloud gemaakt op basis van het ‘corpus’. De wordcloud geeft een visuele indruk van de meest voorkomende woorden in de vacatureteksten en geeft een goede eerste indruk van opvallende zaken. Hoe groter het woord, hoe vaker het in de teksten voorkomt.

 

In deze eerste analyse vallen woorden als bent, hebt en kunt op. Ook zijn deels al vaardigheden te onderscheiden (bv zelfstandig, flexibel). Veel woorden zijn echter nog minder relevant (bv zorg, staat, goede, wij).

Voor verdere analyse zijn specifieke stopwoorden en werkwoorden geïdentificeerd via een handmatige controle van de vijftienhonderd meest voorkomende woorden. Na identificatie van deze woorden kunnen zij naar wens uitgesloten worden bij verdere analyses. Er zijn 256 werkwoorden aangemerkt (handmatig), 534 stopwoorden (handmatig) en 101 stopwoorden (default). Voorbeelden hiervan zijn: resterende persoonlijke voornaamwoorden, beroep (arts is geen vaardigheid), branche (zorgtype of branche zijn overige kenmerken van de vacature), gevraagd diploma (diploma of registratie is geen vaardigheid), Engelse termen, verkleinwoorden of versterkende woorden (bv goede. Dit voegt inhoudelijk niks toe). Ook hele werkwoorden en directe vervoegingen daarvan (zoals ondernemen en onderneem) worden verwijderd, omdat deze niet verwijzen naar vaardigheden. De werkwoordsvorm ondernemend is in de teksten ongemoeid gelaten, dit verwijst immers wel naar een persoonlijke vaardigheid. De wordcloud na tekstbewerking geeft al wat meer inzicht in gevraagde vaardigheden.

Door deze bewerkingen zijn het meer de persoonlijke eigenschappen en vaardigheden die het meest voorkomen en opvallen.

Keywords in context

Een andere methode voor verkenning van de data is om te kijken naar “keywords-in-context” (KWIC). Daarvoor geef je een zogenaamd keyword op, bijvoorbeeld de meest voorkomende woorden in de eerste wordcloud als bent, hebt en kunt. Dan kijk je naar de twintig woorden die in de zin voorkomen ná dit woord1). De twintig woorden vóór deze keywords bleken minder relevant. De twintig woorden ná de werkwoorden bent, hebt en kunt in de teksten benaderden het best de vaardigheden in de vacatures. Dit is toegepast op de basistekst (het ‘corpus’), waarin de werkwoorden en de meest voorkomende woorden nog aanwezig waren. Van deze verzameling van twintig woorden ná bent, hebt en kunt is opnieuw een wordcloud gemaakt.

Woorden in deze wordcloud komen sterk overeen met de woorden in figuur 17 (wordcloud op de basisteksten zonder stopwoorden en werkwoorden) en geven daarmee wederom een eerst inzicht in gevraagde vaardigheden. We zien dat de analyse met KWIC kwalitatief de bevindingen uit de eerdere wordclouds bevestigt.

Frequentietellingen

Naast een visuele analyse en weergave van de teksten met behulp van wordclouds, kunnen ook frequentietellingen van vaardigheden in de teksten worden samengesteld.

Het woord flexibel bijvoorbeeld, komt voor in 34 procent van de vacatures voor. In de thuiszorgvacatures wordt bij bijna 20 procent werkervaring gevraagd, bij de subbranche verpleging en verzorging is dit ruim 15 procent2).

Gegroepeerde analyses

Een andere manier om meer inzicht te krijgen in gevraagde vaardigheden, is door de vacatureteksten in groepen in te delen en wordclouds of frequentietellingen voor specifieke groepen samen te stellen. De vacatureteksten kunnen bijvoorbeeld ingedeeld worden naar beroep of functie, gevraagd opleidingsniveau of branche. Onderstaande wordcloud laat het verschil3) zien tussen enerzijds vacatures voor de beroepen verzorgenden (groen) en anderzijds vacatures voor gespecialiseerd verpleegkundigen (blauw).

In vacatures voor verpleegkundigen wordt vaker gevraagd om een rijbewijs en (werk)ervaring. Ook woorden als complexe en specialist komen vaker terug in vacatures voor verpleegkundigen. In vacatures voor verzorgenden komen woorden als cliënt(en), flexibel(e), houding en collega’s vaker terug. Er is inhoudelijke kennis nodig van beide beroepsgroepen en werkzaamheden om hier nadere duiding aan te geven, maar de dominante woorden wijzen wel op duidelijke verschillen tussen beide beroepen/functies.

Zo is het mogelijk om de meest gevraagde vaardigheden te splitsen naar functie, maar ook naar opleidingsniveau. De vaardigheden in vacatures kunnen ook per functie (bijvoorbeeld verpleegkundigen) worden uitgesplitst naar mbo-niveau of hbo-niveau en zo met elkaar worden vergeleken.

3.3 Classificeren van vaardigheden

Er zijn diverse mogelijkheden om meer duiding aan de vaardigheden in vacatureteksten te kunnen geven. Met behulp van technieken van textmining kunnen vooral de woorden met hun inhoudelijke betekenis centraal worden gesteld. Via machine learning is het mogelijk om na te gaan of patronen in woordgebruiken automatisch herkend kunnen worden. We hebben ervoor gekozen om verder te gaan met textmining technieken, omdat daarmee naar verwachting de maximale informatie uit de dataset kan worden gehaald

Voor betere duiding en nadere analyses is gezocht naar een manier om vaardigheden te classificeren. Vaardigheden die op een andere manier worden omschreven, kunnen hetzelfde betekenen of anderszins vergelijkbaar zijn. Zij behoren, met andere woorden, tot hetzelfde domein. Een voorbeeld: ‘je bent empathisch’ en ‘je hebt een groot inlevingsvermogen’. Deze eigenschappen behoren tot hetzelfde domein. Om deze vaardigheden te kunnen groeperen is een classificatie nodig waarbij woorden met dezelfde betekenis bij elkaar worden gevoegd.

Voor dit onderzoek maken we gebruik van een bestaande classificatie, namelijk de European Skills, Competences, Qualifications and Occupations (ESCO) classificatie.

ESCO-classificatie

De ESCO is een meertalige Europese classificatie van vaardigheden, competenties, kwalificaties en beroepen. De ESCO is gericht op de Europese arbeidsmarkt en de onderwijs- en opleidingssector en geeft een systematisch overzicht van de relaties tussen de verschillende concepten. Bij deze analyse hebben wij gebruik gemaakt van de Nederlandse versie van de ESCO classificatie van vaardigheden (https://ec.europa.eu/esco/portal/skill). De ESCO omvat ruim dertienduizend vaardigheden verdeeld over de hoofdgroepen ‘attitudes en waarden’, ‘kennis’, ‘taalvaardigheden en taalkennis’ en ‘vaardigheden’. Hierbinnen zijn weer verschillende onderwerpen te onderscheiden zoals ‘ICT vaardigheden’ en ‘transversale vaardigheden4)’. Tenslotte kan iedere vaardigheid meerdere omschrijvingen of labels kennen. Zo heeft de vaardigheid moeite doen een alternatief label in de vorm van inspanningen leveren; beide labels komen uit bij dezelfde skills.

Omdat we voor de analysedoeleinden om praktische en inhoudelijke redenen voor dit onderzoek slechts gebruik maken van een selectie van vaardigheden uit de ESCO-classificatie, gebruiken we op dit moment minder dan duizend vaardigheden, uit de meer dan dertien duizend gelabelde vaardigheden uit de ESCO-classificatie.

Koppelen van de vacatureteksten aan de classificatie

Om gebruik te kunnen maken van de ESCO-classificatie, moeten de vaardigheden in de vacatureteksten gematched worden aan de termen uit de classificatie. Hiervoor is gebruik gemaakt van de methode moving window en een cosine distance: de ESCO-vaardigheid wordt positie voor positie vergeleken met de vacaturetekst en berekent iedere keer de gelijkenis5). Op deze manier wordt in elke vacaturetekst het deel gevonden dat het meest lijkt op een gekozen ESCO-vaardigheid. Bovendien is er een maat, tussen nul en één, die zegt hoeveel het gevonden deel afwijkt van de ESCO-vaardigheid. Om te bepalen of er een voldoende match is met een ESCO-vaardigheid, worden er grenswaardes bepaald. Deze kunnen per domein verschillen.

Een andere methode om vaardigheden uit de ESCO-classificatie te koppelen aan de vacatureteksten, is een zoekfunctie met inachtneming van de Levenshteindistance. Met deze methode wordt gekeken hoeveel letters/karakters minimaal gewijzigd moeten worden (ingevoegd, verwijderd, vervangen) om woorden gelijk te maken aan elkaar. Woorden hoeven niet exact overeen te komen, maar moeten ook niet té verschillend van elkaar zijn (fuzzy matching). Bij te weinig flexibiliteit van de koppeling zijn er te weinig overeenkomsten te vinden. Als er te veel wijzigingen worden toegestaan, worden ook koppelingen gelegd tussen woorden die niet dezelfde betekenis hebben. Er wordt dan vaker niet correct gekoppeld dan wel. Deze methode bleek echter niet goed bruikbaar voor dit onderzoek. Er waren óf onvoldoende koppelingen in de gehele dataset, óf te veel koppelingen die niet correct bleken. Daarom is gekozen voor de moving window.

3.4 Belangrijkste resultaten gekoppelde vaardigheden

In totaal konden 36 procent van de vacatureteksten gematched worden aan minimaal één transversale of ICT-vaardigheid uit de ESCO-classificatie indeling.

Zelfstandig werken is veruit de meest gevonden vaardigheid in de vacatureteksten. Deze vaardigheid kwam al duidelijk naar voren in de dataverkenning (figuur 17 en 18). Enthousiasme tonen was eerder ook al terug te vinden in deze wordcloud. Na koppeling met de ESCO-classificatie behoren ook doorzetten en anderen motiveren tot de meest gekoppelde vaardigheden. Anderzijds hebben een aantal prominente woorden uit de wordclouds, zoals communicatief en stressbestendig, niet geleid tot een koppeling met een ESCO-vaardigheid. Dit kan het gevolg zijn van een te strenge grenswaarde voor deze begrippen. In eventueel vervolgonderzoek kunnen de grenswaarde en de (woorden in de) vaardigheid beter op elkaar afgestemd worden.

De ESCO-classificatie bestaat uit verschillende domeinen. Voor dit onderzoek gaan we hierna dieper in op zogenaamde transversale vaardigheden en ICT-vaardigheden.

Transversale vaardigheden

Transversale vaardigheden zijn vaardigheden die voor vrijwel ieder beroep relevant zijn. De vaardigheden zijn vrijwel nooit aan een opleiding gebonden en gaan in op persoonlijke eigenschappen. Voorbeelden van transversale vaardigheden zijn: enthousiasme tonen, werken in teams, informatie opzoeken, nieuwsgierigheid tonen en feedback accepteren.

Transversale vaardigheden worden vaak aan de hand van algemene begrippen omschreven. De vaardigheden vindt men eerder terug in tekstgedeeltes dan in specifieke woorden. Daarom is op basis van een steekproef van aselecte getrokken teksten en vaardigheden besloten de grenswaarde voor een match met transversale vaardigheden op 0.35 te zetten6). Via deze methode is in 34 procent van de vacatureteksten minimaal één transversale vaardigheid gevonden.

De geclassificeerde vaardigheden zijn afzonderlijk te analyseren, maar kunnen ook groepsgewijs bekeken worden. Eveneens is het mogelijk een vergelijking te maken met overige kenmerken van vacatures. Zo is het bijvoorbeeld mogelijk in beeld te brengen welke transversale vaardigheden het meeste voorkomen in de vacatureteksten voor verpleegkundigen en verzorgden of in de VVT in vergelijking met de overige zorg en welzijn.

20. Meest gevraagde ESCO vaardigheden vacatures VVT, 2018
Vaardigheidaandeel in VVT-vacatures (%)
zelfstandig werken15,3
enthousiast zijn6
doorzetten3,9
anderen motiveren2,8
beslissingen nemen2,3
Bron: CBS, Textkernel

ICT-vaardigheden

Er is binnen de zorg steeds meer aandacht voor ICT-oplossingen en E-health toepassingen. Het gebruik daarvan vereist wellicht meer ICT-vaardigheden in de zorg dan in het verleden. Het ligt daarom voor de hand dat ICT-vaardigheden ook steeds meer gevraagd worden in vacatures, ook in de VVT-sector.

Uit de analyse van de gevraagde vaardigheden komt naar voren dat ICT-vaardigheden nog niet dominant voorkomen in de VVT. Maar zij worden - net zoals in alle andere sectoren - wel steeds belangrijker.

Op basis van een steekproef van aselecte getrokken teksten en vaardigheden is besloten de grenswaarde voor ICT-vaardigheden op 0.4 te zetten. Dit omdat naar verwachting niet heel specifieke ICT-kennis en kunde zal worden gevraagd. Deze grenswaarde geeft een goede indicatie of sprake is van een ICT-vaardigheid uit het ESCO-domein.

De ESCO-vaardigheid computers programmeren koppelde het vaakst met zinsdelen als ‘om kunnen gaan met computerprogramma’s’. Om deze reden is besloten de ICT-vaardigheden uit de ESCO niet afzonderlijk, maar gegroepeerd te behandelen. Indien er een match is met één van de ICT-vaardigheden wordt het domein ICT-vaardigheden toegewezen aan de vacature.

In bijna 2 procent van de vacatures in de VVT wordt om enige ICT-vaardigheid gevraagd.

21. Beroepen met hoogste aandeel ICT-vaardigheden (VVT), 2018
BRCaandeel ICT-vaardigheden in beroep (%)
Software- en applicatieontwikkelaars18,4
Technici bouwkunde en natuur18,2
Meubelmakers, kleermakers en stoffeerders16,7
Verkoopmedewerkers detailhandel14,1
Elektriciens en elektronicamonteurs12,5
Laboranten12,5
Bron: CBS, Textkernel

Binnen de vacatures in de VVT waarin het vaakst wordt gevraagd naar ICT-vaardigheden, gaat het uitsluitend om vacatures voor niet-cliëntgebonden beroepen. Dit geldt vooral voor vacatures voor ‘Software- en applicatieontwikkelaars’. Het aandeel vacatures voor Software- en applicatieontwikkelaars’ waarin gevraagd wordt naar ICT-vaardigheden is met nog geen 20 procent wel lager dan je zou verwachten. Mogelijk bevat deze groep enkele classificatiefouten of worden voor deze beroepen dusdanig specifieke ICT-vaardigheden gevraagd dat deze nog niet in de ESCO-classificatie voorkomen.

Cliëntgebonden beroepen in de VVT komen niet terug in de bovenstaande figuur met vraag naar ICT-vaardigheden. Op basis van de data kunnen we wel bekijken of de vraag naar ICT-vaardigheden toeneemt in de VVT in de periode eerste kwartaal 2017 tot en met eerste kwartaal 2018.

22. Ontwikkeling gevraagde ICT-vaardigheden VVT vacatures
jaarkwartaalaandeel in VVT-vacatures (%)
20174e kwartaal1,56
20181e kwartaal1,68
20182e kwartaal1,56
20183e kwartaal1,98
20184e kwartaal2,53
Bron: CBS, Textkernel

Alhoewel het aandeel vacatures met een vraag naar ICT-vaardigheden laag blijft, is er wel een duidelijke stijging zichtbaar in vraag naar ICT-vaardigheden. Op termijn kan bezien worden of deze trend zich doorzet.

3.5 Vacatureteksten zonder match met ESCO-classificatie

Op basis van de beschreven methode kon aan 64 procent van de vacatureteksten geen ESCO-vaardigheid gekoppeld worden. Ook in vacatureteksten waar wel één of meerdere vaardigheden aan toegewezen worden, blijven er gedeeltes van de tekst over die niet koppelden met een vaardigheid uit de ESCO7).

Bij het gebruik van een bestaande classificatie is het belangrijk om de vacatureteksten die niet gekoppeld worden aan de classificatie in detail te bekijken. Het is – op enkele uitzonderingen na – onwaarschijnlijk dat er geen vaardigheid voorkomt in een vacaturetekst. Het analyseren van deze teksten helpt dan bij het verbeteren van de gehanteerde methodes voor textmining. Ten tweede kunnen er vaardigheden in vacatureteksten staan die nog niet zijn opgenomen in een classificatie. Juist deze vaardigheden zijn interessant, omdat ze kunnen wijzen op nieuwe ontwikkelingen over de arbeidsmarkt.

Een globale analyse van de vacatureteksten zonder koppeling met een ESCO-vaardigheid levert de volgende wordcloud op. Stop- en werkwoorden zijn conform eerdere figuren verwijderd.

Deze wordcloud laat een patroon zien dat sterk lijkt op de wordclouds uit de verkennende analyse van alle VVT-vacatureteksten. De wordcloud toont ook een aantal nieuwe woorden, zoals initiatiefrijk, taal en talen. Dit kan duiden op nieuwe domeinen uit de ESCO-classificatie die extra aandacht behoeven, zoals het domein Taal.

Als gevolg van de methode moving window worden delen van de vacatureteksten niet gebruikt. Deze segmenten kunnen nader geanalyseerd worden. In deze wordcloud (figuur 24) zijn het dezelfde woorden die prominent naar voren komen. Nieuwe woorden in de wordcloud zijn geduldig, tact en passie.

Met de huidige gehanteerde grenswaarden lijken er begrippen onterecht niet aan een ESCO-vaardigheid toegeschreven te worden. Het patroon wijst er verder op dat de niet-gekoppelde vacatures door de dataset verspreid zitten. Dit zou dus niet moeten leiden tot een over- of ondervertegenwoordiging van specifieke groepen. Het is aan te raden om bij vervolgonderzoek de grenswaarden aan te scherpen en te laten verschillen voor de verschillende vaardigheden. Eveneens is het aan te raden meer ESCO-domeinen te betrekken.

3.6 Meerwaarde en toekomstmogelijkheden

Vacatureteksten bevatten veel informatie over gevraagde vaardigheden in de Verpleging, Verzorging en Thuiszorg. Textmining biedt mogelijkheden om die informatie uit de data te halen. De in dit onderzoek gehanteerde methode geeft inzicht in de mogelijkheden, maar is slechts een van vele wegen die bewandeld kunnen worden en biedt ruimte voor verbetering.

Voor dit rapport is een methode ontwikkeld om vaardigheden uit teksten te extraheren, met als referentiekader de ESCO-classificatie. In de methode is tevens ruimte voor het analyseren van teksten en tekstsegmenten waarbij geen directe koppeling met een bestaande classificatie gemaakt kan worden.

De beschreven methode kent een aantal aandachtspunten. Aan een groot deel van de vacatureteksten kon op dit moment geen vaardigheid uit de ESCO-classificatie worden gekoppeld. Uit de analyse van de niet-gekoppelde teksten en tekstsegmenten kwam naar voren dat het patroon met dominante woorden nauwelijks verandert ten opzichte van de gekoppelde teksten. Het koppelen van alle domeinen uit de ESCO-classificatie zou tot een verbetering moeten leiden. Ook het aanscherpen van de gehanteerde drempelwaardes voor iedere individuele vaardigheid of een klein cluster van vaardigheden zal tot verbeteringen leiden.

Voordeel van de methode is dat het laagdrempelig in gebruik is en eenvoudig kan worden toegepast op meer recente vacatureteksten voor de VVT, vacatureteksten uit andere sectoren, op andere databronnen en met andere classificaties. Voldoende rekenkracht en opslagruimte is hierbij wel steeds een randvoorwaarde.

1) Het is mogelijk dat één of meerdere keywords volgen binnen 20 woorden van een ander keyword; bijvoorbeeld “je hebt een goede werkhouding en bent flexibel inzetbaar”. In dit geval worden beide woorden en intervallen meegenomen en kan er overlap ontstaan met dubbeltellingen (in dit voorbeeld: flexibele en inzetbaar) van woorden tot gevolg.
2) Deze percentages zijn gebaseerd op de ongewogen aantallen. Voor een juiste representatie en aansluiting bij de overige cijfers en figuren uit dit rapport zou dit nog moeten worden bijgewerkt naar de gewogen aantallen.
3) Voor dit type wordcloud wordt een frequentietelling van de woorden gemaakt van een aantal teksten in groep ‘A’ en van hetzelfde aantal teksten in groep ‘B’. Deze tellingen worden vervolgens van elkaar afgetrokken. Het resultaat van deze berekening bepaalt in welke groep het woord thuishoort en hoe groot het woord getoond wordt in de wordcloud. Het gaat hierbij dus niet om de frequenties binnen de afzonderlijke groepen, maar om de grootste verschillen.
4) Vaardigheden die niet aan een beroep gebonden zijn maar van toepassing zijn op het individu en in alle beroepen van pas komen. Een voorbeeld hiervan is ‘nieuwsgierig zijn’.
5) Dit gebeurt aan de hand van de cosinus waarde van de numerieke representatie van de teksten (maat voor gelijkenis). Hoe lager deze cosinus waarde, hoe groter de gelijkenis tussen de beide tekstgedeeltes.
6) Deze grenswaarde levert een selecte groep vaardigheden op die onterecht koppelen als gevolg van de lengte van de tekst en de gebruikte woorden. Deze vaardigheden zijn niet van groot belang bij de identificatie van vaardigheden en zijn handmatig uitgesloten. Voorbeelden van dergelijke vaardigheden zijn: gendergelijkheid ondersteunenonline op zoek gaan naar informatie en ecologisch duurzame werkpraktijken toepassen.
7) Een specifieke vaardigheid wordt maar aan één deel van de tekst toegewezen (beste match) en alleen dat deel van de tekst wordt opgeslagen. Het kan voorkomen dat een vaardigheid meerdere keren voorkomt in een tekst. Een tekst kan dus nog steeds een match op zelfstandig werken generen, omdat alleen de beste match voor zelfstandig werken uit de tekst verwijderd is.

4. Beschrijving van de data en aandachtspunten

4.1 Beschrijving van de brondata

In dit rapport beperken we ons tot een samenvatting van de methode voor het verkrijgen van de data over online vacatures. Voor details verwijzen we naar de working paper 'Online vacatures als bron voor statistiek'.

Online vacatures worden verzameld via webscraping. Hierbij wordt eerst systematisch gezocht naar nieuwe advertenties (postings) op websites. Dit is uitgevoerd door het bedrijf Textkernel, dat gespecialiseerd is in semantische zoek- en matchtechnologie. Het CBS heeft zowel de volledige vacatureteksten ontvangen als ook geclassificeerde gegevens. Vacatures worden vaak meerdere keren op internet teruggevonden, omdat ze op verschillende websites tegelijk worden geplaatst. Duplicaten worden door Textkernel uit het bestand verwijderd.

4.2 Classificaties

Textkernel classificeert de beroepen naar de International Standard Classification of Occupation (ISCO) en de Nederlandse vertaling daarvan (BRC). Voor de classificatie van bedrijven en instellingen hebben we voor dit onderzoek gebruik gemaakt van de Standaardbedrijfsindeling (SBI) uit het Algemeen Bedrijvenregister (ABR) van het CBS. Hierbij wordt gebruik gemaakt van een zwaartepunttypering. Dit heeft als gevolg dat de onderverdeling naar Verpleging en Verzorging en Thuiszorg niet helemaal scherp is te maken, omdat organisaties vaak beide vormen van zorg aanbieden, maar slechts in één SBI worden ingedeeld. Zie hiervoor ook paragraaf 4.4 Aandachtspunten.

4.3 Weegmodel

Niet alle vacatures worden online gepubliceerd. Het CBS heeft daarom een weegmodel ontwikkeld om aan te sluiten bij de randtotalen van de vacature-enquête. Iedere vacature krijgt een weging, waarbij één online vacature meegeteld wordt voor een aantal vacatures, afhankelijk van sector, beroepsniveau en kwartaal. Na de weging komt het absolute aantal vacatures uit de online vacaturedata overeen met de vacature-enquête.

Daarnaast is door het CBS een weegmodel gemaakt zodat de online vacatures ieder kwartaal geheel aansluiten bij de aantallen van de vacature-enquête naar SBI-bedrijfstak en beroepsniveau. De totale aantallen in dit rapport voor de hele Nederlandse arbeidsmarkt en voor de sector Zorg en Welzijn zijn daarom altijd identiek aan de gepubliceerde cijfers op StatLine over ontstane vacatures uit de vacature-enquête. Alle informatie op detailniveau onder deze indelingen is nieuw.

Vacatures voor vrijwilligers en stagiaires zijn niet meegenomen omdat dit geen vacatures zijn voor reguliere banen. Deze zijn niet opgenomen in de vacature-enquête, en er is daarom ook nog geen geschikt weegmodel om deze te laten aansluiten bij de juiste aantallen.

Uit deze ontstane vacatures met hun bijbehorende gewicht zijn alle selecties en groepen gemaakt in dit rapport. Deze vormen de basis voor alle figuren en leveren alle teksten voor de textmining naar de gevraagde vaardigheden.

4.4 Aandachtspunten

Bij de analyse zijn we een aantal opvallende zaken tegengekomen waarmee rekening moet worden gehouden bij de interpretatie van de resultaten en mogelijkheden voor verdere analyses.

Ontstane vacatures

De huidige online vacaturecijfers gaan over de nieuw ontstane vacatures. Wat nog niet uit deze nieuwe bron aanwezig is, zijn de openstaande vacatures en de moeilijk vervulbare vacatures. De ‘vacaturegraad’ in dit rapport (vacatures per duizend banen) is dan ook een benadering op basis van de nieuw ontstane vacatures, deze wijkt af van de reguliere CBS-vacaturegraad op basis van openstaande vacatures.

Er wordt aanvullend onderzocht door het CBS of ook de openstaande vacatures af te leiden zijn uit de data over online vacatures. Dit is veelgevraagde informatie, omdat deze duidelijker aangeeft wat de werkelijke, actuele vraag naar werknemers is. Bij krapte zullen er immers meer vacatures blijven openstaan zonder snel vervuld te worden. Daarmee is ook bijvoorbeeld de vacaturegraad te berekenen zoals deze elders in het CBS wordt gebruikt, en daarmee worden de uitkomsten vergelijkbaar met overige vacaturedata van andere sectoren. Hier wordt in 2020 aan gewerkt.

Typeringsfouten en ontbrekende gegevens

Het bestand met online vacatures is door het CBS bewerkt op SBI-indeling van de bedrijven en instellingen, zodat de weging naar sector en beroepsniveau juist is uitgevoerd. Verouderde SBI-coderingen zijn voor een selectie van grote bedrijven en instellingen bijgewerkt en onjuiste koppelingen met het bedrijvenregister rechtgezet. Overige kenmerken in het bestand zijn door het CBS niet bewerkt.

Het opvallend lage aandeel van VVT-vacatures in Zaanstreek en Waterland onthulde dat een relatief grote regionale aanbieder niet was opgenomen in het bronbestand. Dat komt incidenteel voor, en niet alle gevallen zullen bekend zijn. In de huidige dataset had circa 10 procent geen locatiegegevens – deze vacatures zijn daardoor niet opgenomen bij regionale data. Dit zorgt niet voor hele grote bezwaren tegen analyses op detailniveau, maar geeft wel aan dat uitkomsten met de nodige voorzichtigheid geïnterpreteerd moeten worden. In een vervolganalyse wordt onderzocht of we meer hulpinformatie kunnen gebruiken voor een regionale indeling, en daarna of we met de weging ook rekening kunnen houden met regio om het effect van ontbrekende gegevens op regionaal niveau te verkleinen.

Kwaliteit nieuwe variabelen

De kenmerken van vacatures buiten de SBI zijn door het CBS nog niet nagekeken of bewerkt op kwaliteit. Dat gaat over de regionale toedeling, opleidingsniveau, contracttype, dienstverband. In het bestand zijn wat opvallende zaken gevonden. Zo zijn er vacatures voor schoonmakers die voor een standaard contract (geen bijzondere functie) worden ingedeeld bij een gevraagde wo-opleiding. Dit duidt op typeringsfouten van het gevraagde opleidingstype.

In figuur 7 is er een grote toename te zien van wo-vacatures in 2018. Dit zou ook te wijten kunnen zijn aan incidentele verkeerde typeringen in de kleine groep van wo-vacatures. In detail zouden deze vacatures bekeken kunnen worden of het om typeringsfouten gaat, of dat dit voorkomt bij specifieke beroepen en dat er dus inderdaad iets opvallends aan de hand is.

Onderscheid subbranches

Vacatures uit de VVT worden toegewezen aan instellingen die op basis van hun SBI-code horen bij de subbranche Verpleging en verzorging of bij de subbranche Thuiszorg. Veel instellingen verzorgen beide activiteiten, maar zij worden enkel naar hun hoofdactiviteit ingedeeld. Het zwaartepunt van een instelling hoeft echter niet altijd de activiteiten van de vacatures correct weer te geven. Het onderscheid tussen VV en Thuiszorg binnen de VVT moet daarom niet te strikt genomen worden.

Minimale celvulling blijft nodig voor zinvolle uitkomsten

De analyses in dit rapport geven aan welke gegevens met welke details beschikbaar zijn in de data. Theoretisch kan je de ontwikkeling volgen van vacatures van maatschappelijk werkers met opleidingsniveau hbo in de regio Utrecht. In de praktijk zal dit om zo weinig vacatures gaan, dat dit ook met deze brondata geen zinvolle uitkomsten zal opleveren. Gegeven dat er ook typeringsfouten in de dataset voorkomen, is er altijd een minimale celvulling nodig voor zinvolle analyses en het voorkomen van onthulling van gegevens van individuele instellingen.

Weegmodel

Omdat niet alle vacatures online worden gepubliceerd, heeft het CBS een weegmodel ontwikkeld. Dit weegmodel is gebaseerd op de vacature-enquête. Dat heeft als consequentie dat de online vacaturedata via de huidige methode pas geanalyseerd kunnen worden als de uitkomsten van de vacature-enquête beschikbaar zijn. Een versnelling van publicatie is pas mogelijk na onderzoek op basis van data over een langere periode, zie ook hoofdstuk 2.7.

5. Conclusies

Bestaande vacature-enquête

De bestaande vacature-enquête blijft de meest betrouwbare primaire bron voor het aantal vacatures in Nederland, en voor de verschillende sectoren. Immers, niet alle vacatures verschijnen online, en de vacatures op het internet zijn dus verre van volledig. Dit kan zijn omdat vacatures enkel informeel worden gezocht (het uithangbord van de slager of het eetcafé), dat een moeilijk vervulbare vacature niet telkens opnieuw online wordt geplaatst, of dat een instelling de vrijgekomen vacatures opvult vanuit een eigen pool van kandidaten. De online vacatures vertonen een duidelijke afwijking, waarbij de vacature-enquête als leidend wordt beschouwd. Bij vergelijkbare online bronnen voor vacatures in het buitenland (Burning Glass Technologies, Boston), worden dezelfde overwegingen aangehouden.

Meerwaarde online vacatures

De nieuwe databron van online vacatures geeft zeer veel details over (zorg)branches. Na aansluiting bij de resultaten van de vacature-enquête, zijn er door gebruik van deze bron meer details te bevragen over branches, beroepen, regio, opleidingsniveau, contracttypes, dienstverband en flexibele werktijden. Al deze variabelen zijn ook in de tijd te volgen, met cijfers die ieder kwartaal worden bijgewerkt. Voor arbeidsmarktbeleid waarbij gericht wordt ingezet op hele specifieke groepen, en waarvoor cijfers over vacatures nodig zijn, is dit een nieuwe bron die de benodigde data kan leveren.

Actuele arbeidsmarktinformatie

De online vacatures geven in de nabije toekomst uitzicht op publicatie over een recentere periode. Het CBS onderzoekt op dit moment eerst de robuustheid van de gebruikte bewerkingen zodat reguliere productie van kwartaalstatistieken mogelijk wordt. Dit is nodig om in te schatten hoeveel van het handmatige werk in het onderzoek nu volledig of grotendeels geautomatiseerd kan worden. Als dit onderzoek positief wordt afgerond, kan dit de basis worden voor reguliere vacaturestatistieken van het CBS. Wellicht kan het CBS op termijn actuele (maandcijfers, of ‘real-time’) voorlopige cijfers publiceren over ontstane vacatures op basis van voorlopige gewichten, zonder dat de uitkomsten van de vacature-enquête afgewacht hoeven te worden.

Meerwaarde innovatie analysetechnieken

Het is mogelijk om met behulp van textmining technieken vaardigheden uit de teksten te halen. Er is een bruikbare techniek die nog verder verfijnd moet worden. We hebben nu vooral aan de hand van de techniek en de data beschreven wat mogelijk is. De meeste toegevoegde waarde is uit de data te halen wanneer van tevoren gerichte onderzoeksvragen worden geformuleerd.