Auteur: Astrid Pleijers, Francis van der Mooren Publicatiedatum: 12-11-2021 00:00

Pilot Monitor Laaggeletterdheid 2021

Over deze publicatie

Voor Rijk en gemeenten is het van belang om inzicht te hebben in de effecten van de uitvoering van de Wet Educatie en Beroepsonderwijs op de aanpak van laaggeletterdheid. Daarom wordt stapsgewijs een landelijke Monitor Laaggeletterdheid ontwikkeld. In 2021 is de eerste stap gezet in de vorm van een door het CBS uitgevoerd pilot onderzoek in opdracht van het ministerie van OCW.

In de pilot is de beschikbaarheid van gegevens bij gemeenten en cursusaanbieders nagegaan en de vergelijkbaarheid daarvan. Ook zijn de ervaren beperkingen van gemeenten en cursusaanbieders inzichtelijk gemaakt en is onderzocht hoe de inrichting van de gegevenslevering zou moeten zijn om goed aan te sluiten bij de praktijk. Er is gestart met een basisset van gegevens over 2020/2021, verzameld door een beperkt aantal gemeenten/cursusaanbieders. Aantallen cursusdeelnemers zijn uitgesplitst naar leeftijd, geslacht en woongemeente, en naar doelgroep (NT1 of NT2) en enkele kenmerken van de gevolgde cursus.

Gemeenten/cursusaanbieders hadden in de pilot vrijheid in de wijze van aanleveren van de gegevens (geaggregeerd of recordniveau) aan het CBS. Dit rapport illustreert welke statistieken er gemaakt zouden kunnen worden op basis van de aangeleverde data. De pilot betrof een beperkte set van waarnemingen waardoor nog geen algemene conclusies te trekken zijn over de stand van zaken rondom laaggeletterdheid in Nederland.

1. Inleiding

Tot 2015 werden cijfers over cursussen laaggeletterdheid door het CBS verzameld. Toentertijd hadden gemeenten bij roc’s een bestedingsverplichting voor het OCW-budget voor de aanpak van laaggeletterdheid. Roc’s hadden een wettelijke taak om deze educatie te verzorgen en leverden vervolgens gegevens aan bij het CBS. In 2015 is de bestedingsverplichting voor gemeenten bij roc’s (en de wettelijke taak voor de roc’s) vervallen en is een open markt ontstaan voor het verzorgen van cursusaanbod voor laaggeletterden. Daarmee is ook de rapportageplicht aan het CBS voor cursusaanbieders vervallen. Sinds 2016 is er daarmee geen landelijk beeld geweest van de deelname aan het cursusaanbod.

Voor Rijk en gemeenten is het echter van belang om inzicht te hebben in de effecten van de uitvoering van de Wet Educatie en Beroepsonderwijs op de aanpak van laaggeletterdheid. Zij hebben in najaar 2019 daarom de OESO een advies gevraagd op welke wijze de voortgang op de aanpak laaggeletterdheid gemonitord zou kunnen worden. Rijk en gemeenten hebben besloten hier stapsgewijs (gedeeltelijk) uitvoering aan te geven, waaronder de uitvoering van deze pilot.

Doel van deze pilot is te onderzoeken:

welke gegevens over deelnemers beschikbaar zijn bij gemeenten en aanbieders van cursussen en
wat de onderlinge vergelijkbaarheid van die gegevens is.
Ook moet de pilot inzicht bieden in de beperkingen die gemeenten en aanbieders ondervinden bij het aanleveren van de gegevens en antwoord geven op de vraag wat er ingericht moet worden om de gegevenslevering zo goed mogelijk aan te laten sluiten bij de praktijk van gemeenten en aanbieders.

De pilot is door het CBS uitgevoerd in opdracht van het ministerie van OCW.

2. Methode

2.1 Uitgangspunten

Voor de pilot zijn de volgende uitgangspunten gehanteerd:

Een landelijke monitor laaggeletterdheid moet aansluiten bij de uitvoeringspraktijk van gemeenten.
Er wordt gestart met een basisset van outputgegevens voor een landelijke monitor via CBS. Hierbij is aangesloten bij de gegevens waarover gemeenten/aanbieders in principe beschikken. Dit is gebaseerd op het onderzoek onder gegevensverzameling bij aanbieders van ICTU in 2020.
De basisset bestaat uit aantallen deelnemers per:

geslacht
leeftijd
NT1/NT2
type cursus
type aanbod
woongemeente/postcodegebied.

De outputgegevens worden zoveel mogelijk vanuit de bestaande systemen van aanbieders en gemeenten geëxporteerd naar het CBS. Het CBS biedt ook zelf een tool (momenteel een Excel sjabloon) aan voor aanbieders die hiervan gebruik willen maken.
De gegevens die CBS ontvangt, zijn ontdaan van tot individuele personen herleidbare gegevens.
Er vindt geen levering plaats van outcome gegevens aan het CBS. Dit zijn gegevens die gemeenten en aanbieders zelf op lokaal/regionaal niveau verzamelen om de effectiviteit van een bepaald aspect van hun zorg- of dienstverlening zichtbaar te maken. Gemeenten hebben keuzevrijheid om lokaal/regionaal zelf aanvullende gegevens te (laten) verzamelen, passend binnen hun wettelijke opdracht.

Gemeenten kiezen zelf welke gegevensstroom naar CBS zij hanteren:

De aanbieder levert rechtstreeks aan het CBS
De aanbieder levert de gegevens aan de (contact)gemeente en de (contact)gemeente levert de gegevens aan het CBS.

Hiermee wordt zoveel mogelijk recht gedaan aan lokale en regionale verschillen. De gemeente blijft in beide opties verantwoordelijk voor de aanlevering van de gegevens en heeft de regie in de aanlevering.

Aanlevering kan zowel op recordniveau als op geaggregeerd niveau. Bij record data is elk record gerelateerd aan één persoon. Wel kan het zijn dat personen meerdere cursussen hebben gevolgd. Geaggregeerde data zijn samengevoegde data door onderliggende gegevens op te tellen en totalen of subtotalen weer te geven. Ook hiervoor geldt dat gemeenten zelf een keuze maken op welk niveau ze de data leveren.

Met de basisset heeft de landelijke monitor voorlopig een beperkte reikwijdte omdat door het ontbreken van persoonsgegevens dubbeltellingen niet kunnen worden uitgesloten (bijvoorbeeld gelijktijdig volgen van meerdere trajecten) en outputgegevens niet kunnen worden gecombineerd met andere databestanden van het CBS. Bovendien kunnen aanbieders niet worden verplicht aan te leveren aan het CBS.

De beperkte reikwijdte was ook het uitgangspunt bij de start van de pilot. Streven is dat gaandeweg wordt toegewerkt naar een landelijke monitor met meer mogelijkheden (‘groeimodel’).

2.2 Deelnemers

Voor de pilot zijn verschillende contactgemeenten benaderd om deel te nemen. Daarbij is gelet op zowel deelname van gemeenten die zelf wilden aanleveren als gemeenten die de aanlevering laten doen door de aanbieders. Meerdere gemeenten werken samen of willen gaan samenwerken met Qwasp BV voor het monitoren van hun lokale situatie. In de pilot is daarom ook beoogd te kijken hoe de gegevenstransfer van Qwasp BV naar CBS kan plaatsvinden.

Om de deelnemers tijdens de pilot goed te informeren is een bijdrage geleverd aan de volgende bijeenkomsten.

Werkgroep Monitor Laaggeletterdheid
Landelijke bijeenkomst voor WEB contactgemeenten;
Twee online vragensessies voor pilot deelnemers gecoördineerd door CBS.

De werkgroep Monitor Laaggeletterdheid is gestart in november 2020 om als een kleine actieve groep gemeenten samen met het Rijk de monitor verder te ontwikkelen. De volgende contactgemeenten zitten in de werkgroep: Amersfoort, Dordrecht, Den Haag, Haarlem, Heerlen, Rotterdam en Amsterdam (en Utrecht tot eind 2020). VNG/Divosa en de ministeries van BZK en OCW verzorgen de organisatie.

Het CBS heeft input bij deze werkgroep opgehaald voor de inrichting van de pilot en communicatie met deelnemers en de rest van de gemeenten. Tevens is in januari 2021 een speciale werkgroep georganiseerd over de gegevensdefinitie van de 6 indicatoren die het CBS in de pilot moet hanteren. Gedurende het verloop van de pilot heeft het CBS presentaties gegeven over de voortgang in de werkgroep.

In totaal namen 16 gemeenten deel aan de pilot deel. Hiervan hebben er uiteindelijk 13 ook gegevens aangeleverd. Voor 4 gemeenten geldt dat de aanlevering is gedaan door in totaal 9 aanbieders.

2.2.1 Deelnemende gemeenten en cursusaanbieders
Gemeente	Gegevens aangeleverd door
1 Amersfoort	Gemeente zelf
2 Amsterdam	Gemeente zelf
3 Den Haag	ROC Mondriaan
4 Dordrecht	Gemeente zelf
5 Haarlem	Gemeente zelf
6 Heerlen	Vista college
7 Hilversum	Gemeente zelf
8 Leiden	Gemeente zelf
9 Roermond	Gemeente zelf
10 ‘s-Hertogenbosch	Gemeente zelf
11 Tilburg	Gemeente zelf
12 Venlo	Taalhuis Venlo
	ORGB
	Stichting Groenlicht NML
	Gilde Educatie
13 Zoetermeer	ROC Mondriaan
	Fox Taal
	Taalhuis Voorschoten/Wassenaar
	Volksuniversiteit

2.3 Benaderstrategie

Voor de pilot is aangesloten bij de reguliere werkwijze van het CBS. Dit houdt in dat gebruik is gemaakt van de gebruikelijke benaderstappen en afspraken.

Deelnemers aan de pilot hebben op 23 maart 2021 een brief en mail ontvangen met hun gebruikersnaam en wachtwoord. Met behulp van deze gegevens konden ze inloggen in de voor hen klaargezette vragenlijst. In de brief/e-mail was een retourdatum vermeld die 30 dagen na ontvangst van de uitzendbrief lag. Na het verstrijken van de retourdatum is een herinnering toegezonden in de vorm van een 1e rappelbrief en mail. Deze rappel is na afstemming met de opdrachtgevers en deelnemers later gepland. Op 21 mei 2021 is de rappelbrief verstuurd en op 25 mei 2021 de rappel e-mail.

Voor de pilot is een webpagina gemaakt waarop meer informatie over het onderzoek te vinden is, zie Monitor Laaggeletterdheid (cbs.nl).

2.4 Datalevering en -verwerking

De deelnemers hebben de data aangeleverd in de periode 23 maart 2021 tot en met 30 juni 2021. In de meeste gevallen gebeurde dit via het daartoe ingerichte beveiligde uploadportaal van het CBS. Enkele deelnemers hebben hun data via email verstuurd. Binnen de pilot hebben 2 gemeenten kennisgemaakt met de aanlevering via een externe partij (Qwasp). In totaal zijn 22 databestanden aangeleverd. Voor 16 daarvan geldt dat de gegevens op recordniveau zijn aangeleverd en voor 6 dat de gegevens geaggregeerd zijn aangeleverd. Van de aangeleverde bestanden bleken er 18 bruikbaar voor de verdere verwerking: 8 zijn (grotendeels) volgens het sjabloon aangeleverd en 10 gedeeltelijk of niet volgens het sjabloon.

Van de 18 verwerkte bestanden bevatten 5 bestanden geaggregeerde data en 13 bestanden data op recordniveau. Van deze 18 bestanden zijn 9 bestanden verwerkt (toegevoegd aan het recordbestand) zonder dat daarbij extra werk nodig was. Wil je het verwerken van de data kunnen automatiseren dan is het van groot belang dat de data exact volgens het afgesproken format wordt aangeleverd. In tabel 2.4.1 is opgenomen welke problemen in de dataverwerking aan de orde kwamen.

2.4.1 Aandachtspunten aangeleverde bestanden
Omschrijving	Aantal
1 Niet aangeleverd in het standaard sjabloon	8
2 Naam bestand aangepast	5
3 Kolomnamen aangepast	3
4 Kolommen anders gerangschikt	3
5 Kolom inhoud niet volgens standaard sjabloon	7
6 Data niet in 1 Excelsheet maar in >= 2 sheets aangeleverd	1
7 Witregels in data	2
8 Kolom data niet ‘uitgevuld’	1
9 Antwoordcategorie aangepast of uitgebreid	5
10 Referentiejaar anders genoteerd	3
11 Ontbrekende data	5
12 Data niet aangeleverd via uploadportaal	2
13 Extra kolommen toegevoegd met informatie	6
14 Data niet aangeleverd via Excel (of oude versie)	4
15 Inhoud data niet consequent en/of bevat fouten	4

Streven was om één geüniformeerd analysebestand samen te stellen dat gebruikt zou kunnen worden voor analyse van de pilot resultaten, maar ook de basis zou vormen voor een eventuele reguliere dataverzameling in 2022 en verder. Dit bleek helaas niet te realiseren en vandaar dat twee analysebestanden zijn samengesteld: één bestand op basis van de gegevens die op recordniveau zijn aangeleverd en één bestand op basis van de geaggregeerde data.

3. Resultaten

In deze paragraaf worden bevindingen uit de pilot gepresenteerd. Aan de hand van een aantal tabellen en figuren wordt getoond welke statistieken samengesteld kunnen worden op basis van de door gemeenten en cursusaanbieders aangeleverde data. De resultaten zijn gebaseerd op een beperkte set van waarnemingen. Daarnaast geven ze niet voor alle gemeenten een compleet beeld van de cursusdeelname, omdat in een aantal gemeenten slechts een deel van de aanbieders gegevens heeft geleverd. Daarom kunnen er nog geen algemene conclusies over opleidingsdeelname rondom laaggeletterdheid in Nederland uit getrokken worden. De eerste paragraaf beschrijft een aantal bevindingen op basis van het analysebestand met gegevens op recordniveau. De tweede paragraaf geeft een aantal resultaten weer gebaseerd op het analysebestand met gegevens op geaggregeerd niveau. Ten slotte wordt in de derde paragraaf beknopt ingegaan op de individuele terugkoppelingen die samengesteld zijn voor de deelnemende (contact)gemeenten. De gemeenten hebben deze separaat toegestuurd gekregen.

3.1 Resultaten op recordniveau

In deze paragraaf wordt een aantal resultaten beschreven op basis van het databestand dat is samengesteld uit de gegevens die op recordniveau door gemeenten en cursusaanbieders zijn aangeleverd.

Dit bestand bevat 7 457 cases of cursusdeelnemers. Het is helaas vrijwel zeker dat hier dubbelingen in zitten. Bijvoorbeeld omdat deelnemers aan meerdere cursussen hebben deelgenomen of bij meerdere aanbieders stonden geregistreerd. Die dubbelingen zijn een gevolg van de afspraak om voor deze pilot geen identificerende, unieke persoonsgegevens aan te leveren. Een aantal gemeenten had bezwaar tegen het delen van persoonsgegevens van cursisten op landelijk niveau, hoewel dit juridisch wel mag tussen aanbieders en het CBS. De WEB is niet eenduidig over het delen van persoonsgegevens tussen aanbieders en gemeenten. Als een uniek identificerend gegeven per deelnemer wel beschikbaar is, kunnen deze dubbelingen worden voorkomen en is goed zicht op deelnemers die meerdere cursussen hebben gevolgd. Het CBS vervangt identificerende persoonskenmerken zo snel mogelijk na ontvangst door een pseudosleutel. Met deze zogeheten gepseudonimiseerde gegevens doet het CBS vervolgens onderzoek. Het CBS publiceert alleen statistische informatie als personen niet herkenbaar of herleidbaar zijn. (Zie hier voor meer informatie over hoe het CBS met persoonsgegevens omgaat).

Met de gegevens op record niveau is het in principe mogelijk om elke gewenste indeling te maken van (combinaties van) beschikbare kenmerken. Daarbij kan het bijvoorbeeld gaan om een uitsplitsing naar geslacht of het soort cursus. 66,5 procent van de deelnemers is vrouw, 30 procent is man en van 3,5 procent is het geslacht onbekend. Van de deelnemers volgde 74 procent één of meerdere cursussen uit het non-formele aanbod en 25 procent nam deel aan het formele aanbod. Van 1 procent is het soort cursus niet bekend.

De volgende figuren illustreren een aantal mogelijkheden voor het samenstellen van beschrijvende statistieken op basis van de data die aangeleverd zijn. De figuren 3.1.1 en 3.1.2 geven informatie over de cursusdeelnemers naar de achtergrondkenmerken leeftijd en type cursus. In figuur 3.1.2 zijn cursusdeelnemers mogelijk meerdere keren meegeteld, omdat zij meerdere cursussen gevolgd kunnen hebben.

Data op recordniveau maken het ook mogelijk om de groep cursusdeelnemers uit te splitsen naar een combinatie van achtergrondkenmerken, zoals leeftijd en geslacht (figuur 3.1.3), leeftijd en doelgroep (figuur 3.1.4) of geslacht en soort cursus (figuur 3.1.5). Soortgelijke figuren zijn ook teruggekoppeld aan de deelnemers die op recordniveau hebben aangeleverd. In figuur 3.1.3 is bijvoorbeeld te zien dat de participatie van mannen in de leeftijdsgroepen onder de 67 jaar achterblijft vergeleken met mannen vanaf 67 jaar.

3.1.3 Cursusdeelname naar leeftijd en geslacht
	Man (%)	Vrouw (%)	Onbekend (%)
18 tot 27 jaar	34	66	0
27 tot 35 jaar	32	68	0
35 tot 45 jaar	30	69	1
45 tot 54 jaar	28	71	0
55 tot 66 jaar	34	63	4
67 jaar of ouder	50	49	1
Onbekend	14	48	37

3.1.3 Cursusdeelname naar leeftijd en geslacht
	Man (%)	Vrouw (%)	Onbekend (%)
18 tot 27 jaar	34	66	0
27 tot 35 jaar	32	68	0
35 tot 45 jaar	30	69	1
45 tot 54 jaar	28	71	0
55 tot 66 jaar	34	63	4
67 jaar of ouder	50	49	1
Onbekend	14	48	37

Uit figuur 3.1.4 is af te lezen dat onder alle cursisten van wie bekend is tot welke leeftijdsgroep ze horen het aandeel NT2 deelnemers verreweg het grootst is. Dit aandeel betreft hier een kenmerk van de deelnemer, niet van de cursus.

3.1.4 Cursusdeelname naar leeftijd en doelgroep
	Deelnemers Nederlands als eerste taal (NT1) (%)	Deelnemers Nederlands als tweede taal (NT2) (%)	Onbekend (%)
18 tot 27 jaar	3	74	23
27 tot 35 jaar	1	80	19
35 tot 45 jaar	2	75	23
45 tot 54 jaar	4	69	27
55 tot 66 jaar	13	62	25
67 jaar of ouder	20	55	25
Onbekend	1	10	89

3.1.4 Cursusdeelname naar leeftijd en doelgroep
	Deelnemers Nederlands als eerste taal (NT1) (%)	Deelnemers Nederlands als tweede taal (NT2) (%)	Onbekend (%)
18 tot 27 jaar	3	74	23
27 tot 35 jaar	1	80	19
35 tot 45 jaar	2	75	23
45 tot 54 jaar	4	69	27
55 tot 66 jaar	13	62	25
67 jaar of ouder	20	55	25
Onbekend	1	10	89

Ook kan uit de gegevens opgemaakt worden dat onder vrouwen het aandeel cursisten dat formeel onderwijs volgt lager is dan onder mannen en dat van de vrouwen het soort cursus vaker onbekend is (figuur 3.1.5).

Indien gewenst kunnen de data ook per gemeente weergegeven worden. Dan is het mogelijk om gemeenten met elkaar te vergelijken. Hierna zijn enkele voorbeelden weergegeven waarin kenmerken zijn uitgesplitst naar gemeente.

3.1.7 Cursusdeelname naar soort cursus en gemeente
Gemeente	Formeel (%)	Non-formeel (%)	Onbekend (%)
Totaal	25	74	1
Gemeente 1	100	0	0
Gemeente 3	73	27	0
Gemeente 4	70	24	7
Gemeente 2	42	58	0
Gemeente 7	21	79	0
Gemeente 6	20	79	1
Gemeente 5	0	100	0

3.1.7 Cursusdeelname naar soort cursus en gemeente
Gemeente	Formeel (%)	Non-formeel (%)	Onbekend (%)
Totaal	25	74	1
Gemeente 1	100	0	0
Gemeente 3	73	27	0
Gemeente 4	70	24	7
Gemeente 2	42	58	0
Gemeente 7	21	79	0
Gemeente 6	20	79	1
Gemeente 5	0	100	0

In figuur 3.1.7 is het soort cursus naar gemeente getoond. Hier valt op dat de cursusdeelnemers in gemeente 5 allemaal non-formele cursussen hebben gevolgd en in gemeente 1 allemaal formele cursussen.

3.1.8 Cursusdeelname naar doelgroep en gemeente
Gemeente	Deelnemers Nederlands als eerste taal (NT1) (%)	Deelnemers Nederlands als tweede taal (NT2) (%)	Onbekend (%)
Totaal	3	69	28
Gemeente 3	24	76	0
Gemeente 1	23	77	0
Gemeente 5	3	97	0
Gemeente 6	2	97	0
Gemeente 7	1	99	0
Gemeente 2	0	0	100
Gemeente 4	0	0	100

3.1.8 Cursusdeelname naar doelgroep en gemeente
Gemeente	Deelnemers Nederlands als eerste taal (NT1) (%)	Deelnemers Nederlands als tweede taal (NT2) (%)	Onbekend (%)
Totaal	3	69	28
Gemeente 3	24	76	0
Gemeente 1	23	77	0
Gemeente 5	3	97	0
Gemeente 6	2	97	0
Gemeente 7	1	99	0
Gemeente 2	0	0	100
Gemeente 4	0	0	100

Uit figuur 3.1.8 kan afgelezen worden dat de gemeente 3 en de gemeente 1 een relatief groot aandeel cursusdeelnemers NT1 hebben ten opzichte van de overige gemeenten die gegevens over de doelgroep (NT1/NT2 deelnemer) aangeleverd hebben.

3.2 Resultaten op geaggregeerd niveau

In deze paragraaf wordt een aantal resultaten beschreven op basis van het databestand dat is samengesteld uit de gegevens die op geaggregeerd niveau door gemeenten zijn aangeleverd. De onderstaande figuren illustreren een aantal mogelijkheden voor het samenstellen van beschrijvende statistieken op basis van de geaggregeerde data die aangeleverd zijn door de pilot deelnemers, maar laten ook een aantal beperkingen zien van data op geaggregeerd niveau.

Het analysebestand met geaggregeerde data bevat informatie over 8 645 cursusdeelnemers. Net als in het recordbestand komen ook in dit geaggregeerde bestand dubbeltellingen voor. Dat heeft er in dit geval mee te maken dat gemeenten en aanbieders is gevraagd het totaal aantal deelnemers per type cursus te tellen. Op basis van het totaal en de som van de deelnemers per type cursus is iets te zeggen over het mogelijke aantal dubbelingen. Dit geldt niet voor cursusdeelnemers die te maken hebben gehad met verschillende aanbieders van cursussen en daarom dubbel worden geteld. Deze dubbelingen zijn er, maar niet in beeld.

In dit bestand is 42 procent vrouw, 22 procent man, 0,1 procent heeft geslacht ‘neutraal’ en van 35 procent is het geslacht niet bekend. Vergeleken met de uitkomsten op basis van de gegevens op recordniveau is het aandeel vrouwen beduidend kleiner, en het aandeel onbekenden beduidend groter.

In 89 procent van de gevolgde cursussen ging het om een non-formele cursus en in 11 procent om een formele cursus.

In figuur 3.2.1 is de leeftijdsverdeling van de cursisten weergegeven. Hier is zichtbaar dat er verschillende leeftijdsklassenindelingen zijn gebruikt. De gegevens zijn hierdoor onderling niet vergelijkbaar en ook niet bruikbaar voor kruisingen met andere kenmerken.

3.2.1 Leeftijd cursusdeelnemers
Leeftijdsgroep	Cursusdeelnemers
Jonger dan 23 jaar	200
18 tot 27 jaar	57
23 tot 27 jaar	572
23 tot 50 jaar	8
27 tot 35 jaar	147
27 tot 32 jaar	946
30 tot 40 jaar	1
32 tot 50 jaar	1953
35 tot 45 jaar	193
45 tot 55 jaar	151
50 jaar of ouder	407
53 tot 65 jaar	22
55 tot 67 jaar	95
67 jaar of ouder	17
Niet uitgesplitst	3876

3.2.1 Leeftijd cursusdeelnemers
Leeftijdsgroep	Cursusdeelnemers
Jonger dan 23 jaar	200
18 tot 27 jaar	57
23 tot 27 jaar	572
23 tot 50 jaar	8
27 tot 35 jaar	147
27 tot 32 jaar	946
30 tot 40 jaar	1
32 tot 50 jaar	1953
35 tot 45 jaar	193
45 tot 55 jaar	151
50 jaar of ouder	407
53 tot 65 jaar	22
55 tot 67 jaar	95
67 jaar of ouder	17
Niet uitgesplitst	3876

In tegenstelling tot data op recordniveau, is het op geaggregeerd niveau veelal lastig om de cursusdeelname uit te splitsen naar twee (of meer) kenmerken. Wordt er gekeken naar de verdeling van de gevolgde cursussen naar geslacht en een ander kenmerk, bijvoorbeeld type cursus (tabel 3.2.2) dan is te zien dat ook hier geen duidelijk beeld ontstaat, omdat niet alle pilot deelnemers dezelfde indeling voor geslacht hebben gebruikt (er is bijvoorbeeld door één van de deelnemers een categorie ‘Neutraal’ toegevoegd). Ook hebben niet alle gemeenten de gegevens naar geslacht aangeleverd, waardoor van een deel van de gevolgde cursussen niet zichtbaar gemaakt kan worden hoe de man/vrouw verdeling is (kolom ‘Niet uitgesplitst’).

3.2.2 Cursusdeelname naar geslacht en type cursus
	Totaal	Man	Vrouw	Neutraal	Niet uitgesplitst
Totaal	8 645	1 922	3 670	5	3 048
Digitaal	246	33	77	-	136
Rekenen	45	5	40	-	-
Taal	8 139	1 837	3 516	5	2 781
Taal/digitaal	131	-	-	-	131
Taal/rekenen	84	47	37	-	-
- Geen cijfer beschikbaar

Een soortgelijke tabel met gedeeltelijk lege cellen wordt verkregen als het kenmerk geslacht wordt gecombineerd met bijvoorbeeld de doelgroep (NT1/NT2 deelnemer). Een grafische weergave van de gegevens in een totaalplaatje kan in een dergelijk geval niet worden gemaakt.

Ook op geaggregeerde data is het mogelijk gegevens tussen gemeenten met elkaar te vergelijken, al is dat afhankelijk van de diversiteit in indelingen die zijn aangeleverd. Komen de indelingen van kenmerken voor een groot deel overeen dan is vergelijken tussen gemeenten beter mogelijk dan als er veel verschil is. Hieronder zijn enkele voorbeelden weergegeven waarin kenmerken zijn uitgesplitst naar gemeente. In onderstaande figuren zijn de mogelijkheden van de verwerkte data op geaggregeerd niveau zichtbaar gemaakt.

Figuur 3.2.4 laat zien dat het op basis van de verwerkte, geaggregeerde data wel mogelijk is voor alle gevolgde cursussen het soort cursus per gemeente weer te geven. Deze informatie is in de data voor alle gevolgde cursussen in alle weergegeven gemeenten beschikbaar.

In tabel 3.2.5 is de verdeling van cursusdeelnemers naar doelgroep (NT1/NT2 deelnemer) gepresenteerd per gemeente. De tabel laat zien dat het voor deze variabele ook lastig is om een totaaloverzicht te krijgen, omdat voor sommige gemeenten niet van alle deelnemers bekend is of ze NT1 dan wel NT2 deelnemer zijn. Bij gemeente 9 is dat bijvoorbeeld voor geen van de cursisten bekend en bij gemeente 11 voor een beperkt deel van de cursusdeelnemers.

3.2.5 Cursusdeelname naar doelgroep (NT1/NT2 per gemeente
	Totaal	NT1	NT2	Onbekend	Niet uitgesplitst
Totaal	8 645	174	6 255	723	1 493
Gemeente 8	4 117	45	4 072	-	-
Gemeente 3	1 130	71	1 059	-	-
Gemeente 9	715	-	-	715	-
Gemeente 10	816	54	754	8	-
Gemeente 11	1 867	4	370	-	1 493
- Geen cijfer beschikbaar

3.3 Individuele terugkoppeling aan deelnemers

Alle gemeenten en cursusaanbieders die hebben deelgenomen aan de pilot, hebben van het CBS een individuele terugkoppeling ontvangen. Deze terugkoppeling bevat een korte samenvatting van de bevindingen per gemeente. Hierin zijn puntsgewijs een aantal frequentieverdelingen per variabele weergegeven (bijvoorbeeld: aantal cases/records, verdeling man/vrouw/onbekend, verdeling formele/non-formele cursussen). Daaraan toegevoegd zijn enkele figuren waarin opgeleverde variabelen tegen elkaar zijn uitgezet (bijvoorbeeld cursusdeelname naar leeftijd en soort cursus). Dit zijn soortgelijke figuren zoals gepresenteerd in de voorgaande paragrafen (3.1 en 3.2). Afzonderlijke bestanden die het CBS per cursusaanbieder voor één contactgemeente heeft ontvangen, zijn voor de individuele terugkoppeling samengevoegd tot één totaalbestand voor die betreffende contactgemeente. Ook de gemeenten waarvan de data niet zijn verwerkt in het recordbestand en het geaggregeerde bestand hebben een individuele terugkoppeling ontvangen op de door hen aan het CBS geleverde data.

Deze individuele terugkoppelingen laten zien wat er op den duur mogelijk is in een landelijke output monitor voor Laaggeletterdheid. Over de precieze vorm zal nog gedacht moeten worden, maar gedacht kan worden aan een dashboard met vergelijkingen op regionaal/lokaal niveau.

4. Conclusies en aanbevelingen

4.1 Conclusies

In dit slothoofdstuk worden de conclusies op basis van de pilot weergegeven en aanbevelingen gedaan voor de verdere ontwikkeling van een landelijke monitor Laaggeletterdheid.
In de pilot stonden drie vragen centraal, namelijk:

welke gegevens over deelnemers zijn beschikbaar bij gemeenten en aanbieders van cursussen en zijn die onderlinge vergelijkbaar?
welke beperkingen ondervinden gemeenten en aanbieders bij het aanleveren van de gegevens?
wat moet er ingericht worden om de gegevenslevering zo goed mogelijk aan te laten sluiten bij de praktijk van gemeenten en aanbieders?

In reactie op de eerste vraag kan geconcludeerd worden dat het (nog) niet alle gemeenten en aanbieders is gelukt om de basisset met gegevens aan te leveren. Deze informatie was niet beschikbaar of kon niet zo snel worden geleverd. Diverse factoren kunnen hierbij een rol gespeeld hebben, bijvoorbeeld dat gegevens vanuit verschillende registratiesystemen of van verschillende aanbieders opgehaald moesten worden, of dat gemeenten voor een andere monitor gewend zijn net iets andere gegevens te leveren. Zo zijn er bijvoorbeeld gemeenten en aanbieders die geen onderscheid hebben gemaakt naar geslacht of naar leeftijd. Dit sluit aan bij de eerdere bevindingen van ICTU.

Over het algemeen geldt dat de gegevens goed bruikbaar zijn van degenen die het sjabloon hebben gevolgd en die op recordniveau hebben aangeleverd. Het zijn veelal de aanbieders die op recordniveau hebben aangeleverd terwijl de meeste gemeenten hebben gekozen voor het (deels) geaggregeerd aanleveren.

Als de gegevens goed bruikbaar zijn, wil dit niet per definitie zeggen dat ze onderling ook goed vergelijkbaar zijn. Ook dan kunnen nog steeds verschillen in interpretatie bestaan. Uit de voor deelnemers georganiseerde bijeenkomsten bleek ook dat er discussie is over definities en dat de geformuleerde toelichting niet altijd aansloot bij de manier waarop in de praktijk wordt gehandeld. Indruk is desondanks dat de op recordniveau aangeleverde gegevens redelijk goed vergelijkbaar zijn en in ieder geval een goede basis bieden voor doorontwikkeling. Voor de geaggregeerd aangeleverde data is dit minder het geval.

In reactie op de tweede vraag kan geconcludeerd worden dat gemeenten en aanbieders verschillende beperkingen hebben ervaren.

Het voor deze pilot gemaakt Excel format bleek niet voor alle gemeenten en aanbieders goed werkbaar. Kolomnamen zijn aangepast en ook zijn andere categorieën opgeleverd dan gevraagd. De variabele woongemeente bleek niet voldoende duidelijk, in plaats van gemeente is door meerdere gemeenten en aanbieders woonplaats opgeleverd. En ook de notatie van geboortedatum leverde meerdere varianten op. Om de aangeleverde gegevens geautomatiseerd te kunnen verwerken, is het van belang om exact het format te volgen. Omdat dit de eerste keer was dat deze uitvraag op deze manier is gedaan, is de verwachting dat er ook gewenning zal zijn en dat een deel van de ervaren beperkingen bij een volgende aanlevering al minder zullen spelen.
Van de 16 deelnemers (gemeenten) aan de pilot zijn er 13 geweest die ook daadwerkelijk hebben kunnen leveren.
Het tijdpad bleek met name voor gemeenten ietwat krap. Meerdere keren is door gemeenten aangegeven dat zij nog volop bezig zijn met het opzetten van het monitoring van laaggeletterdheid en dat de verzameling van de benodigde gegevens nog in de opstartfase is. Een aantal gemeenten gaf ook aan dat ze gedurende de looptijd van de pilot te maken hadden met meerdere uitvragen van gegevens. Deze factoren kunnen van invloed zijn geweest op de gegevenslevering binnen de pilot.
Voor elke deelnemer aan de pilot is een uploadkanaal ingericht zodat gegevens op een veilige manier naar het CBS verstuurd konden worden. Een aantal deelnemers heeft de datalevering via e-mail gedaan. Reden daarvoor was dat de contactpersoon was gewijzigd waardoor de inloggegevens niet meer klopten en het op dat moment ook niet meer mogelijk was om nieuwe inloggegevens toe te sturen. Dit laatste had te maken met de duur van de pilot, verwachting is dat dit geen probleem is bij een reguliere levering van de data.

In reactie op de derde vraag kan geconcludeerd worden dat met name gemeenten moeite leken te hebben met het aanleveren van de gegevens. Eerste indruk is dat dit vooral komt omdat dit de eerste keer is dat een dergelijke uitvraag is gedaan. Dit zou ook moeten blijken uit het vervolgonderzoek van ICTU. In dat onderzoek wordt nagegaan wat de ervaringen en aandachtspunten zijn, zowel organisatorisch als technisch, rondom gegevensaanlevering binnen de pilot. Doel hiervan is om de datalevering te versoepelen en de datakwaliteit te bevorderen. Ook is de indruk dat de uitvraag voor een aantal gemeenten net iets te vroeg kwam doordat ze nog niet zo ver waren dat ze de eigen verzameling van de beoogde gegevens, al dan niet met hulp van een externe partij, (volledig) hadden ingericht.

Voor het CBS is het van groot belang dat voor de doorontwikkeling van een landelijke output monitor gegevens daadwerkelijk geautomatiseerd verwerkt kunnen worden. Deze pilot leert dat het op recordniveau aanleveren van de gegevens exact volgens het format daar een goede basis voor biedt. Wat betreft dat format, voor vrijwel alle deelnemers lijkt het format niet voldoende duidelijk als het gaat om deelnemers die aan meerdere cursussen hebben deelgenomen. Hiervoor zou in het format nog een aanpassing gedaan moeten worden.

Tot slot is het de vraag of voor alle gemeenten even duidelijk was wat het verschil is tussen de outcome resultaten die in lokale/regionale monitors worden opgenomen en de output die beoogd is in de landelijke monitor Laaggeletterdheid. Idee is dat de landelijke monitor en de regionale monitors elkaar gaan aanvullen en versterken. Beeld was echter dat sprake is van overlap en dubbel werk.

4.2 Aanbevelingen

Op basis van bovenstaande conclusies kunnen voor de doorontwikkeling van een landelijke output monitor Laaggeletterdheid de volgende aanbevelingen worden gedaan. Deze aanbevelingen zijn onderverdeeld in een aantal categorieën.

Format

Lever gegevens aan op recordniveau, en idealiter met persoonsidentificerende informatie. Dit is informatie die over iemand gaat of naar deze persoon te herleiden is, bijvoorbeeld een burgerservicenummer. Op die manier kunnen unieke personen worden geteld en dubbelingen voorkomen. Op termijn zou een koppeling kunnen worden gemaakt met andere bronnen en daarmee aangesloten kunnen worden bij de aanbevelingen die door de OESO zijn gedaan, zoals het in kaart brengen van een aanvullende set variabelen (bijvoorbeeld onderwijsachtergrond en arbeidssituatie van cursusdeelnemers).
Optimaliseer het Excel format als het gaat om deelnemers die meerdere cursussen hebben gevolgd zodat zowel het aantal deelnemers aan cursussen als het aantal gevolgde trajecten goed in beeld is.
Zorg eventueel voor extra controles in het Excel format zodat voor deelnemers ook helder is wat ze moeten aanleveren en voorkomen kan worden dat het format wordt aangepast.
Mogelijk kan in aanvulling op het Excel format een afzonderlijke uniformeringstool met controleregels worden ontwikkeld die gebruikt kan worden om de data gereed te maken voor plaatsing in het Excel format.

Terminologie

Kies zo eenduidig mogelijke definities van de zes outputgegevens en gebruik deze in het Excel format. Sluit hierbij aan bij de bestaande praktijk van gemeenten en aanbieders. De meest recente versie van het kwaliteitskader kan hierbij de leidraad vormen.

Dataverzameling en -levering

Lever data aan gedurende één periode per jaar. In overleg met Rijk en gemeenten zou bepaald moeten worden welke periode in het jaar het meest passend is voor de dataverzameling. Op basis van de pilot ervaringen lijken Q2 of Q3 het beste aan te sluiten bij de periode waarin gemeenten/aanbieders de gegevens van het gehele afgelopen jaar ter beschikking hebben.
In het kader van de AVG mogen de data alleen door de data eigenaars, d.w.z. gemeenten of aanbieders zelf aan het CBS worden aangeleverd. Een deel van de gemeenten gaat naar verwachting aanleveren via een externe partij (Qwasp). Bouw daarom een extra verificatiestap in om er zeker van te zijn dat de gemeente/aanbieder afzender van de data is.
Handhaving (verplichtstelling voor deelname) door CBS zal niet wenselijk zijn, en dus ook niet plaatsvinden, zo lang er nog geen wettelijke basis voor de gegevenslevering is (geen verplichte statistiek). Mogelijk wordt de WEB per 2022/2023 aangepast en zal het wettelijk kader voor deze verzameling en levering verduidelijkt zijn

Steekproef

Om een op landelijk niveau representatief beeld te verkrijgen van de stand van zaken rondom de aanpak van laaggeletterdheid is het noodzakelijk dat alle gevraagde data (zes outputgegevens) van zoveel mogelijk centrumgemeenten beschikbaar zijn. Hiervoor dient een beroep te worden gedaan op de individuele verantwoordelijkheid van de 35 centrumgemeenten om gezamenlijk bij te dragen aan een voor eenieder bruikbare monitor. Actieve stimulans om data aan het CBS aan te leveren, bijvoorbeeld vanuit Werkgroepen/Rijk/VNG/Divosa kan hierbij een belangrijke factor zijn.

Afstemming

Aangezien het CBS in de pilot ervaring heeft opgedaan met het verzamelen en verwerken van de data, is het aan te bevelen advies in te winnen bij de CBS experts op het gebied van dataverzameling en dataverwerking. Het betreft dan vooral advies rondom het optimaliseren van het Excel format en het mogelijk ontwikkelen van een afzonderlijke uniformeringstool met controleregels. Dit kan bijdragen aan het nader verkrijgen van inzicht in de functionaliteiten die het Excel format en mogelijk een afzonderlijke uniformeringstool moet(en) bezitten.

Ondersteuning

Om de gemeenten en cursusaanbieders te ondersteunen bij de datalevering verdient het aanbeveling een vraagbaak in te richten waar zij terecht kunnen met vragen rondom deelname aan het onderzoek. Hiervoor kan het e-mailadres laaggeletterdheid@cbs.nl gebruikt worden, dat in de pilot ook al beschikbaar was.

Referenties

Tol, T., F. van der Mooren en N. Braams, Projectvoorstel Pilot Monitor Laaggeletterdheid 2021, 30 november 2020;

Creemers, M., Onderzoeksdesign Monitor Laaggeletterheid (MLG), Pilot, 15 december 2020.

ICTU, Oplegmemo bij de rapportage gegevensverwerking door aanbieders van volwasseneneducatie basisvaardigheden, augustus 2020.

Leeftijdscategorie	Cursusdeelnemers (%)
18 tot 27 jaar	1,4
27 tot 35 jaar	8,5
35 tot 45 jaar	25,6
45 tot 54 jaar	30,3
55 tot 66 jaar	17,8
67 jaar of ouder	8,9
Onbekend	7,5

Leeftijdscategorie	Cursusdeelnemers (%)
18 tot 27 jaar	1,4
27 tot 35 jaar	8,5
35 tot 45 jaar	25,6
45 tot 54 jaar	30,3
55 tot 66 jaar	17,8
67 jaar of ouder	8,9
Onbekend	7,5

Type cursus	Cursusdeelnemers
Taal	92
Rekenen	1
Digitale vaardigheden	2
Taal/Digitale vaardigheden	2
Onbekend	2

Gemeente	Cursusdeelnemers
Gemeente 5	3519
Gemeente 2	1092
Gemeente 4	990
Gemeente 7	798
Gemeente 6	548
Gemeente 1	269
Gemeente 3	241

Gemeente	Cursusdeelnemers
Gemeente 8	4117
Gemeente 10	1867
Gemeente 3	1130
Gemeente 11	816
Gemeente 9	715