Technische toelichting
De boomclassificatietechniek is bij dit onderzoek gekozen als analysemethode. Een classificatieboom verdeelt met een algoritme een populatie in zo homogeen mogelijke groepen van zzp’ers aan de hand van een aantal verklarende variabelen. In dit geval betekent dit dat het algoritme groepen van ondernemers probeert te maken die een significant positieve dan wel negatieve beoordeling geven over de huidige financiële situatie van hun bedrijf en zorgen over de toekomst laten zien vergeleken met het gemiddelde voor zzp’ers in Nederland. Het gebruikte algoritme begint met de hele populatie en verdeelt deze vervolgens in steeds kleinere en homogenere groepen aan de hand van de verklarende variabelen. In elke stap probeert het algoritme alle variabelen uit, meet voor elke variabele hoeveel homogener de groepen door splitsing worden en kiest de variabele uit die het hoogste scoort. Met deze variabele maakt de boom nieuwe groepen. Voor elke nieuwe groep wordt deze analyse steeds herhaald. Het resultaat van dit hele proces kan uitgebeeld worden als een diagram met een boomstructuur, vandaar de naam. De boom is zo samengesteld dat hoe hoger een criterium in de boom staat, des te belangrijker bijbehorende variabele is om zzp’ers met een positief oordeel van zzp’ers met een negatief oordeel te onderscheiden. Hoe lager een kenmerk staat, hoe minder het een rol speelt bij het maken van dit onderscheid. Het classificatieboom-algoritme kan op verschillende manieren worden ingesteld. Voor dit onderzoek is de keuze gemaakt om kenmerken van ondernemers te combineren tot goed te identificeren profielen. Dit om antwoord te krijgen op de vraag welke groepen van ondernemers de financiële situatie van hun bedrijf matig of slecht ervaren en zich daarnaast zorgen maken over de toekomst en welke groepen van ondernemers juist aan het andere eind van dit spectrum zitten.
In de analyses is gebruik gemaakt van het zogeheten deviatiecontrast. Hiermee wordt steeds een groep (bijv. cluster 1) afgezet tegen alle andere groepen (in dit voorbeeld cluster 2, 3, 4 en de overige zzp’ers) en getoetst op significantie (p<0,05). Met significantie wordt bedoeld dat het gevonden verschil zeer waarschijnlijk geen toevallig verschil is. Naast significantie wordt met behulp van Cohen’s d ook gekeken naar de grootte van het verschil (zie Cohen, 1988). In figuren van paragraaf 3.2 zijn significante verschillen aangegeven met een blauwe kleur. Grote significante verschillen (d.w.z. p<0,05 én Cohen’s d ≥ 0,20) zijn daarbij aangegeven met een donkerblauwe kleur. Kleine verschillen met een lichtblauwe kleur. Ook in de tabellenbijlage is onderscheid gemaakt tussen (geen en) grote en kleine verschillen.