Auteur: Dr. B. Klijs
Monitor online platformen 2021

8. Samenstelling onderzoekspopulatie

Een groot deel van de gegevens in deze rapportage zijn afkomstig uit een door het CBS gehouden enquête onder online platformen. In deze paragraaf wordt beschreven hoe de onderzoekspopulatie is samengesteld.

Er bestaat geen compleet register van alle online platformen in Nederland. Iedereen kan een website starten, zonder zich ergens officieel te registreren als platform. Om te bepalen welke online platformen er zijn in Nederland, heeft het CBS daarom gebruikgemaakt van webscraping, modellering en machine learning.

Er is gestart met een lijst van reeds bij het CBS bekende online platformen. Deze platformen waren bijvoorbeeld bekend uit de vorige enquête platformsamenleving. Uit deze vorige enquête was ook bekend welke deelnemers uiteindelijk geen platform bleken te zijn. Deze lijst is gebruikt als ‘trainings-dataset’ voor een model. Met behulp van machine learning leerde dit model onderscheid te maken tussen websites die een online platform zijn en websites die dat niet zijn, voornamelijk door te kijken naar woorden en tekstgedeeltes op de website.

Vervolgens zijn de websites op een zeer omvangrijke lijst met websites in Nederland, samengesteld door het bedrijf Dataprovider, door een webscraper bezocht (Webscraping is het automatisch door een computerscript laten bekijken van grote hoeveelheden publiek toegankelijke websites, en het registreren van enkele kenmerken van deze websites). De teksten op de website zijn vervolgens in het model ingevoerd. Output van het model was een score die de kans weergeeft dat een bepaalde website een online platform is.

Websites die, volgens het model, een kans van minstens 70 procent hadden om online platform te zijn, zijn geselecteerd als ‘potentieel platform’. Hieraan is nog een aantal websites toegevoegd, die bekend waren uit de vorige enquête platformsamenleving. Ook zijn websites waarvan reeds bekend was (bijvoorbeeld uit een eerdere enquête) dat het geen online platform betreft uit de lijst verwijderd.

Deze lijst is gekoppeld aan het bedrijvenregister van het CBS op basis van adresinformatie en informatie over Kamer van Koophandel-inschrijving uit de dataset van Dataprovider. Daardoor zijn van de websites ook de contactgegevens en kenmerken van het achterliggende bedrijf bekend. Een deel van de websites kon niet eenduidig aan een bedrijf gekoppeld worden. Naar de wel gekoppelde bedrijven heeft het CBS de enquête uitgestuurd.

Om de lastendruk voor bedrijven laag te houden, hebben bedrijven die meerdere platformen bezitten maar voor één van hun platformen een enquête gekregen. Voor meer informatie over de methodologische effecten hiervan, zie hoofdstuk 9.1 in de vorige monitor online platformen.

Bedrijven die een ‘adult website’ runnen zijn buiten de populatie gehouden. Aan hen is geen enquête gestuurd.

Uiteindelijk zijn er ongeveer 4 600 bedrijven benaderd om de enquête in te vullen. Zo’n 3 100 bedrijven vulden de enquête in.

Op de enquête wordt in eerste instantie geverifieerd of het bedrijf daadwerkelijk de eigenaar van de website is. Vervolgens wordt de vraag gesteld:
 “Bemiddelt of ondersteunt uw website of app de uitwisseling van goederen, diensten of informatie tussen personen, bedrijven of organisaties? (Het kan hier gaan om bemiddeling of ondersteuning bij verkoop van goederen, het bij elkaar brengen van bewoners, patiënten en familie, crowdfunding, dating, nieuwe vriendschappen, het verhuren van accommodaties, het lenen van spullen etc.)”

Als deze vraag met “ja” wordt beantwoord, wordt gevraagd of het bedrijf de enige aanbieder van goederen, diensten of informatie op de website of app is. Als het antwoord op deze tweede vraag ‘Nee’ is, en er dus meerdere aanbieders op de website zijn, beschouwt het CBS het als online platform in het kader van dit onderzoek. Op deze wijze konden via deze enquête 726 websites daadwerkelijk geclassificeerd worden als online platform.

De resultaten in de hoofdstukken 4, 5 en 6 zijn gebaseerd op deze 726 online platformen die de enquête in 2021 invulden. In de hoofdstukken over omzetontwikkeling en over coronasteunmaatregelen worden ook resultaten gepresenteerd over de volledige groep van alle bij het CBS bekende online platformen (1 200 platformen).

Trends op basis van enquêtedata

De CBS-enquête onder online platformen is een aantal opeenvolgende jaren uitgevoerd. Een directe vergelijking van cijfers in de uitkomsten van de verschillende verslagjaren is echter niet altijd mogelijk. Dit heeft een aantal redenen.

Bij het samenstellen van het sample van de populatie platformen die een enquête ontvangt is gekozen voor een hybride vorm, waarbij deels nieuwe platformen en deels reeds bekende platformen zijn geselecteerd. Het includeren van nieuwe platformen is van belang om zicht te houden op ontwikkelingen in de populatie platformen; ieder jaar worden nieuwe platformen opgericht en verdwijnen andere. Het includeren van reeds bekende platformen werd van belang geacht voor het in kaart brengen van jaar-op-jaar ontwikkelingen. Er is echter gebleken dat van de reeds bekende platformen een deel niet respondeerde, waardoor het deel platformen dat zowel dit jaar als vorig jaar respondeerde te klein was om een valide vergelijking met vorig jaar te maken.

Daarnaast is de vraagstelling op de enquête op enkele punten verbeterd, vaak naar aanleiding van feedback van respondenten. Dit leidde tot betere beantwoording van de vragen, maar had als nadeel dat de vergelijkbaarheid met eerdere jaren kleiner werd.