Auteur: Dr. B. Klijs (gehele publicatie), Prof. Dr. W. Smits (hoofdstuk 4.3)
Monitor online platformen 2022

8. Samenstelling onderzoekspopulatie

Een groot deel van de gegevens in deze rapportage komen uit een door het CBS gehouden enquête onder online platformen. Dit hoofdstuk beschrijft de samenstelling van de onderzoekspopulatie.

Er bestaat geen compleet register van alle online platformen in Nederland. Iedereen kan een website starten, zonder zich ergens officieel te registreren als platform. Om te bepalen welke online platformen er zijn in Nederland, heeft het CBS daarom gebruikgemaakt van webscraping, modellering en machine learning.

Er is gestart met een lijst van reeds bij het CBS bekende online platformen. Deze platformen waren bijvoorbeeld bekend uit de vorige enquête platformsamenleving. Uit deze vorige enquête was ook bekend welke deelnemers uiteindelijk geen platform bleken te zijn. Deze lijst is gebruikt als ‘trainings-dataset’ voor een model. Met behulp van machine learning leerde dit model onderscheid te maken tussen websites die een online platform zijn en websites die dat niet zijn, voornamelijk door te kijken naar woorden en tekstgedeeltes op de website.

Vervolgens zijn de websites op een zeer omvangrijke lijst met websites in Nederland, samengesteld door het bedrijf Dataprovider, door een webscraper bezocht. Webscraping is het automatisch door een computerscript laten bekijken van grote hoeveelheden publiek toegankelijke websites, en het registreren van enkele kenmerken van deze websites. De teksten op de website zijn vervolgens in het model ingevoerd. Output van het model was een score die de kans weergeeft dat een bepaalde website een online platform is.

Websites die, volgens het model, een kans van minstens 80 procent hadden om online platform te zijn, zijn geselecteerd als ‘potentieel platform’. Hieraan is nog een aantal websites toegevoegd, die bekend waren uit de vorige enquête platformsamenleving. Ook zijn websites waarvan reeds bekend was (bijvoorbeeld uit een eerdere enquête) dat het geen online platform betreft, uit de lijst verwijderd.

Deze lijst is gekoppeld aan het bedrijvenregister van het CBS op basis van adresinformatie en informatie over Kamer van Koophandel-inschrijving uit de dataset van Dataprovider. Daardoor zijn van de websites ook de contactgegevens en kenmerken van het achterliggende bedrijf bekend. Een deel van de websites kon niet eenduidig aan een bedrijf gekoppeld worden. Naar de wel gekoppelde bedrijven heeft het CBS de enquête uitgestuurd.

Om de lastendruk voor bedrijven laag te houden, hebben bedrijven die meerdere platformen bezitten maar voor één van hun platformen een enquête gekregen. Voor meer informatie over de methodologische effecten hiervan, zie hoofdstuk 9.1 in de monitor online platformen 2020.

Bedrijven die een ‘adult website’ runnen zijn buiten de populatie gehouden. Aan hen is geen enquête gestuurd.

Uiteindelijk zijn er ongeveer 4 650 bedrijven benaderd om de enquête in te vullen. Zo’n 2 900 bedrijven vulden de enquête in.

Op de enquête wordt in eerste instantie geverifieerd of het bedrijf daadwerkelijk de eigenaar van de website is. Vervolgens wordt de vraag gesteld:

 “Bemiddelt of ondersteunt uw website of app de uitwisseling van goederen, diensten of informatie tussen personen, bedrijven of organisaties? (Het kan hier gaan om bemiddeling of ondersteuning bij verkoop van goederen, het bij elkaar brengen van bewoners, patiënten en familie, crowdfunding, dating, nieuwe vriendschappen, het verhuren van accommodaties, het lenen van spullen etc.)”

Als deze vraag met “ja” wordt beantwoord, wordt gevraagd of het bedrijf de enige aanbieder van goederen, diensten of informatie op de website of app is. Als het antwoord op deze tweede vraag ‘Nee’ is, en er dus meerdere aanbieders op de website zijn, beschouwt het CBS het als online platform in het kader van dit onderzoek. Op deze wijze konden via deze enquête 1 114 websites daadwerkelijk geclassificeerd worden als online platform.

De resultaten in hoofdstuk 7 zijn gebaseerd op deze 1 114 online platformen die de enquête in 2022 invulden. In de hoofdstukken over demografie, de ontwikkeling van omzet en werkzame personen, coronasteunmaatregelen worden ook resultaten gepresenteerd over de volledige groep van alle bij het CBS bekende online platformen (meer dan 1 600).

Trends op basis van enquêtedata

De CBS-enquête onder online platformen is een aantal opeenvolgende jaren uitgevoerd. Een directe vergelijking van cijfers in de uitkomsten van de verschillende verslagjaren is echter niet altijd mogelijk. Dit heeft een aantal redenen.

Bij het samenstellen van de groep platformen die een enquête ontvangen is gekozen voor een hybride vorm, waarbij deels nieuwe platformen en deels reeds bekende platformen zijn geselecteerd. Het includeren van nieuwe platformen is van belang om zicht te houden op ontwikkelingen in de populatie platformen; ieder jaar worden nieuwe platformen opgericht en verdwijnen andere. Het includeren van reeds bekende platformen werd van belang geacht voor het in kaart brengen van jaar-op-jaar ontwikkelingen. Er is echter gebleken dat van de reeds bekende platformen een deel niet respondeerde, waardoor het deel platformen dat zowel dit jaar als vorig jaar respondeerde te klein was om een valide vergelijking met vorig jaar te maken.