Onderzoek naar gebruik van sociale media

© CBS / Alrik Swagerman

Wat is het?

Het CBS heeft in samenwerking met de politie onderzocht of sociale onrust gemeten kan worden op basis van sociale mediaberichten. Aan de hand van een indicator gebaseerd op berichten op publiekelijk toegankelijke sociale media kanalen en nieuwsplatforms is onderzocht of deze berichten de mate van sociale onrust en van de uiting van emoties in de samenleving konden weergeven.

In feite is deze studie een doorontwikkeling van het sociale spanningen dashboard dat van eind 2019 tot februari 2021 als bèta product bij het CBS zichtbaar was.

Uit de uitvoerige analyse (zie het validatierapport bij de links) blijkt dat deze Sociale Onrust Indicator (SOI) een aantal maatschappelijke fenomenen meet en niet één enkel concept. Echter, het belangrijkste concept dat door de SOI wordt gedetecteerd is sociale onrust (op sociale media). In een deel van die gevallen zou dat aanleiding kunnen geven tot incidenten in de werkelijke (niet-online) wereld. Vanwege de selectiviteit van sociale media kunnen we momenteel geen uitspraken doen over de representativiteit en betrouwbaarheid van deze meting voor de gehele bevolking. De indicatie van een zekere sociale onrust op sociale media is dus nog een te beperkte maatstaf om betrouwbaar eventuele maatschappelijke onrust in de werkelijke wereld te kunnen weergeven. Dit betekent dat we sociale media voor deze beoogde statistiek van het CBS voorlopig niet als bron gebruiken. Mogelijk blijven we hier in de toekomst wel mee experimenteren om nader onderzoek te verrichten op dit terrein.

Achtergrond

Binnen het beleidsdomein van veiligheid bestaat al langere tijd belangstelling voor de beleving van burgers van (on)veiligheid: hoe zijn incidenten en fenomenen in de samenleving van invloed op de beleving van burgers? In de CBS Veiligheidsmonitor (zie link) wordt aandacht besteed aan het onveiligheidsgevoel van burgers en de cijfers hieruit worden met regelmaat gebruikt. Echter dit onderzoek vindt enkel tweejaarlijks plaats. Er is behoefte aan een actuelere monitoring van gevoelens van onveiligheid. Sociale media en openbare nieuwsberichten lenen zich voor het snel en frequent meten van sentimenten onder burgers. Het CBS heeft eerder onderzoek gedaan naar het gebruik van berichten op sociale media als bron voor het meten van spanningen in de samenleving en het gevoel van onveiligheid, zie Sociale spanningen-indicator: Peilstok samenleving. Nader onderzoek heeft geresulteerd in een experimentele sociale spanningsindicator. Dit interactieve dashboard met een dagelijkse actualisatie van indicatoren voor sociale spanning en emoties heeft als bèta-product, conform de planning van dit experiment, een jaar lang op de innovatiesite van het CBS gedraaid. Vanuit het beleidsveld van veiligheid was behoefte aan een doorstart van dit product. De politie heeft het CBS gevraagd te onderzoeken wat de indicator precies meet, deze waar nodig te verbeteren en hoe de indicator het best beschikbaar kan worden gesteld.

Resultaten

Het vervolgonderzoek heeft zich onder andere gericht op de verdere ontwikkeling en validatie van de indicator. De indicator geeft een beeld van de sentimenten omtrent geselecteerde berichten op openbare sociale media en openbare nieuwsplatforms. Figuur 1 hieronder toont de indicator over een periode van drie maanden. Voor het bepalen van deze indicator wordt gebruik gemaakt van een lijst met trefwoorden die betrekking hebben op gevoelens van spanningen en onrust onder mensen op internet. Via een dataleverancier, die berichten op publiekelijk toegankelijke sociale media en nieuwsplatforms beschikbaar stelt en indeelt naar sentiment (positief, negatief of neutraal), wordt vastgesteld hoeveel berichten op een bepaalde dag woorden uit deze woordenlijsten bevatten. Aan de hand van het sentiment van deze berichten wordt vervolgens de indicator voor die dag bepaald: dat is de ratio tussen het aantal negatieve en het aantal positieve berichten van de geselecteerde berichten voor die dag. Een waarde 2 betekent dat er die dag twee keer zo veel negatieve berichten met woorden uit de woordenlijst voorkwamen dan positieve berichten. Neutrale berichten zijn niet meegenomen in de indicator.

Sociale onrust indicator over periode van drie maanden

sociale-onrust

Bron: CBS

Om te bepalen welke gebeurtenissen een piek veroorzaken worden woordenwolken gebruikt. Een voorbeeld hiervan is de piek op 2 oktober 2022 waarvan de woordenwolk in figuur 2 te zien is. Deze woordenwolk toont welke woorden en zinsdelen relatief vaak werden gebruikt in de geselecteerde berichten van die dag. Dit geeft een beeld van veel voorkomende thema’s in deze berichten op die dag. Hoe groter het woord, hoe vaker dat woord voorkwam.

Woordenwolk bij 2 oktober 2022

woordenwolk

Bron: CBS

Rond eind september, begin oktober 2022 was de opvang van asielzoekers op een cruiseschip in het nieuws, relatief veel berichten lijken hieraan te refereren.

Validatie

Wat meet deze indicator precies? is vervolgens bestudeerd. De gebruikte woorden om berichten te selecteren liggen met namen op het terrein van gevoelens van onrust en onveiligheid, zoals bijvoorbeeld ‘geweld’, ‘lastiggevallen’ en ‘angst’. Uit de gehanteerde selectiewoorden en verkregen resultaten volgt dat vooral wordt gezocht naar berichten over onderwerpen die zich op het terrein van veiligheid, schade en economie bevinden. Nadere analyse van de resultaten laat zien dat de indicator uit een trend- en pieken-component bestaat. Vergelijking van de trend met andere CBS-gegevens laat zien dat deze samenhangt met economische factoren zoals het prijsniveau en de (ervaren) koopkracht. De trend lijkt niet heel sterk door veranderingen in de activiteiten en samenstelling van de sociale media populatie beïnvloed te worden.

De positieve pieken in de indicator zijn het resultaat van een scala aan onderwerpen die vooral negatief van aard zijn. De berichten op die dagen zijn vooral een gevolg van reacties op gebeurtenissen die in het nieuws zijn of recentelijk zijn geweest. In ongeveer twee derde van de gevallen zijn het berichten waarin groepen mensen van mening verschillen (dus tegenover elkaar staan), kortom sociale onrust. Dit is de belangrijkste reden om de indicator de Sociale Onrust Indicator te noemen. Hierbij is de volgende definitie van sociale onrust gebruikt: “Heftige emotionele reacties volgend op een incident of ontwikkeling dat aanleiding kan geven tot escalatie, of alleen onrust in de samenleving of op sociale media weergeven. De emotionele reacties kunnen breed gedeeld worden of met name gevoeld worden binnen één groepering. Ook kunnen het reacties zijn vanuit meerdere groeperingen binnen de samenleving die tegenover elkaar staan.” Van de sociale onrustberichten is in ongeveer een derde van de gevallen sprake van onderwerpen die tot incidenten zouden kunnen leiden in de maatschappij.

Uit uitvoerige analyse (zie het validatierapport van de Sociale Spanningen Indicator) blijkt dat de SOI een aantal maatschappelijke fenomenen meet en dus niet één enkel concept. Echter, het allerbelangrijkste concept dat door de positieve SOI-pieken wordt gedetecteerd is sociale onrust (op sociale media). In een deel van die gevallen zou dat aanleiding kunnen geven tot incidenten in de werkelijke (niet-online) wereld.

Bovenstaande conclusie heeft betrekking op de sociale onrust in het deel van de Nederlandse bevolking dat actief is op sociale media en openbare nieuwsplatforms. Een directe vertaalslag naar de gehele Nederlandse bevolking valt onvoldoende te maken. Ook is er bij online onrust niet altijd direct sprake van onrust in de werkelijke (niet-online) wereld. Vanwege de selectiviteit van sociale media kunnen we momenteel geen uitspraken doen over de representativiteit en betrouwbaarheid van deze meting voor de gehele bevolking. Bovendien bevatten sommige woordenwolken identificeerbare personen, instanties en bedrijven, iets wat het CBS niet mag publiceren in officiële publicaties. Hier zit voor het CBS dan ook een beperking voor wat betreft de SOI en het dashboard: we kunnen dergelijke woorden wegfilteren, maar dit maakt het niet altijd mogelijk te bepalen welke gebeurtenissen de pieken veroorzaken (hiervoor is de ongecensureerde woordenwolk nodig). Dit alles betekent dat we de reguliere productie van de SOI niet zullen opstarten. Mogelijk blijven we hier in de toekomst mee experimenteren, en nader onderzoek verrichten op dit terrein.

De resultaten van het onderzoek zijn beschikbaar. Het validatierapport via de link op deze pagina. De scripts zijn opvraagbaar via innovatie@cbs.nl.

Privacy

Voor het ontwikkelen van de indicatoren zijn berichten gebruikt van openbaar beschikbare (sociale) media platforms, met name Twitter, en openbare nieuwsberichten. Voor dit onderzoek zijn de berichten niet gekoppeld aan individuele gebruikers. Het CBS weet dus niet wie deze berichten heeft verstuurd; alleen het totaal aantal berichten per sentiment wordt geteld. In de indicator zijn geen individuele berichten terug te vinden, noch is op te maken wat er exact door een persoon is geschreven.

Feedback

Het CBS wil graag uw mening over dit onderzoek weten. Laat het ons s.v.p. weten via het onderstaande formulier.

Je browser wordt niet ondersteund. Upgrade je browser. Je hebt een inconsistente user-agent geleverd bij het oplossen van de uitdaging. Mogelijk heb je browserextensies of -instellingen ingeschakeld om de user-agent te vervalsen en moet je deze uitschakelen om door te gaan. Een deel van Turnstile is per ongeluk in de cache opgeslagen. Wis gelieve je cache. De tijd op de klok klopt niet. Zet je klok op de juiste tijd. Een ongespecificeerde fout heeft zich voorgedaan.