Socialespanningenindicator op basis van sociale media

Banner Sociale spanningen-indicator

Hoe kunnen berichten op sociale media worden gebruikt als bron voor het meten van de stemming in de samenleving? Het CBS heeft het onderzocht in het Center for Big Data Statistics, met als resultaat een eerste versie van de sociale spanningenindicator. Deze meet heel specifiek de spanningen of onrust in de samenleving, en onderscheidt zich daarmee van meer algemene metingen van positief of negatief sentiment via sociale media. Voor de indicator is met kwalitatief onderzoek een gevalideerde lijst woorden samengesteld die specifiek betrekking hebben op (on)veiligheid.
De indicator brengt in kaart welk deel van de dagelijkse berichten op Twitter over onrust of onveiligheid gaat. Dat zegt iets over spanningen, beleving van terrorismedreiging, en gevoelens van onbehagen die leven in de maatschappij. Sociale media lenen zich bij uitstek voor het meten van het sentiment in Nederland. Mensen delen er hun mening over maatschappelijke kwesties, spreken hun gevoelens uit, en bespreken hoe het in hun ogen gaat met Nederland.

Veel sociale spanningen na damschreeuwer en aanslagen

In de visualisatie is te zien dat de sociale spanningen-indicator pieken vertoont. Op of vlak na de dagen waarop gebeurtenissen plaatsvonden die gevoelens van onveiligheid en onrust teweegbrachten zijn veel berichten hierover geplaatst. De grote piek in 2010 gaat bijvoorbeeld samen met de verstoring van de dodenherdenking op 4 mei in Amsterdam (de damschreeuwer). Ook zijn reacties op aanslagen terug te zien in de sociale spanningen-indicator: de aanslagen in Parijs (13 november 2015) en Brussel (22 maart 2016) laten een piek in spanningen in Nederland zien. Ook de MH17 ramp (17 juli 2014) zorgt voor sterke gevoelens van onveiligheid en onrust. Andere soorten gebeurtenissen, zoals de verkiezing van Donald Trump in de VS op 9 november 2016, gaan ook samen met meer sociale spanningen.

Sociale spanning de laatste jaren licht gedaald

In het algemeen steeg de sociale spanning volgens de indicator tussen 2010 en 2013 licht; daarna is er sprake van een lichte daling. Deze trend kan worden vergeleken met de resultaten uit de jaarlijkse Veiligheidsmonitor. Daarin wordt een representatieve groep burgers door middel van een vragenlijst gevraagd naar onder meer gevoelens van onveiligheid. Vanaf 2010 daalt het aandeel burgers dat zich wel eens onveilig voelt. De sociale spanningenindicator brengt een ander fenomeen in kaart dan de onveiligheidsgevoelens uit de Veiligheidsmonitor. De sociale impact van gebeurtenissen zoals aanslagen is namelijk niet direct uit de resultaten van de Veiligheidsmonitor af te leiden al hebben aanslagen wel invloed op de onveiligheidsgevoelens.

Methode

Alle openbare tweets en retweets van Twitter door Nederlandse gebruikers zijn meegenomen in de analyse. De berichten die onrust en onveiligheidsgevoelens weerspiegelen zijn afgezet tegen het totaal aantal berichten per dag. De indicator is daarom relatief. Op basis van diepte-interviews is vastgesteld welke woorden mensen gebruiken als zij onveiligheid beschrijven; de vraagstellingen uit de Veiligheidsmonitor van het CBS zijn gebruikt om een interviewinstructie voor een set open vragen op te stellen. Deze lijst is met synoniemen aangevuld tot ongeveer 350 woorden die veiligheid of onveiligheid beschrijven. De lijst is gecheckt door een groep experts van het CBS. De meest frequent gebruikte woorden op sociale media met betrekking tot onveiligheid zijn vervolgens gebruikt voor het samenstellen van de definitieve woordenlijst. Berichten over sportevenementen en politiek zijn daarnaast uit de selectie berichten gefilterd omdat deze, door de vaak grote hoeveelheden negatieve berichten, een verstorend effect hadden. Tot slot zijn de pieken in de indicator gevalideerd; er is gecheckt welke gebeurtenissen op of vlak voor de betreffende datum plaatsvonden en daarna is handmatig de lijst van meest gebruikte woorden in de berichten bekeken om te zien of de geselecteerde berichten daadwerkelijk over deze gebeurtenis(sen) gingen. De pieken zijn dus direct te linken aan de getoonde gebeurtenissen. Daarnaast is gecheckt welk soort gebeurtenissen niet terug te zien is in de indicator; het gaat hierbij vooral om lokale gebeurtenissen of gebeurtenissen waarbij de collectieve veiligheid niet in het geding was.

Privacy

Voor deze indicator zijn openbare Twitterberichten gebruikt. Deze berichten zijn niet gekoppeld aan gebruikers. Het CBS weet dus niet wie deze berichten heeft verstuurd; alleen het totaal aantal berichten wordt gepresenteerd. Er is geen selectie van gebruikers gemaakt, zowel particulieren als bedrijven zijn meegenomen. Ook zijn er geen berichten terug te lezen in de indicator, noch is op te maken wat er exact is getweet.

Toepassingen

Deze indicator is gebaseerd op dag-gegevens. In de toekomst kan dit doorontwikkeld worden naar een (bijna) real-time indicator om per minuut te zien hoe sterk de sociale spanning in Nederland is. Hierdoor kunnen beleidsmakers met hun reacties op en maatregelen in het kader van recente gebeurtenissen rekening houden met de stemming in de samenleving. Via berichten op sociale media kan tevens inzicht verworven worden in welke belangrijke thema’s spelen bij de Nederlandse bevolking en of dit verschilt per regio. Daarnaast kan deze indicator vergeleken worden met andere relevante ontwikkelingen, zoals het algemene veiligheidsgevoel of vertrouwen in de medemens. Toekomstig onderzoek zal zich hierop richten door middel van coïntegratie analyses van tijdreeksen. Onderzoek zal ook moeten uitwijzen of de indicator voorspellende waarde heeft voor ontwikkelingen in bijvoorbeeld consumentenbestedingen of het producentenvertrouwen.

Feedback gevraagd

Geef hieronder uw mening over de nieuwe sociale spanningen-indicator. Kunnen er zaken verbeterd worden? En welke andere toepassingen zijn interessant om te onderzoeken met gegevens van sociale media?

We zouden graag uw mening willen over dit nieuwe product. Dat kan een algemene indruk zijn, maar ook meer specifieke punten die u goed of niet goed vindt. Is het bijvoorbeeld duidelijk wat er getoond wordt? Zo nee, hoe kunnen we dit verbeteren? En ontbreekt er relevante informatie?