Corona sentimentsindicator

© Hollandse Hoogte / Harold Versteeg

De coronacrisis en de maatregelen die zijn genomen om de verspreiding van het virus te verminderen, beïnvloeden de Nederlandse samenleving enorm. Daarom kan het van belang zijn een indicatie beschikbaar te hebben van de stemming (het sentiment) van de Nederlandse bevolking ten aanzien van corona. Hoe reageren mensen op bepaalde maatregelen? Steunen zij bijvoorbeeld de opgelegde beperkingen? Omdat het sentiment snel kan veranderen zou dit, bij voorkeur, elke dag gemeten moeten worden. Het CBS heeft een experimentele indicator ontwikkeld die dit mogelijk maakt.

Gebruikte gegevens

Potentieel geschikte bronnen om de stemming over corona dagelijks te meten in Nederland zijn de sociale media. Deze bronnen zijn immers snel beschikbaar (real-time) en de woorden in de berichten kunnen worden gebruikt om het onderwerp en de stemming (het sentiment) te bepalen. Er zitten echter ook nadelen aan. Zo is bijvoorbeeld niet elke Nederlander actief op sociale media en niet elk bericht dat de woorden corona of COVID-19 bevat zal over de stemming ten opzichte van het coronavirus gaan. In dit artikel beschrijven we de ontwikkeling van een op sociale mediaberichten gebaseerde experimentele corona-sentimentsindicator en de gevonden resultaten. Meer details over de ontwikkeling van de indicator zijn te vinden in Daas (2020).
Bij dit onderzoek is gebruik gemaakt van sociale mediaberichten die door het Nederlandse bedrijf Coosto zijn verzameld (Coosto 2020). We richten ons specifiek op alle openbare berichten op X (v\h Twitter) en Facebook, omdat bleek dat op deze platforms het merendeel van de corona-gerelateerde berichten worden geplaatst. Op de andere sociale mediaplatformen, zoals Pinterest en Instagram, verschenen veel minder van dergelijke berichten.

Selectie van berichten

Voor deze indicator zijn uitsluitend berichten die de woorden ‘corona’, ‘Coronavirus’, ‘COVID-19’, ‘COVID19’, ‘’COROVID19’, SARS-COV-2’ of ‘pandemie’ bevatten, meegenomen. De berichten over Coronabier en berichten die door niet in Nederland woonachtige mensen zijn geschreven, zijn vervolgens uitgesloten. De indicator moet immers over het sentiment van Nederlanders over het coronavirus en de bijbehorende maatregelen gaan en niet over een ander onderwerp. Dit leidde uiteindelijk tot een grote set berichten; in de periode 1 januari 2020 tot en met 18 mei 2020 zijn dat er in totaal ruim 9,1 miljoen. Nadere bestudering van de berichten liet zien dat het merendeel (zo’n 85 procent) inderdaad over het coronavirus en daarmee samenhangende verschijnselen ging. De rest van de berichten bestond uit grapjes over corona, duidelijk niet corona-gerelateerde berichten -die wel de hashtag corona bevatten- en allerlei nieuws over corona dat niets met het virus en de bijbehorende maatregelen te maken hadden. Het aanpassen van de selectiewoorden zorgde er niet voor dat de 15 procent overige berichten verminderde.

De experimentele sentimentsindicator

Vervolgens is naar het sentiment gekeken van de 9,1 miljoen geselecteerde sociale mediaberichten. Hierbij is gebruik gemaakt van de sentimentsclassificatie die door Coosto standaard aan elk bericht wordt toegekend. Deze is gebaseerd op het sentiment van individuele woorden, afkomstig uit gestandaardiseerde woordenlijsten, en combinaties van woorden in de berichten. Van de sociale mediaberichten had zo’n 14 procent een positief sentiment en 15 procent een negatief sentiment. De rest van de berichten was neutraal. De aantallen berichten per dag bleken enorm te variëren, van 267 tot wel 220.943 berichten per dag. Daar is bij de berekening van het sentiment rekening mee gehouden. Het coronasentiment is dan ook voor elke dag berekend door het aantal berichten met negatief sentiment af te trekken van het aantal berichten met positief sentiment en dit vervolgens te delen door het totaal aantal berichten van die dag. Dit geeft de verhouding van positieve ten opzichte van negatieve berichten weer op een dag. Hier is vervolgens een voortschrijdend gemiddelde filter op toegepast om de geleidelijke ontwikkeling in de dagelijkse metingen duidelijker te laten zien. Door dit filter hebben incidentele uitschieters minder invloed op de algehele trend. Het coronasentiment, de indicator, is in figuur 1 te zien.

Figuur 1. Coronasentiment op Nederlandse social media, 2020
datumsentiment
1-10,6025
2-10,6373
3-10,5956
4-10,6931
5-10,6571
6-10,6010
7-10,5584
8-10,4786
9-10,4575
10-10,4660
11-10,4903
12-10,3806
13-10,3420
14-10,2686
15-10,1279
16-10,0288
17-10,0132
18-10,0220
19-1-0,0755
20-1-0,1364
21-1-0,2231
22-1-0,2144
23-1-0,2184
24-1-0,2537
25-1-0,1517
26-1-0,1572
27-1-0,1698
28-1-0,1598
29-1-0,1328
30-1-0,0916
31-1-0,0672
1-2-0,0659
2-2-0,0661
3-2-0,0697
4-2-0,0896
5-2-0,1380
6-2-0,1661
7-2-0,2050
8-2-0,2196
9-2-0,2612
10-2-0,2901
11-2-0,2880
12-2-0,2822
13-2-0,3051
14-2-0,3095
15-2-0,2567
16-2-0,2366
17-2-0,2185
18-2-0,2115
19-2-0,2040
20-2-0,2123
21-2-0,2243
22-2-0,2493
23-2-0,2213
24-2-0,2146
25-2-0,2542
26-2-0,3045
27-2-0,3210
28-2-0,3261
29-2-0,3049
1-3-0,2862
2-3-0,2975
3-3-0,2821
4-3-0,3203
5-3-0,3170
6-3-0,3072
7-3-0,2679
8-3-0,2714
9-3-0,2672
10-3-0,2764
11-3-0,2671
12-3-0,2121
13-3-0,1743
14-3-0,1222
15-3-0,1038
16-3-0,0756
17-3-0,0806
18-3-0,0994
19-3-0,1002
20-3-0,0914
21-3-0,0870
22-3-0,1105
23-3-0,1280
24-3-0,1255
25-3-0,1507
26-3-0,1918
27-3-0,1789
28-3-0,1302
29-3-0,1316
30-3-0,1233
31-3-0,1087
1-4-0,1008
2-4-0,0977
3-4-0,0960
4-4-0,0725
5-4-0,0315
6-4-0,0176
7-4-0,0346
8-4-0,0280
9-4-0,0400
10-4-0,0596
11-4-0,0752
12-4-0,0965
13-4-0,1187
14-4-0,1351
15-4-0,1793
16-4-0,2096
17-4-0,2109
18-4-0,2255
19-4-0,2331
20-4-0,2332
21-4-0,2492
22-4-0,2637
23-4-0,2505
24-4-0,2579
25-4-0,2409
26-4-0,2391
27-4-0,2290
28-4-0,2208
29-4-0,2116
30-4-0,2069
1-5-0,1717
2-5-0,1259
3-5-0,1115
4-5-0,0849
5-5-0,0956
6-5-0,1037
7-5-0,1130
8-5-0,0985
9-5-0,0972
10-5-0,0959
11-5-0,1019
12-5-0,1251
13-5-0,1727
14-5-0,1957
15-5-0,1747
16-5-0,1654
17-5-0,1640
18-5-0,1893
19-5-0,1907
20-5-0,1982
21-5-0,2187
22-5-0,2143
23-5-0,1951
24-5-0,1770
25-5-0,1689
26-5-0,1648
27-5-0,1700
28-5-0,2280
29-5-0,3004
30-5-0,3228
31-5-0,3235
1-6-0,3260
2-6-0,3356
3-6-0,3804
4-6-0,4150
5-6-0,4317
6-6-0,4360
7-6-0,3581
8-6-0,3065
9-6-0,2879
10-6-0,3001
11-6-0,2976
12-6-0,2792
13-6-0,2539
14-6-0,2445
15-6-0,2332
16-6-0,2637
17-6-0,3142
18-6-0,3376
19-6-0,3548
20-6-0,3281
21-6-0,3153
22-6-0,3219
23-6-0,3233
24-6-0,3281
25-6-0,3282
26-6-0,2748
 

De resultaten in figuur 1 laten een verandering van positief naar negatief sentiment zien. Het begin van de grafiek laat een relatief hoge positieve waarde van de sentimentsindicator zien. De reden hiervoor is dat er toen relatief kleine aantallen berichten werden geschreven waarvan iets meer dan de helft betrekking had op het voorbereiden op een mogelijke coronacrisis. De omslag van positief naar negatief gebeurde op 20 januari. Er was toen ook een toename in de absolute aantallen berichten te zien. Deze toename komt overeen met het moment dat duidelijk werd dat het coronavirus zich niet meer tot China beperkte; het werd ook in Japan en Zuid-Korea waargenomen. Het is interessant te zien dat het coronasentiment in Nederland op dat moment veranderde. Nadat het coronasentiment negatief is geworden, blijft het negatief gedurende de hele bestudeerde periode. Een opvallend meetpunt in de reeks is het sentiment op 27 februari. Dat is de dag dat, in de late avond, bekend werd dat de eerste officiële corona-geïnfecteerde patiënt in Nederland was gevonden. Het sentiment op die dag en de dag erna was, ten opzichte van de dagen er omheen, erg negatief. De reden dat het sentiment ook op volgende dag laag was heeft met het tijdstip waarop het nieuws bekend werd te maken. Bij mededelingen die in de avond worden gedaan, zien we op sociale media vaak dat dit ook op het sentiment van de volgende dag effect heeft. Er was toen ook een stijging in de absolute aantallen berichten te zien.

Daarnaast vallen de fluctuaties in het negatieve deel van het sentiment op. Deze zijn het gevolg van reacties op de persconferenties van het kabinet, reacties op uitspraken van politici en corona-experts en reacties op berichten van bekende Nederlanders (inclusief de koning). In figuur 1 is duidelijk te zien dat een -in eerste instantie- positieve stijging vaak wordt gevolgd door een vrijwel even grote daling. Dit is onder meer het geval bij het begin de intelligente ‘lockdown’ op 12 maart. Deze periode begon met een lichte positieve stijging van het sentiment, maar nam later weer af; zeker toen duidelijk werd dat de lockdown werd verlengd. De dag met het allerlaagste corona sentiment, 6 juni, viel in de periode waarin een aantal demonstraties waren georganiseerd en de horeca weer werd opengesteld. In beide gevallen waren soms zoveel mensen aanwezig waren dat de 1,5 meter afstand bewaren niet kon worden gewaarborgd. Dit leidde tot veel berichten met negatief sentiment. Het allerlaagste sentiment is tot nu toe bereikt op 20 juli. Dit heeft met de aankondiging van een mogelijke uitbreiding van het verplicht dragen van een mondkapje te maken waarbij ook de mogelijke opleving van corona een rol speelt. Al deze bevindingen wijzen erop dat de ontwikkelde experimentele corona-sentimentsindicator interessante informatie zou kunnen geven over de het sentiment van de Nederlandse bevolking ten aanzien van corona.

De toekomst

De experimentele coronasentimentsindicator zal gedurende een periode van 6 maanden dagelijks worden geüpdatet, zodat gemonitord kan worden hoe het corona-sentiment zich in de nabije toekomst ontwikkelt. Aan de ene kant kan dit inzicht geven in bijvoorbeeld de reacties op de geleidelijke afbouw van de maatregelen rondom de lockdown. Aan de andere kant kan dit bijdragen aan de doorontwikkeling van de technische kant van de indicator. In de toekomst zou de indicator gebruikt kunnen worden om bij te dragen aan vragen zoals: zijn mensen negatief (vanwege angst of onzekerheid) door de kans op besmetting of door de onzekere (financiële) toekomst die de lockdown met zich meebrengt?

Privacy

Bij de ontwikkeling van de indicator is uitsluitend gebruik gemaakt van openbare berichten die op Twitter en Facebook verschenen zijn. De analyses zijn op een beveiligde omgeving uitgevoerd en er is alleen gekeken naar de aantallen berichten, hun sentiment en -indien beschikbaar- locatie-informatie van de gebruiker. Deze laatste is uitsluitend gebruikt om te bepalen of de schrijver van het bericht zich in Nederland of in het buitenland bevindt. Er zijn geen andere persoonsgegevens verwerkt. De aantallen berichten en het sentiment van Nederlandse gebruikers zijn vervolgens per dag geaggregeerd voor samenstelling van de indicator. Door deze werkwijze kunnen geen individuele personen worden geïdentificeerd.

Feedback

Het CBS wil graag uw mening over dit onderzoek en de ontwikkelde methode weten. Heeft u bijvoorbeeld ideeën over mogelijke toepassingen of suggesties om deze methode te kunnen verfijnen? Wij nodigen u van harte uit om via onderstaand formulier uw feedback te geven.

Je browser wordt niet ondersteund. Upgrade je browser. Je hebt een inconsistente user-agent geleverd bij het oplossen van de uitdaging. Mogelijk heb je browserextensies of -instellingen ingeschakeld om de user-agent te vervalsen en moet je deze uitschakelen om door te gaan. Een deel van Turnstile is per ongeluk in de cache opgeslagen. Wis gelieve je cache. De tijd op de klok klopt niet. Zet je klok op de juiste tijd. Een ongespecificeerde fout heeft zich voorgedaan.