Tekstanalyse om motivaties te detecteren voor het (niet) doneren van smartphone-sensordata

Dit artikel richt zich op de analyse en classificatie van de door respondenten opgegeven redenen voor het (waarschijnlijke) niet willen delen van smartphone-sensordata, op basis van twee nauw verwante vragenlijsten die kort na elkaar zijn afgenomen: een onderzoek in het LISS-panel en een consent survey uitgevoerd door het Centraal Bureau voor de Statistiek (CBS).

Open antwoorden in enquêtes geven een goed beeld van de motivaties, maar zijn kostbaar om met de hand te coderen. We bestuderen de door respondenten opgegeven redenen voor het (waarschijnlijk) niet willen delen van smartphonegegevens, aan de hand van twee nauw verwante enquêtes die in 2017-2018 zijn gehouden: een LISS-panelonderzoek (CentERdata) en een consent survey (CBS). Beide vragenlijsten hebben een aantal sensormetingen gemeenschappelijk (GPS-locatie, selfie, foto van de buitenkant van het huis, korte video), waarbij LISS aanvullend vraagt naar het aansluiten van een wearable en de consent survey een foto van een kassabon vraagt. We brengen een motivatietaxonomie met 11 klassen over van het LISS-panel naar de consent survey via een transparante NLP-pijplijn: lichte normalisatie, rule-based trefwoordextractie en elastische logistische regressie met een enkele drempelwaarde voor multi-labeltoewijzing. De aanpak schaalt de codering van korte enquêteteksten terwijl deze interpreteerbaar blijven, en levert concrete ontwerprichtlijnen op (uitleg over privacy, minder belasting voor camerataken, strengere instructies).

Smeets, M, J. Bakker, V. Meertens (2025). To share or not to share? Text analysis of survey responses to detect motivations for (not) donating smartphone sensor data to Statistics Netherlands. Discussion paper, Statistics Netherlands, The Hague/Heerlen.