Tekstanalyse om motivaties te detecteren voor het (niet) doneren van smartphone-sensordata
Open antwoorden in enquêtes geven een goed beeld van de motivaties, maar zijn kostbaar om met de hand te coderen. We bestuderen de door respondenten opgegeven redenen voor het (waarschijnlijk) niet willen delen van smartphonegegevens, aan de hand van twee nauw verwante enquêtes die in 2017-2018 zijn gehouden: een LISS-panelonderzoek (CentERdata) en een consent survey (CBS). Beide vragenlijsten hebben een aantal sensormetingen gemeenschappelijk (GPS-locatie, selfie, foto van de buitenkant van het huis, korte video), waarbij LISS aanvullend vraagt naar het aansluiten van een wearable en de consent survey een foto van een kassabon vraagt. We brengen een motivatietaxonomie met 11 klassen over van het LISS-panel naar de consent survey via een transparante NLP-pijplijn: lichte normalisatie, rule-based trefwoordextractie en elastische logistische regressie met een enkele drempelwaarde voor multi-labeltoewijzing. De aanpak schaalt de codering van korte enquêteteksten terwijl deze interpreteerbaar blijven, en levert concrete ontwerprichtlijnen op (uitleg over privacy, minder belasting voor camerataken, strengere instructies).
Smeets, M, J. Bakker, V. Meertens (2025). To share or not to share? Text analysis of survey responses to detect motivations for (not) donating smartphone sensor data to Statistics Netherlands. Discussion paper, Statistics Netherlands, The Hague/Heerlen.
Downloads
- PDF - DP consentsurvey