Big data bronnen voor officiële statistieken

Een dynamisch factor model voor het gebruik van Big data in state-space modellen voor officiële statistieken.
In dit paper wordt een tijdreeksmodel ontwikkeld om maandelijkse werkloosheidscijfers te ramen door gebruik te maken van hulpreeksen gebaseerd op gerelateerde zoektermen op internet, verkregen via Google trends op week basis en maandcijfers over het aantal uitkeringsgerechtigden. In een eerste stap worden uit een groot aantal hulpreeksen een beperkt aantal gemeenschappelijke factoren geschat (met PCA). Vervolgens worden maandcijfers over werkloze beroepsbevolking waargenomen met de Enquête Beroepsbevolking (EBB) gecombineerd met de Google trends en de tijdreeks van het aantal uitkeringsgerechtigden in een dynamisch factor model. Het model wordt gefit met het Kalman filter. Onderzocht wordt in welke mate deze hulpreeksen de nauwkeurigheid van de schattingen voor de totale werkloze beroepsbevolking op basis van de EBB verbeterd. Daarnaast wordt onderzocht in hoeverre nauwkeurige eerste ramingen kunnen worden gemaakt op het moment dat voor een lopende maand Google trends beschikbaar komen, maar schattingen op basis van de EBB nog ontbreken.

Downloads