Aandachtspunten waarneming verwerking internetgegevens

Webwinkels vormen een interessante bron van gegevens over artikelen en hun prijzen. De data zijn in principe vrij beschikbaar en met internetrobots kan regelmatig, bijvoorbeeld dagelijks, prijs- en artikelinformatie worden verzameld.
Dit materiaal is interessant om de consumentenprijsindex mee te berekenen. Niet alleen betekent deze wijze van dataverzameling dat de berichtgevers minder worden belast dan bij de traditionele waarneming, waarbij prijswaarnemers maandelijks winkels bezoeken en prijzen waarnemen van zekere artikelen. Ook komen veel grotere hoeveelheden data beschikbaar. Bovendien is dit proces minder foutgevoelig, in de zin dat geen artikelen hoeven te worden geselecteerd door personen en er hoeven geen prijzen te worden ingetypt. De waarneming met behulp van internetgegevens past in de big data revolutie die zich momenteel voltrekt en op vele terreinen tot ingrijpende veranderingen leidt. In het geval van dit discussion paper is dat op het gebied van de consumentenprijsindex (CPI). Maar het is natuurlijk niet zo dat er alleen maar voordelen te melden zijn bij deze vorm van dataverzameling. Er kleven ook gevaren aan en er spelen bepaalde problemen die om een oplossing vragen. In het onderhavige stuk wordt op een aantal van die problemen nader ingegaan. Daarbij is de aandacht niet alleen beperkt tot het verzamelen van deze gegevens, maar ook tot hun verwerking. Het is onmogelijk om beide onderdelen scherp te scheiden. Om die reden worden aspecten van beide gebieden besproken.